Создан гибридный ИИ для автономных автомобилей: DRL + LLM объясняют решения пассажирам

Одна из главных проблем автономного вождения — непонимание со стороны пассажиров, почему автомобиль принимает те или иные решения. Исследователи предложили гибридный подход, объединяющий глубокое обучение с подкреплением (DRL) для управления и большие языковые модели (LLM) для объяснения действий.

Разработчики обучили DRL-агента в симуляторе на основе архитектуры Dueling Double Deep Q-Network. Агент научился следовать трём командам: быстрая поездка, комфортная поездка и остановка. Во всех режимах он стабильно соблюдал правила дорожного движения и безопасно переключался между режимами в рамках одного маршрута.

Параллельно в систему встроили модули на базе LLM. Эти модули интерпретируют запросы пассажиров, определяют, когда нужно дать пояснение, и генерируют краткие, ориентированные на безопасность обоснования. Например, если автомобиль отклоняет просьбу ускориться из-за ограничения скорости или дорожной ситуации, LLM объясняет причину.

Результаты экспериментов показали, что фреймворк эффективно балансирует между безопасностью, адаптивностью и объяснимостью. Особенно полезным он оказался в ситуациях, когда запросы пассажиров задерживаются или отменяются по соображениям безопасности.

Хотя работа пока носит характер концептуального доказательства, она демонстрирует потенциал интеграции RL-принятия решений и LLM для повышения доверия к автономным транспортным средствам. В дальнейшем авторы планируют усложнить сценарии и протестировать систему на реальных автомобилях.

Таким образом, сочетание DRL и LLM открывает путь к более прозрачным и дружественным к пользователю системам автономного вождения. Пассажиры смогут не просто наблюдать за действиями машины, но и понимать их логику.