RecToM: новый метод для ИИ с 100% точностью в задачах теории разума
Теория разума (ToM) — способность приписывать ментальные состояния другим — остаётся сложной задачей для больших языковых моделей (LLM). Существующие методы улучшают рассуждения через фильтрацию событий или временные цепочки убеждений, но не моделируют вложенные убеждения напрямую.
Исследователи из нескольких университетов представили RecToM — фреймворк, работающий на этапе логического вывода. RecTom строит перспективы персонажей рекурсивно: каждая следующая перспектива создаётся на основе предыдущей вдоль цепочки, указанной вопросом. Это позволяет сводить вопросы о вложенных убеждениях высокого порядка к вопросам о реальном мире в финальной сконструированной перспективе.
Авторы провели анализ с использованием логики KD45, который показал, что конструкция перспектив RecToM формирует корректную модальность убеждений, выходящую за рамки простой фильтрации событий. Эксперименты на трёх бенчмарках — Hi-ToM, Big-ToM и FanToM — с несколькими архитектурами LLM продемонстрировали превосходство метода.
Наиболее впечатляющий результат получен на наборе данных Hi-ToM, требующем рассуждений о вложенных убеждениях высокого порядка: RecToM достиг 100% точности при использовании моделей GPT-5.4 и Qwen3.5. Это лучший показатель среди всех известных методов.
Разработка открывает новые возможности для создания ИИ-систем, способных лучше понимать намерения и ложные убеждения других агентов, что критически важно для диалоговых систем, робототехники и социального моделирования.
Работа опубликована в архиве препринтов arXiv и доступна для ознакомления под названием «Mind the Perspective: Let's Reason Recursively for Theory of Mind».



