Нейросимволический метод SD-GPS превосходит аналоги в решении геометрических задач

Исследователи представили фреймворк SD-GPS (Solver-Driven Geometry Problem Solving), который комбинирует нейросетевую интуицию с символьной строгостью для решения задач по геометрии. Разработка направлена на устранение узких мест в автоматической формализации и выводе теорем.

Современные нейросимволические системы часто сталкиваются с трудностями: перевод мультимодальных данных (текст+изображение) в формальный язык выполняется статически, без учёта совместимости с решателем, а фиксированные библиотеки правил приводят к тупикам при доказательстве. SD-GPS решает обе проблемы, используя символьный решатель как «оракул исполнения» на всех этапах.

Первый компонент — Solver-Driven Autoformalization — объединяет обучение формальному языку и подкрепление через проверку решаемости. Модуль на базе QwenVL3-2B стремится сделать каждую формализацию исполняемой. Второй — Verified Theorem Proposing — при обнаружении тупика предлагает вспомогательные леммы, проверяемые символьной верификацией.

Эксперименты на наборах Geometry3K и PGPS9K показали, что SD-GPS превосходит существующие методы, включая большие языковые модели, чистые нейросети и другие нейросимволические системы, в задачах на завершение, множественный выбор и кросс-модальное сопоставление.

Авторы подчёркивают, что замыкание цикла между мультимодальным восприятием и символьным исполнением значительно улучшает способность к геометрическим рассуждениям. Работа размещена в архиве препринтов arXiv.