Формально верифицированное право стало сигналом вознаграждения для самообучающегося ИИ

Группа исследователей представила архитектуру, которая замыкает петлю обучения с подкреплением для юридического ИИ, используя формально верифицированное право как сигнал вознаграждения. Работа опубликована в архиве препринтов arXiv.

В основе подхода лежит адаптация парадигмы «LLM предлагает, верификатор проверяет», ранее применявшейся в математике, к специфике права. Система включает автоформализацию с помощью большой языковой модели в формальное исчисление Catala, ядро верификации и генерацию объяснений на основе формальных доказательств.

Для вычислимых компонентов права архитектура обеспечивает доказуемую корректность. Для анализа с открытой текстурой — структурные гарантии: все этапы правовой аргументации соблюдены, связи между шагами дедуктивно корректны.

Работоспособность продемонстрирована на трёх примерах: расчёт процессуальных сроков по немецкому праву, анализ пункта о торговле в конституционном праве США и соразмерность санкций в разных юрисдикциях.

Ключевое преимущество для обучения — детерминированный внешний верификатор поставляет проверяемые результаты для правовых задач, что закрывает разрыв петли обучения с подкреплением в юриспруденции, недоступный ранее.

Разработка может ускорить создание надёжных ИИ-ассистентов для юристов, где требуется высокая достоверность и отслеживаемость логических выводов.