ИИ-агент DeepMind решил 9 математических задач по $200 каждая

ИИ-агент DeepMind решил 9 математических задач по $200 каждая

Google DeepMind опубликовал препринт, в котором описал работу ИИ-агента AlphaProof Nexus. Этот агент способен автономно находить формальные доказательства для математических задач. В ходе эксперимента он справился с 9 задачами из 353 открытых, входящих в каталог венгерского математика Пола Эрдёша.

Каталог Эрдёша — это сборник задач, которые сам математик предлагал в качестве вызовов. Многие из них оставались нерешёнными десятилетиями. AlphaProof Nexus не только решил часть из них, но и сделал это с относительно низкой стоимостью: медианная стоимость одной успешной попытки составила около 200 долларов. Разброс цен варьировался от 20 до 800 долларов.

Система использует методы машинного обучения и формальной верификации. В отличие от обычных ИИ-решений, которые дают ответ без доказательства, AlphaProof Nexus генерирует полное формальное доказательство, которое можно проверить автоматически. Это открывает путь к использованию ИИ для решения сложных математических проблем.

Разработчики отмечают, что такой подход может ускорить прогресс в математике и смежных областях, где требуются строгие доказательства. Пока агент решил только небольшую часть задач, но сам факт успешного применения ИИ для формального доказательства теорем важен.

Ранее DeepMind уже демонстрировал успехи в математике: AlphaGeometry решала задачи геометрии, а AlphaZero применялась для игр. AlphaProof Nexus — следующий шаг в автоматизации математического доказательства.

Исследование доступно в виде препринта. Ожидается, что полная версия статьи будет представлена на профильной конференции.