Новый фреймворк DAF-AGI: как проверить, является ли ИИ общим интеллектом

Проблема оценки искусственного общего интеллекта (AGI) долгое время остаётся камнем преткновения в AI-сообществе: одни утверждают, что AGI уже достигнут, другие — что до этого ещё десятилетия. Учёные из области дизайн-науки предложили новый подход, который позволяет объективно оценивать такие заявления.

В статье, опубликованной на arXiv, представлен фреймворк DAF-AGI (Definitional Alignment Framework for AGI), разработанный на основе методологии Design Science Research. Он состоит из двух компонентов: пяти ординальных критериев для оценки пригодности определений AGI и структурированного аудита управления, включающего авторство, интересы, сертификацию, внешнюю проверку и полномочия по пересмотру.

Авторы отмечают, что термин «AGI» не имеет единого устоявшегося значения. Разные операционализации могут приводить к противоположным выводам об одной и той же системе. Фреймворк призван сделать процесс оценки более прозрачным и воспроизводимым.

Для демонстрации DAF-AGI был применён к заявлению, что современные генеративные системы являются AGI, поскольку превосходят хорошо образованного взрослого по многим когнитивным задачам. По данным исследования, это утверждение поддаётся сертификации только при использовании операционализации, основанной на производительности. Подходы, опирающиеся на онтологию способностей, психометрию или приобретение навыков, не подтверждают его.

Экономическая группа определений остаётся неопределённой, а одна из позиций вовсе отвергает бинарную оценку. Таким образом, единого ответа на вопрос, является ли текущий ИИ общим, не существует — он зависит от принятого определения.

Разработчики подчёркивают, что их вклад — не эмпирическое подтверждение, а новая интеграция и операционализация. Для практического применения необходимы независимое тестирование и внешние примеры.

Кроме того, в работе предлагается концепция «определительного суверенитета» как составляющей алгоритмического суверенитета — институциональной способности оспаривать, сертифицировать и пересматривать импортированные технологические категории под публичную ответственность. Это может стать важным шагом к более прозрачной и контролируемой разработке AGI.