Исследователи объяснили, почему нейросети согласованно представляют данные: линейная структура и дефицит данных

Редакция RusNews 29-май, 09:14 Наука 1 Искусственный интеллект

Группа исследователей представила работу, посвящённую Платонической гипотезе представлений (Platonic Representation Hypothesis). Учёные выяснили, что согласованность представлений между разными нейросетями объясняется комбинацией трёх факторов: сигнала, смещения и шума.

Основой выравнивания, по их мнению, является универсальная связь между объектами и их атрибутами, которая кодируется линейно — в соответствии с Линейной гипотезой представлений (Linear Representation Hypothesis). Эксперименты с разреженными автоэнкодерами показали, что такие линейные признаки часто демонстрируют более сильное кросс-модальное выравнивание, чем плотные представления.

В части смещения авторы отмечают, что разные архитектуры и процедуры обучения порождают неявные различия. Однако эти различия можно частично сгладить за счёт центрирования и нормализации, что улучшает согласованность между моделями.

Шум, вызванный обучением на конечных выборках, также влияет на выравнивание. Исследователи обнаружили устойчивую положительную корреляцию между частотой слов и качеством выравнивания в языковых моделях и моделях текстовых эмбеддингов — редкие слова хуже согласуются из-за дефицита данных.

Синтезировав эти три компонента, учёные предложили статистическую модель, уточняющую Линейную гипотезу представлений и объясняющую дополнительные феномены, связанные с выравниванием представлений в современных архитектурах ИИ.

Работа размещена в открытом доступе на arXiv и может повлиять на понимание принципов работы нейросетей, а также на методы улучшения их интерпретируемости и совместимости.

Исследователи объяснили, почему нейросети согласованно представляют данные: линейная структура и дефицит данных

Разделы

Навигация

Теги

Исследователи объяснили, почему нейросети согласованно представляют данные: линейная структура и дефицит данных

Читайте также

Разделы

Навигация

Теги