Исследователи объяснили, почему нейросети согласованно представляют данные: линейная структура и дефицит данных
Группа исследователей представила работу, посвящённую Платонической гипотезе представлений (Platonic Representation Hypothesis). Учёные выяснили, что согласованность представлений между разными нейросетями объясняется комбинацией трёх факторов: сигнала, смещения и шума.
Основой выравнивания, по их мнению, является универсальная связь между объектами и их атрибутами, которая кодируется линейно — в соответствии с Линейной гипотезой представлений (Linear Representation Hypothesis). Эксперименты с разреженными автоэнкодерами показали, что такие линейные признаки часто демонстрируют более сильное кросс-модальное выравнивание, чем плотные представления.
В части смещения авторы отмечают, что разные архитектуры и процедуры обучения порождают неявные различия. Однако эти различия можно частично сгладить за счёт центрирования и нормализации, что улучшает согласованность между моделями.
Шум, вызванный обучением на конечных выборках, также влияет на выравнивание. Исследователи обнаружили устойчивую положительную корреляцию между частотой слов и качеством выравнивания в языковых моделях и моделях текстовых эмбеддингов — редкие слова хуже согласуются из-за дефицита данных.
Синтезировав эти три компонента, учёные предложили статистическую модель, уточняющую Линейную гипотезу представлений и объясняющую дополнительные феномены, связанные с выравниванием представлений в современных архитектурах ИИ.
Работа размещена в открытом доступе на arXiv и может повлиять на понимание принципов работы нейросетей, а также на методы улучшения их интерпретируемости и совместимости.



