Ученые предложили стеганографию для отслеживания происхождения ИИ-контента
Научная работа, опубликованная на платформе arXiv, предлагает новый подход к решению одной из ключевых проблем искусственного интеллекта: как отследить происхождение синтетической информации. Авторы проводят параллель между биологической эволюцией и эволюцией данных, создаваемых ИИ, и утверждают, что по мере совершенствования моделей проследить их «родословную» становится всё сложнее.
В качестве решения предлагается метод, напоминающий наследственность в живой природе. При генерации нового синтетического объекта — «потомка» — система с помощью проектора извлекает определённый признак из «родительского» источника, а затем стеганографический кодер незаметно встраивает этот признак в новый объект. Этот признак сохраняется на протяжении всего жизненного цикла данных в цифровой экосистеме.
Когда необходимо установить происхождение, стеганографический декодер извлекает скрытый признак и сравнивает его с набором признаков возможных «родителей» из эталонной базы, определяя наиболее вероятного предка. Авторы провели теоретический анализ точности такого филогенетического подхода в зависимости от свойств проектора и стегосистемы, а также экспериментально подтвердили его работоспособность при различных операциях обработки и семантических модификациях.
Разработчики видят перспективу в создании киберэкосистемы, где синтетическая информация будет обладать скрытыми, но отслеживаемыми признаками происхождения. По их мнению, это поможет бороться с дезинформацией, защищать авторские права и повышать доверие к цифровому контенту, особенно в контексте развития генеративных моделей.
Отмечается, что данный подход несёт не только техническую, но и этическую нагрузку: возможность отслеживать «родословную» синтетических данных может стать важным инструментом для поддержания истины и доверия в обществе. Дальнейшие исследования будут направлены на повышение устойчивости методов к атакам и улучшение масштабируемости.


