ИИ-анализ 1600 свидетельств Холокоста: структура повествований оказалась сложнее, чем считалось

Ученые провели масштабное исследование устных свидетельств выживших в Холокосте, сравнив два крупнейших собрания: архив USC Shoah Foundation и видеосборник Yale Fortunoff. В центре внимания — давний тезис о том, что интервью Shoah более структурированы и ведутся по плану интервьюера, а записи Fortunoff — свободные, открытые повествования.

В ходе работы были проанализированы более 1600 записей из обеих коллекций. Исследователи применили методы сегментации дискурса, тематического моделирования и анализа на основе больших языковых моделей (LLM). Они оценивали уровень «структурированности» через когерентность тем, динамику взаимодействия интервьюера и рассказчика, а также типы задаваемых вопросов.

Результаты в целом подтвердили ранее выявленные структурные различия: интервью Shoah действительно чаще следуют заданному сценарию. Однако анализ показал и существенные пересечения между архивами — как внутри отдельных интервью, так и в общих повествовательных паттернах. Это ставит под сомнение простое противопоставление «жесткая структура против свободной формы», которое долгое время доминировало в историографии.

По словам авторов, работа не только пересматривает фундаментальное утверждение в исследованиях Холокоста, но и предлагает масштабируемую и воспроизводимую методологию для сравнительного анализа корпусов текстов. В качестве proof of concept она открывает более широкие возможности для цифровой устной истории, нарративного анализа и разработки платформ для краудсорсинговой аннотации.

Таким образом, использование методов искусственного интеллекта позволяет по-новому взглянуть на, казалось бы, устоявшиеся представления и дает инструмент для будущих исследований в гуманитарных науках.