Расхождение моделей ИИ при анализе отзывов: новый метод оценки

Большие языковые модели все чаще используются федеральными агентствами США для сортировки и категоризации общественных комментариев. Однако стандартная оценка, основанная на точности позиции по сравнению с небольшой размеченной выборкой, не способна уловить разницу в том, как разные модели классифицируют один и тот же ввод.

Исследователи из США предложили новый подход под названием Interpretive Audit Pipeline (конвейер интерпретационного аудита). Он рассматривает расхождения между несколькими моделями как диагностический инструмент, указывающий на интерпретационную сложность, и направляет человеческое внимание на действительно неоднозначные комментарии.

В эксперименте были проанализированы 1260 общественных комментариев по одному из постановлений Министерства сельского хозяйства США (USDA) с использованием четырех различных LLM. Оказалось, что тематические расхождения между разными моделями превышают вариации ответов внутри одной модели при изменении запроса.

Авторы также отметили, что применение экспертной рубрики для оценки подавляет глубокие интерпретационные разногласия, но не устраняет их полностью. В двухэтапном исследовании с участием 40 комментариев четыре LLM и человек-аннотатор сначала работали независимо, а затем могли скорректировать свои ответы, увидев результаты других.

Поведение при корректировке различалось в зависимости от участника. Человек-аннотатор часто вносил новые формулировки, отсутствовавшие в коллективном результате ансамбля моделей. Это говорит о том, что человеческая интерпретация может добавлять ценные перспективы.

Исследователи заключают, что оценка на основе расхождений является необходимым дополнением к метрикам точности для задач интерпретационного кодирования с помощью LLM. Предложенный конвейер может помочь сделать процесс анализа общественного мнения более прозрачным и надежным.