ИИ в мобильном краудсорсинге: новый механизм повышает точность сбора отзывов
Учёные предложили новый подход к сбору и агрегации пользовательских отзывов для дообучения больших языковых моделей (LLM) в мобильных приложениях. Разработанный механизм решает проблему стратегического искажения предпочтений со стороны участников краудсорсинговых платформ.
В мобильных сервисах, таких как навигация, платформы могут итеративно улучшать генерируемый ИИ контент с помощью обратной связи от пользователей. Однако участники могут намеренно сообщать неверные предпочтения, чтобы увеличить своё влияние или вознаграждение.
Существующие методы, в частности EM-оценка весов, не позволяют идентифицировать наиболее точного работника в онлайн-режиме, что приводит к линейной ошибке O(T) за T временных слотов. Новый алгоритм, основанный на динамической байесовской игре, моделирует процесс обучения между платформой и стратегическими мобильными работниками.
Предложенный механизм онлайн-взвешенной агрегации динамически корректирует вес каждого работника в соответствии с точностью его отзывов. Это стимулирует участников предоставлять правдивую информацию. Доказано, что механизм обеспечивает сублинейную ошибку O(?T).
Исследователи также адаптировали метод к сценарию, когда каждый работник может дать ограниченное количество отзывов за один временной слот. В этом случае также гарантируется сублинейная ошибка O(?T).
Эксперименты на реальных данных по дообучению LLM показали значительное превосходство нового подхода по сравнению с базовыми схемами. Работа опубликована на arXiv.




