Новый бенчмарк показывает эффективность федеративного обучения LLM на приватных данных

Редакция RusNews 15-май, 08:11 Наука 1 Искусственный интеллект

Развитие больших языковых моделей (LLM) упирается в ограниченность публичных данных. Между тем, огромные массивы ценной информации находятся в частном владении, особенно в регулируемых секторах — здравоохранении и финансах. Как адаптировать LLM к таким данным, не нарушая конфиденциальность?

В новой работе, опубликованной на arXiv, предложен практический подход: федеративное обучение (federated learning) на распределённых институциональных датасетах. Платформа Sherpa.ai позволяет узлам совместно выполнять fine-tuning общей модели без обмена приватными данными.

Авторы провели кросс-доменный бенчмарк на четырёх наборах данных: медицинские MedQA и MedMCQA, а также финансовые FPB и FiQA-SA. Сравнивались три стратегии параметро-эффективного fine-tuning (PEFT) — LoRA, QLoRA и IA3 — на предобученных базовых моделях в условиях non-IID, отражающих реальную гетерогенность институциональных данных.

Результаты показали, что федеративный fine-tuning работает почти так же хорошо, как централизованное обучение, и значительно превосходит изолированное обучение каждой организацией по отдельности. С точки зрения «зелёного ИИ» QLoRA и IA3 обеспечивают высокую эффективность с минимальной потерей точности.

Таким образом, федеративный PEFT становится жизнеспособным методом адаптации LLM к данным, которые нельзя централизовать из-за законодательных и организационных барьеров. Это открывает путь к созданию более компетентных моделей в здравоохранении, финансах и других областях с конфиденциальной информацией.

Новый бенчмарк показывает эффективность федеративного обучения LLM на приватных данных

Разделы

Навигация

Теги

Новый бенчмарк показывает эффективность федеративного обучения LLM на приватных данных

Читайте также

Разделы

Навигация

Теги