Новый бенчмарк показывает эффективность федеративного обучения LLM на приватных данных
Развитие больших языковых моделей (LLM) упирается в ограниченность публичных данных. Между тем, огромные массивы ценной информации находятся в частном владении, особенно в регулируемых секторах — здравоохранении и финансах. Как адаптировать LLM к таким данным, не нарушая конфиденциальность?
В новой работе, опубликованной на arXiv, предложен практический подход: федеративное обучение (federated learning) на распределённых институциональных датасетах. Платформа Sherpa.ai позволяет узлам совместно выполнять fine-tuning общей модели без обмена приватными данными.
Авторы провели кросс-доменный бенчмарк на четырёх наборах данных: медицинские MedQA и MedMCQA, а также финансовые FPB и FiQA-SA. Сравнивались три стратегии параметро-эффективного fine-tuning (PEFT) — LoRA, QLoRA и IA3 — на предобученных базовых моделях в условиях non-IID, отражающих реальную гетерогенность институциональных данных.
Результаты показали, что федеративный fine-tuning работает почти так же хорошо, как централизованное обучение, и значительно превосходит изолированное обучение каждой организацией по отдельности. С точки зрения «зелёного ИИ» QLoRA и IA3 обеспечивают высокую эффективность с минимальной потерей точности.
Таким образом, федеративный PEFT становится жизнеспособным методом адаптации LLM к данным, которые нельзя централизовать из-за законодательных и организационных барьеров. Это открывает путь к созданию более компетентных моделей в здравоохранении, финансах и других областях с конфиденциальной информацией.


