Наука
Calibrated Interactive RL: новый подход к тренировке диалоговых..
Исследователи представили Calibrated Interactive RL — фреймворк, объединяющий интерактивное обучение с подкреплением и калибровку...
Нейросеть HRVConformer диагностирует повреждения мозга у..
Исследователи представили модель HRVConformer, которая по сигналу сердечного ритма классифицирует гипоксически-ишемическую энцефалопатию у...
Алгоритм CARL научился повторно использовать навыки в..
Исследователи представили алгоритм CARL, который использует локальную регулярность динамики для создания повторно используемых навыков....
Выявлены скрытые сбои при квантизации LLM: решение снижает..
Исследователи изучили HiF8 W8A8 квантизационное обучение модели OpenPangu-Embedded-1B и выявили два скрытых режима сбоев: насыщение amax и...
Определение галлюцинаций нейросетей: новый метод выбирает лучший..
Исследователи предложили метод FEPoID для автоматического выбора оптимального промежуточного слоя нейросети, который улучшает детекцию...
InfoQuant: новый метод квантования LLM сохраняет 97% точности..
Исследователи представили InfoQuant — метод низкоразрядного квантования больших языковых моделей без дополнительного обучения. Алгоритм...
Новая система ScientistOne устраняет галлюцинации в автономных..
Разработана система ScientistOne, которая использует фреймворк Chain-of-Evidence для обеспечения проверяемости результатов. В тестах...
ARBITER: как исправить ошибки голосования в рассуждениях..
Исследователи из arXiv обнаружили, что при многократном сэмплировании ответы языковых моделей группируются в кластеры — «бассейны...
Новый фреймворк повышает надежность LLM-сгенерированных процедур..
Большие языковые модели могут генерировать процедуры для виртуальных лабораторий, но их планы часто содержат ошибки. Новый фреймворк...
Встраивание групп Ли в нейросети: новый метод для устойчивой..
Исследователи представили LieEDNN — нейросеть со встроенной группой Ли для обучения устойчивой динамике на многообразиях. Модель решает...


