Наука

Calibrated Interactive RL: новый подход к тренировке диалоговых ИИ-агентов

Calibrated Interactive RL: новый подход к тренировке диалоговых..

Исследователи представили Calibrated Interactive RL — фреймворк, объединяющий интерактивное обучение с подкреплением и калибровку...


Нейросеть HRVConformer диагностирует повреждения мозга у новорожденных по пульсу

Нейросеть HRVConformer диагностирует повреждения мозга у..

Исследователи представили модель HRVConformer, которая по сигналу сердечного ритма классифицирует гипоксически-ишемическую энцефалопатию у...


Алгоритм CARL научился повторно использовать навыки в иерархическом обучении с подкреплением

Алгоритм CARL научился повторно использовать навыки в..

Исследователи представили алгоритм CARL, который использует локальную регулярность динамики для создания повторно используемых навыков....


Выявлены скрытые сбои при квантизации LLM: решение снижает потерю точности до 0.43%

Выявлены скрытые сбои при квантизации LLM: решение снижает..

Исследователи изучили HiF8 W8A8 квантизационное обучение модели OpenPangu-Embedded-1B и выявили два скрытых режима сбоев: насыщение amax и...


Определение галлюцинаций нейросетей: новый метод выбирает лучший слой без обучения

Определение галлюцинаций нейросетей: новый метод выбирает лучший..

Исследователи предложили метод FEPoID для автоматического выбора оптимального промежуточного слоя нейросети, который улучшает детекцию...


InfoQuant: новый метод квантования LLM сохраняет 97% точности при 4-битных вычислениях

InfoQuant: новый метод квантования LLM сохраняет 97% точности..

Исследователи представили InfoQuant — метод низкоразрядного квантования больших языковых моделей без дополнительного обучения. Алгоритм...


Новая система ScientistOne устраняет галлюцинации в автономных исследованиях

Новая система ScientistOne устраняет галлюцинации в автономных..

Разработана система ScientistOne, которая использует фреймворк Chain-of-Evidence для обеспечения проверяемости результатов. В тестах...


ARBITER: как исправить ошибки голосования в рассуждениях языковых моделей

ARBITER: как исправить ошибки голосования в рассуждениях..

Исследователи из arXiv обнаружили, что при многократном сэмплировании ответы языковых моделей группируются в кластеры — «бассейны...


Новый фреймворк повышает надежность LLM-сгенерированных процедур для виртуальных лабораторий

Новый фреймворк повышает надежность LLM-сгенерированных процедур..

Большие языковые модели могут генерировать процедуры для виртуальных лабораторий, но их планы часто содержат ошибки. Новый фреймворк...


Встраивание групп Ли в нейросети: новый метод для устойчивой динамики в робототехнике

Встраивание групп Ли в нейросети: новый метод для устойчивой..

Исследователи представили LieEDNN — нейросеть со встроенной группой Ли для обучения устойчивой динамике на многообразиях. Модель решает...