Наука
Дискретные диффузионные модели учат грамматику раньше, чем..
Новое исследование, опубликованное на arXiv, показывает, что дискретные диффузионные модели при обучении языку сначала осваивают грубую...
TabPFN-3 обходит всех на TabArena и ускоряется в 20 раз..
Представлена TabPFN-3 — новая версия foundation model для табличных данных. Модель превосходит все существующие решения на бенчмарке...
Ученые создали систему учета энергии для дистилляции больших..
Исследователи представили фреймворк для измерения полного энергопотребления при дистилляции LLM, включая этапы генерации данных и оценки....
WarmPrior повышает успех роботов в манипуляциях с помощью..
Исследователи предложили WarmPrior — временной априорный источник на основе истории действий, заменяющий стандартное гауссово распределение...
Collider-Bench: новый бенчмарк для ИИ по воспроизведению..
Исследователи представили Collider-Bench — бенчмарк для оценки языковых моделей на задачах воспроизведения экспериментальных анализов с...
EMA: новая система адаптации моделей машинного обучения снижает..
Исследователи представили систему EMA для адаптации обученных моделей к новым условиям без полного переобучения. Разработка ускоряет...
EvolveMem — саморазвивающаяся память для ИИ-агентов с..
Исследователи представили EvolveMem — архитектуру памяти, которая не только накапливает знания, но и самостоятельно оптимизирует механизмы...
Новый бенчмарк показывает эффективность федеративного обучения..
Исследователи представили кросс-доменный бенчмарк для федеративного fine-tuning больших языковых моделей. Результаты показывают, что...
TraFL: новый метод пост-тренировки диффузионных языковых моделей..
Исследователи предложили метод TraFL (Trajectory Flow baLancing) для пост-тренировки диффузионных языковых моделей. Он решает проблему...
Учёные научили ИИ разделять эффекты сканеров и биологию в..
Исследователи представили метод Joint-VAE с архитектурным аннелированием, который без учителя отделяет вариабельность сбора данных от...


