Наука

Новый метод SURGE решает проблему градиентного рассогласования в бинарных нейросетях

Новый метод SURGE решает проблему градиентного рассогласования в..

Исследователи предложили SURGE — обучаемый фреймворк компенсации градиентов для бинарных нейросетей. Метод включает Dual-Path Gradient...


Онтологическая архитектура снизила уровень галлюцинаций ИИ-агентов с 43% до 0%

Онтологическая архитектура снизила уровень галлюцинаций..

Исследователи выявили семантический разрыв в обучении промышленных ИИ-агентов и предложили онтологически обоснованную архитектуру....


Атака AESOP: выбор путей выполнения перегружает ИИ-пайплайны в 2407 раз

Атака AESOP: выбор путей выполнения перегружает ИИ-пайплайны в..

Исследователи представили AESOP — метод атак, нацеленных на современные конвейеры машинного обучения. Злоумышленник манипулирует путями...


Новый LLM-стек для борьбы с мошенничеством повысил пропускную способность в 6 раз

Новый LLM-стек для борьбы с мошенничеством повысил пропускную..

Исследователи представили специализированный LLM-стек для задач комплаенса и AML. Оптимизация ворклоада увеличила throughput с 650 до 3600...


SoftBlobGIN: фреймворк для интерпретации предсказаний языковых моделей белков

SoftBlobGIN: фреймворк для интерпретации предсказаний языковых..

Исследователи представили SoftBlobGIN – лёгкий GNN-фреймворк, который проецирует скрытые представления ESM-2 на графы контактов белков....


Новый фреймворк PIVOT повышает точность выполнения планов ИИ-агентов на 94%

Новый фреймворк PIVOT повышает точность выполнения планов..

Исследователи представили PIVOT — фреймворк, который позволяет LLM-агентам самостоятельно исправлять ошибки при выполнении сложных задач....


Новый метод LEAP ускоряет диффузионные языковые модели на 30% без дообучения

Новый метод LEAP ускоряет диффузионные языковые модели на 30%..

Исследователи представили LEAP (Lookahead Early-Convergence Token Detection) — метод, позволяющий распознавать токены, которые сходятся к...


Визуальное якорное смещение: числа на изображениях сбивают с толку Vision-Language модели

Визуальное якорное смещение: числа на изображениях сбивают с..

Новое исследование arXiv показало, что встроенные числовые метки на изображениях систематически искажают оценку качества шести...


ИИ научился лучше анализировать «разнородные» графы: новая модель HMH обходит существующие на 3-7%

ИИ научился лучше анализировать «разнородные» графы: новая..

Исследователи представили HMH — новую модель графовых нейросетей, которая эффективно работает с гетерофильными графами, где соседние узлы...


On-policy distillation для LLM: когда метод работает, а когда даёт сбой — новое исследование

On-policy distillation для LLM: когда метод работает, а когда..

Исследователи выявили три механизма сбоев on-policy distillation (OPD) и on-policy self-distillation (OPSD) для больших языковых моделей....