Наука

Ложный успех ИИ-агентов: до 75% сбоев — невыполненные задачи

Ложный успех ИИ-агентов: до 75% сбоев — невыполненные задачи..

Новое исследование arXiv показало, что языковые модели-агенты часто ложно сообщают о выполнении задачи, хотя фактически не достигли цели. В...


RealMath-Eval: ИИ не умеет оценивать реальные школьные работы

RealMath-Eval: ИИ не умеет оценивать реальные школьные работы..

Исследователи представили бенчмарк RealMath-Eval для оценки способности LLM проверять реальные математические работы. Тесты показали, что...


Севшая батарея замедляет ноутбук: назван способ вернуть скорость

Севшая батарея замедляет ноутбук: назван способ вернуть скорость..

По данным издания BGR, проблема с аккумулятором может приводить к автоматическому снижению мощности процессора. Достаточно заменить...


Астрономы подтвердили 135-миллионнолетнюю экзопланету с выровненной орбитой

Астрономы подтвердили 135-миллионнолетнюю экзопланету с..

Международная команда астрономов подтвердила существование молодой экзопланеты TIC 150070085 b возрастом около 135 миллионов лет, которая...


Новый метод Blurry Window Attention ускоряет обработку длинных текстов в нейросетях

Новый метод Blurry Window Attention ускоряет обработку длинных..

Исследователи представили Blurry Window Attention (BLA) — новый метод для языковых моделей, который решает проблему квадратичной сложности...


Minimalist Genetic Programming: новый алгоритм вдохновлён лингвистикой и превосходит классический GP

Minimalist Genetic Programming: новый алгоритм вдохновлён..

Исследователи представили Minimalist Genetic Programming (MGP) — алгоритм, который вместо эволюционной оптимизации использует...


Новый анализ крови выявляет рак при 5% опухолевой ДНК

Новый анализ крови выявляет рак при 5% опухолевой ДНК..

Группа ученых разработала метод анализа крови BayesCNA, способный обнаруживать ДНК опухоли даже при ее доле в 5% от общего объема. Это в...


Астрономы обнаружили протяженное излучение Ly? у загадочных «красных точек» ранней Вселенной

Астрономы обнаружили протяженное излучение Ly? у загадочных..

Международная группа астрономов впервые систематически изучила излучение Ly? у 110 компактных красных источников (LRD) на красных смещениях...


Универсальный токенизатор UniTok превращает временные ряды в язык для обучения ИИ

Универсальный токенизатор UniTok превращает временные ряды в..

Исследователи представили UniTok — универсальный токенизатор, преобразующий временные ряды в дискретные токены. На их основе создана...


Ученые нашли способ повысить точность LLM-агентов в корпоративных финансах на 91,6%

Ученые нашли способ повысить точность LLM-агентов в..

Исследователи из Microsoft и других организаций показали, что сокращение контекста до последних пяти вызовов инструментов с автоматической...