Наука
Ложный успех ИИ-агентов: до 75% сбоев — невыполненные задачи..
Новое исследование arXiv показало, что языковые модели-агенты часто ложно сообщают о выполнении задачи, хотя фактически не достигли цели. В...
RealMath-Eval: ИИ не умеет оценивать реальные школьные работы..
Исследователи представили бенчмарк RealMath-Eval для оценки способности LLM проверять реальные математические работы. Тесты показали, что...
Севшая батарея замедляет ноутбук: назван способ вернуть скорость..
По данным издания BGR, проблема с аккумулятором может приводить к автоматическому снижению мощности процессора. Достаточно заменить...
Астрономы подтвердили 135-миллионнолетнюю экзопланету с..
Международная команда астрономов подтвердила существование молодой экзопланеты TIC 150070085 b возрастом около 135 миллионов лет, которая...
Новый метод Blurry Window Attention ускоряет обработку длинных..
Исследователи представили Blurry Window Attention (BLA) — новый метод для языковых моделей, который решает проблему квадратичной сложности...
Minimalist Genetic Programming: новый алгоритм вдохновлён..
Исследователи представили Minimalist Genetic Programming (MGP) — алгоритм, который вместо эволюционной оптимизации использует...
Новый анализ крови выявляет рак при 5% опухолевой ДНК..
Группа ученых разработала метод анализа крови BayesCNA, способный обнаруживать ДНК опухоли даже при ее доле в 5% от общего объема. Это в...
Астрономы обнаружили протяженное излучение Ly? у загадочных..
Международная группа астрономов впервые систематически изучила излучение Ly? у 110 компактных красных источников (LRD) на красных смещениях...
Универсальный токенизатор UniTok превращает временные ряды в..
Исследователи представили UniTok — универсальный токенизатор, преобразующий временные ряды в дискретные токены. На их основе создана...
Ученые нашли способ повысить точность LLM-агентов в..
Исследователи из Microsoft и других организаций показали, что сокращение контекста до последних пяти вызовов инструментов с автоматической...




