Наука

CAX-Agent: новый ИИ-агент повышает надежность автоматизации инженерных симуляций

CAX-Agent: новый ИИ-агент повышает надежность автоматизации..

Исследователи представили CAX-Agent — легковесный агент для автоматизации MAPDL-симуляций. В ходе тестов стратегия восстановления на основе...


Сжатие LLM порождает новые предвзятости: исследование на 900 тыс. тестов

Сжатие LLM порождает новые предвзятости: исследование на 900..

Даже при незначительном ухудшении перплексии квантизация больших языковых моделей до 3-бит вызывает появление стереотипных предвзятостей в...


LLM скрывают предвзятость внутри, хотя выдают честные решения — угроза для кредитования

LLM скрывают предвзятость внутри, хотя выдают честные решения —..

Учёные обнаружили, что языковые модели могут демонстрировать справедливость на выходе, но сохранять предвзятые ассоциации в своих...


Новый метод TeamTR повышает эффективность мультиагентных LLM на 7,1%

Новый метод TeamTR повышает эффективность мультиагентных LLM на..

Исследователи выявили структурную ошибку при последовательном дообучении мультиагентных LLM, названную compounding occupancy shift....


SkillSmith сокращает расход токенов для ИИ-агентов на 57%

SkillSmith сокращает расход токенов для ИИ-агентов на 57%..

Исследователи представили фреймворк SkillSmith, который компилирует навыки агентов на базе LLM в минимальные исполняемые интерфейсы. Это...


Новый метод AgentStop позволяет экономить до 20% энергии при работе локальных ИИ-агентов

Новый метод AgentStop позволяет экономить до 20% энергии при..

Исследователи разработали метод AgentStop для раннего завершения неудачных траекторий локальных ИИ-агентов на пользовательских устройствах....


Улучшение теории разума у ИИ: статические тесты не отражают реальное взаимодействие

Улучшение теории разума у ИИ: статические тесты не отражают..

Исследователи показали, что улучшение способности LLM понимать чужие намерения (теория разума) на статических тестах не гарантирует лучшего...


SkillFlow: потоковый фреймворк для ИИ-агентов превосходит бенчмарки в решении задач

SkillFlow: потоковый фреймворк для ИИ-агентов превосходит..

Исследователи представили SkillFlow — фреймворк на основе потоков для оркестрации задач с помощью LLM-агентов. Система использует...


Исследователи научили LLM генерировать синтетические данные без лишних затрат токенов

Исследователи научили LLM генерировать синтетические данные без..

Предложен метод Multi-Stage In-Flight Rejection (MSIFR), который позволяет сократить расход токенов на 11–77% при генерации синтетических...


MoCA: новый RL-фреймворк улучшает восприятие и логику Vision-Language моделей

MoCA: новый RL-фреймворк улучшает восприятие и логику..

Исследователи представили фреймворк MoCA, который устраняет неоднозначность между ошибками восприятия и логики в Vision-Language моделях....