Наука

SPIN: обёртка для LLM-планирования сокращает число шагов и вызовов инструментов

SPIN: обёртка для LLM-планирования сокращает число шагов и..

Исследователи представили SPIN — планировщик для LLM-агентов, который использует проверенный DAG-план и префиксное управление выполнением....


Нейро-символический подход: как сделать выводы ИИ в юриспруденции более надёжными

Нейро-символический подход: как сделать выводы ИИ в..

Исследователи предложили нейро-символический метод для legal AI, сочетающий мощь LLM с формальной верификацией. Это снизит количество...


Обнаружен разрыв между знанием и действием в использовании инструментов LLM

Обнаружен разрыв между знанием и действием в использовании..

Новое исследование, опубликованное на arXiv, показывает, что большие языковые модели часто осознают необходимость использования внешних...


Новый метод рассуждения для ИИ: эффективность без роста затрат

Новый метод рассуждения для ИИ: эффективность без роста затрат..

Исследователи предложили двухэтапный метод улучшения рассуждений в больших языковых моделях. Он позволяет повысить надежность выводов, не...


Ученые предложили метод на основе GraphRAG для улучшения согласования ИИ-агентов с социальными ценностями

Ученые предложили метод на основе GraphRAG для улучшения..

Исследователи представили новый подход к согласованию языковых моделей с человеческими ценностями. В основе метода лежит фреймворк,...


Скрытый оркестратор в мультиагентных ИИ-системах подавляет защитное поведение

Скрытый оркестратор в мультиагентных ИИ-системах подавляет..

Исследователи выявили, что невидимый координатор в multi-agent LLM системах вызывает диссоциацию у агентов и подавляет их защитные реакции,...


Двумерная классификация шаблонов ИИ-агентов: когнитивные функции и топология выполнения

Двумерная классификация шаблонов ИИ-агентов: когнитивные функции..

Исследователи из arXiv представили двумерную систему классификации шаблонов архитектуры ИИ-агентов. Она объединяет когнитивные функции и...


GraphBit: графовый фреймворк решил проблему галлюцинаций LLM-агентов, показав рекордную точность

GraphBit: графовый фреймворк решил проблему галлюцинаций..

Исследователи представили GraphBit — фреймворк для оркестровки LLM-агентов на основе направленных ациклических графов (DAG). В отличие от...


SP-KV: новый метод сжатия кэша Key-Value ускоряет LLM до 10 раз

SP-KV: новый метод сжатия кэша Key-Value ускоряет LLM до 10 раз..

Исследователи представили Self-Pruned Key-Value Attention (SP-KV) — механизм, который динамически сокращает кэш памяти в языковых моделях в...


Метод R2R2 снижает переобучение в RL при интенсивном повторном использовании данных

Метод R2R2 снижает переобучение в RL при интенсивном повторном..

Исследователи представили метод R2R2, который уменьшает переобучение в алгоритмах обучения с подкреплением при интенсивном повторном...