Наука

Исследователи нашли сигналы сбоя в поведении LLM-трейдеров

Исследователи нашли сигналы сбоя в поведении LLM-трейдеров..

Новая научная работа выявила предсказуемые паттерны в поведении языковых моделей, действующих как трейдеры. Отклонение эмбеддингов и сжатие...


Новый алгоритм STHTD-MP ускоряет обучение с подкреплением без политики

Новый алгоритм STHTD-MP ускоряет обучение с подкреплением без..

Исследователи предложили метод STHTD-MP, который заменяет стандартную метрику ковариации на информацию о поведенческой политике, что...


ВМС США намерены заменить устаревшие F-5 на F/A-18 на учениях

ВМС США намерены заменить устаревшие F-5 на F/A-18 на учениях..

ВМС США планируют изучить замену самолетов-агрессоров F-5 на более современные F/A-18. Соответствующее предложение включено в проект...


В Москве представили бронежилет «Гранат БС-К» с защитой от снайперской винтовки

В Москве представили бронежилет «Гранат БС-К» с защитой от..

На выставке «Экипировка» в Москве показали модульный бронежилет «Гранат БС-К» с бронеэлементами из карбида бора. Изделие выдерживает...


Следующий запуск экипажа с Байконура к МКС назначен на 14 июля

Следующий запуск экипажа с Байконура к МКС назначен на 14 июля..

Глава Роскосмоса Дмитрий Баканов сообщил, что следующий пилотируемый пуск с Байконура к МКС состоится 14 июля. В экипаж войдут два...


iPhone 17 Pro Max рекордно подешевел на российском рынке до 95 тысяч рублей

iPhone 17 Pro Max рекордно подешевел на российском рынке до 95..

Флагманский смартфон Apple впервые опустился ниже 100 тысяч рублей. На маркетплейсах цена снизилась до 97,3 тыс., в офлайн-магазинах — до...


Метод SBBT повышает надежность LLM: улучшение AUROC на 0.11 в сложной математике

Метод SBBT повышает надежность LLM: улучшение AUROC на 0.11 в..

Исследователи предложили Sequential Bayesian Belief Tracking (SBBT) для оценки вероятности успеха рассуждений LLM. Метод отделяет...


DeepSciVerify: новый метод проверки научных ссылок повысил точность ИИ на 4,5%

DeepSciVerify: новый метод проверки научных ссылок повысил..

Исследователи представили DeepSciVerify — двухэтапный pipeline для проверки соответствия научных утверждений и цитируемых источников....


Новый метод управления улучшает работу маленьких языковых моделей в сложных агентах

Новый метод управления улучшает работу маленьких языковых..

Исследователи предложили иерархический фреймворк для компактных языковых моделей, работающих в агентных системах. Метод сочетает...


Frost Training ускоряет обучение LLM в задачах Cross-Entropy Games

Frost Training ускоряет обучение LLM в задачах Cross-Entropy..

Исследователи представили Frost Training — метод, улучшающий оптимизацию политики для LLM в задачах типа LLM-как-судья. Метод использует...