Наука

Исследование: тон запроса влияет на точность LLM – результаты четырех моделей

Исследование: тон запроса влияет на точность LLM – результаты..

Ученые выяснили, что тон формулировки вопросов систематически влияет на точность ответов больших языковых моделей. Эффект оказался сильным...


Расхождение моделей ИИ при анализе отзывов: новый метод оценки

Расхождение моделей ИИ при анализе отзывов: новый метод оценки..

Федеральные агентства США применяют большие языковые модели для категоризации общественных комментариев. Исследователи выявили, что разные...


Исследователи представили CosmicFish-HRM: компактная языковая модель с адаптивной глубиной рассуждений

Исследователи представили CosmicFish-HRM: компактная языковая..

Ученые разработали компактную языковую модель CosmicFish-HRM, которая динамически распределяет вычислительные усилия в зависимости от...


Учёные выяснили: привычки пользователей ИИ-ассистентов крайне устойчивы

Учёные выяснили: привычки пользователей ИИ-ассистентов крайне..

Анализ 12 тысяч пользователей Microsoft Bing Copilot показал, что индивидуальные привычки работы с LLM почти не меняются со временем....


Диагностический подход к настройке вознаграждения повысил успешность ИИ-агентов до 97%

Диагностический подход к настройке вознаграждения повысил..

Исследователи предложили диагностический метод итеративного уточнения функций вознаграждения для задач с разреженной структурой. Применение...


BEAMS: новый бенчмарк для оценки ИИ в моделировании и симуляции

BEAMS: новый бенчмарк для оценки ИИ в моделировании и симуляции..

Инициатива BEAMS представила набор тестов для оценки ИИ-инструментов в моделировании. Тесты показали, что современные LLM лучше справляются...


Нейронные операторы ускорили моделирование резервуара Norne в 10 000 раз

Нейронные операторы ускорили моделирование резервуара Norne в 10..

Исследователи разработали фреймворк на основе физически-информированных нейронных операторов (PINO), который моделирует трехфазную динамику...


VFEAgent: ИИ-агент автоматизирует конечно-элементный анализ по изображениям

VFEAgent: ИИ-агент автоматизирует конечно-элементный анализ по..

Исследователи представили VFEAgent — мультимодальную систему ИИ, которая по изображениям и описаниям задач автоматически строит и проводит...


LoRA-дообучение создаёт собственные признаки: исследование SAE

LoRA-дообучение создаёт собственные признаки: исследование SAE..

Исследователи изучили внутренние представления языковых моделей при LoRA-дообучении с помощью разреженных автоэнкодеров (SAE). Оказалось,...


LLM-агенты сравнялись с людьми в аннотации фенотипов — исследование

LLM-агенты сравнялись с людьми в аннотации фенотипов —..

Исследователи оценили пять крупных языковых моделей от Anthropic и OpenAI как кураторов-агентов для аннотации биологических фенотипов....