Наука

ARBITER: как исправить ошибки голосования в рассуждениях языковых моделей

ARBITER: как исправить ошибки голосования в рассуждениях..

Исследователи из arXiv обнаружили, что при многократном сэмплировании ответы языковых моделей группируются в кластеры — «бассейны...


Новый фреймворк повышает надежность LLM-сгенерированных процедур для виртуальных лабораторий

Новый фреймворк повышает надежность LLM-сгенерированных процедур..

Большие языковые модели могут генерировать процедуры для виртуальных лабораторий, но их планы часто содержат ошибки. Новый фреймворк...


Android-пользователям посоветовали включить отладку по USB для защиты данных

Android-пользователям посоветовали включить отладку по USB для..

Журналисты How-To Geek рекомендовали владельцам Android-смартфонов активировать функцию отладки по USB. Она позволяет получить доступ к...


Потеря ультрафиолетового спектрографа Hubble лишит учёных данных о летучих элементах в экзопланетах

Потеря ультрафиолетового спектрографа Hubble лишит учёных данных..

Астрономы предупреждают, что без продления миссии телескопа Hubble будут утеряны возможности ультрафиолетовой спектроскопии, необходимые...


Встраивание групп Ли в нейросети: новый метод для устойчивой динамики в робототехнике

Встраивание групп Ли в нейросети: новый метод для устойчивой..

Исследователи представили LieEDNN — нейросеть со встроенной группой Ли для обучения устойчивой динамике на многообразиях. Модель решает...


OmniToM: бенчмарк теории разума для LLM выявил проблему отслеживания убеждений

OmniToM: бенчмарк теории разума для LLM выявил проблему..

Исследователи представили OmniToM — бенчмарк для оценки теории разума (ToM) у больших языковых моделей. В отличие от стандартных тестов, он...


Хаббл изучает космическую погоду молодых звезд для оценки пригодности экзопланет

Хаббл изучает космическую погоду молодых звезд для оценки..

Астрономы предложили программу наблюдений молодых солнцеподобных звезд с помощью телескопа «Хаббл». Исследования позволят понять, как...


TSFMAudit: новый метод выявления загрязнения данных в моделях временных рядов

TSFMAudit: новый метод выявления загрязнения данных в моделях..

Исследователи предложили метод TSFMAudit для проверки, не были ли тестовые наборы данных использованы при предобучении моделей временных...


Автономные AI-агенты взялись за научные задачи: сбор данных и анализ лекций

Автономные AI-агенты взялись за научные задачи: сбор данных и..

Исследователи представили две системы агентного ИИ: DeepTS для автоматизации работы с временными рядами и DeepScribe для превращения...


Астрономы: телескоп Hubble критически важен для изучения экзопланет у белых карликов

Астрономы: телескоп Hubble критически важен для изучения..

Новое исследование подчёркивает уникальную роль космического телескопа Hubble в анализе состава экзопланетного материала, поглощаемого...