Наука
ARBITER: как исправить ошибки голосования в рассуждениях..
Исследователи из arXiv обнаружили, что при многократном сэмплировании ответы языковых моделей группируются в кластеры — «бассейны...
Новый фреймворк повышает надежность LLM-сгенерированных процедур..
Большие языковые модели могут генерировать процедуры для виртуальных лабораторий, но их планы часто содержат ошибки. Новый фреймворк...
Android-пользователям посоветовали включить отладку по USB для..
Журналисты How-To Geek рекомендовали владельцам Android-смартфонов активировать функцию отладки по USB. Она позволяет получить доступ к...
Потеря ультрафиолетового спектрографа Hubble лишит учёных данных..
Астрономы предупреждают, что без продления миссии телескопа Hubble будут утеряны возможности ультрафиолетовой спектроскопии, необходимые...
Встраивание групп Ли в нейросети: новый метод для устойчивой..
Исследователи представили LieEDNN — нейросеть со встроенной группой Ли для обучения устойчивой динамике на многообразиях. Модель решает...
OmniToM: бенчмарк теории разума для LLM выявил проблему..
Исследователи представили OmniToM — бенчмарк для оценки теории разума (ToM) у больших языковых моделей. В отличие от стандартных тестов, он...
Хаббл изучает космическую погоду молодых звезд для оценки..
Астрономы предложили программу наблюдений молодых солнцеподобных звезд с помощью телескопа «Хаббл». Исследования позволят понять, как...
TSFMAudit: новый метод выявления загрязнения данных в моделях..
Исследователи предложили метод TSFMAudit для проверки, не были ли тестовые наборы данных использованы при предобучении моделей временных...
Автономные AI-агенты взялись за научные задачи: сбор данных и..
Исследователи представили две системы агентного ИИ: DeepTS для автоматизации работы с временными рядами и DeepScribe для превращения...
Астрономы: телескоп Hubble критически важен для изучения..
Новое исследование подчёркивает уникальную роль космического телескопа Hubble в анализе состава экзопланетного материала, поглощаемого...



