Наука

Простая модель SSM оказалась эффективнее сложной Mamba в задачах классификации временных рядов

Простая модель SSM оказалась эффективнее сложной Mamba в задачах..

Исследователи показали, что диагональная SSM S4D превосходит Mamba-архитектуры по точности и эффективности на 59 датасетах. Представлены...


Учёные создали модульную архитектуру на LLM для выявления человеческих ценностей в тексте

Учёные создали модульную архитектуру на LLM для выявления..

Исследователи представили архитектуру на основе больших языковых моделей, которая позволяет выявлять и оценивать интенсивность человеческих...


Комбуча на зеленом чае и улуне замедляет старение клеток — исследование

Комбуча на зеленом чае и улуне замедляет старение клеток —..

Ученые из Вроцлавского медицинского университета выяснили, что комбуча на основе зеленого чая и улуна обладает наибольшей антиоксидантной...


CE-FedGNN: новый фреймворк для федеративного обучения графовых нейросетей с гарантией приватности

CE-FedGNN: новый фреймворк для федеративного обучения графовых..

Исследователи представили CE-FedGNN — фреймворк, позволяющий обучать графовые нейросети на распределённых данных без обмена сырыми данными....


Юридический ИИ: новый фреймворк LexGuard повышает устойчивость к манипуляциям

Юридический ИИ: новый фреймворк LexGuard повышает устойчивость к..

Исследователи представили LexGuard — фреймворк для юридического ИИ, который фокусируется только на значимых изменениях и игнорирует...


Ученые доказали линейную границу max-information для DP-SGD

Ученые доказали линейную границу max-information для DP-SGD..

Исследователи получили конечную оценку приближенной max-information для дифференциально приватного стохастического градиентного спуска...


MiniMax представил модели M2: эффективность через мини-активацию и самоэволюцию

MiniMax представил модели M2: эффективность через мини-активацию..

Компания MiniMax выпустила серию языковых моделей MiniMax-M2 на основе архитектуры Mixture-of-Experts. Флагманская модель имеет 229,9 млрд...


Новый фреймворк CoAD объединяет классификацию и реконструкцию для обнаружения аномалий во временных рядах

Новый фреймворк CoAD объединяет классификацию и реконструкцию..

Исследователи представили CoAD — фреймворк, который объединяет подходы классификации и реконструкции для обнаружения аномалий во временных...


Код не помогает: цепь рассуждений устойчивее к вариациям задач, чем выполнение кода

Код не помогает: цепь рассуждений устойчивее к вариациям задач,..

Исследователи сравнили три подхода к решению математических задач с помощью LLM: цепочку рассуждений, однократное и итеративное выполнение...


Новый метод DelayMix превзошел аналоги в прогнозировании быстроменяющихся временных рядов

Новый метод DelayMix превзошел аналоги в прогнозировании..

Исследователи представили онлайн-метод DelayMix, который моделирует потоковые временные ряды как динамические смеси систем с запаздыванием....