Новый стандарт энергопотребления ИИ: A-LEMS считает затраты на задачу
Текущие бенчмарки энергопотребления ИИ измеряют затраты на один вызов модели или один тренировочный цикл. Однако для агентных систем, где задача может потребовать многократных вызовов, повторных попыток и использования инструментов, такой подход не отражает реальной энергоёмкости. Учёные предложили новый стандарт — Energy per Successful Goal (EpG), который суммирует всю энергию, затраченную на достижение одной цели, включая неудачные попытки.
Система A-LEMS (Agentic LLM Energy Measurement System) позволяет измерять энергию на уровне задач. Она включает временную границу, пятиуровневый конвейер наблюдения за сигналами RAPL и протокол воспроизводимости. Дополнительно введён индекс Orchestration Overhead Index (OOI), который изолирует затраты на оркестровку.
Эксперименты на пяти типах задач с рассуждением и трёх типах с инструментами показали: агентные системы потребляют в среднем 888,1 Дж на успешную задачу против 205,3 Дж у линейных — то есть в 4,33 раза больше. При этом основным драйвером является структура оркестровки, а не объём вычислений.
Для задач дополненных инструментами OOI оказался ниже 1,0 — то есть агентное выполнение оказалось энергоэффективнее линейного. Это подтверждает, что новая метрика улавливает именно структуру оркестровки, а не просто добавляет наценку.
Исследователи утверждают, что традиционные метрики «энергия на один вызов» недостаточны для агентного ИИ. EpG и OOI закладывают основу для точного бенчмаркинга, где структура оркестровки становится главным фактором энергозатрат.


