Agent4cs: мультиагентная система для суммаризации кода с улучшением до 38%
Понимание больших и сложных кодовых баз, особенно с запутанной структурой и неполной документацией, остаётся серьёзной проблемой для разработчиков. Существующие решения для суммаризации кода часто полагаются на одну языковую модель или ассистента вроде Claude Code, обрабатывая исходный код как плоский текст. При этом они не используют богатые взаимосвязи и иерархическую информацию внутри репозитория.
Исследователи предложили новый подход — фреймворк Agent4cs, который работает как мультиагентная система. Он выполняет суммаризацию снизу вверх, то есть от подпапок к более высоким уровням. В системе задействованы три агента: агент суммаризации создаёт надёжные краткие описания, агент извлечения ключевых слов активно находит критически важную информацию из подпапок, а агент контроля качества итеративно улучшает результаты с точки зрения читаемости, связности и полноты.
Эффективность Agent4cs оценили на семи передовых моделях. По сравнению с двумя структурированными подходами, использующими фрагменты кода, новая система повысила семантическую согласованность на всех уровнях папок в среднем на 8%. Кроме того, тестирование на реальных наборах данных показало прирост нормализованного коэффициента покрытия ключевых слов до 38% относительно тех же базовых методов.
Таким образом, Agent4cs демонстрирует, что учёт иерархической структуры и разделение задач между специализированными агентами позволяет значительно улучшить качество автоматической суммаризации кода. Это может упростить работу с крупными проектами, особенно в условиях плохой документации или запутанного кода.



