Anthropic: ИИ-агенты отлично пишут код, но в биологии спотыкаются из-за «узких улиц» данных

Компания Anthropic, разработчик языковой модели Claude, выпустила анализ, объясняющий, почему ИИ-агенты показывают высокую эффективность в программировании, но буксуют в биологических задачах. Ответ оказался не в уме агента, а в качестве и организации данных.
Авторы сравнили ситуацию с ездой на автомобиле по старинному городу, построенному до эпохи машин: улочки живописные, но узкие и извилистые. Программная инфраструктура изначально проектировалась с учётом автоматизации — версионирование кода, документированные API, пакетные менеджеры. Биоинформатика же осталась лоскутным набором баз данных, каждая со своими форматами и идентификаторами, с одноразовыми скриптами.
В программировании ИИ-агенты легко интегрируются: есть чёткие интерфейсы, стандартные форматы, инструменты для тестирования и сборки. Агенты могут читать документацию, писать код, запускать тесты и исправлять ошибки. В биологии же часто требуются уникальные, неповторяемые процедуры обработки данных, а сами данные разрознены по множеству репозиториев.
Anthropic отмечает, что проблема не в ограничениях самих моделей, а в том, как организована информация. Биологические базы данных часто не имеют единого АPI, а форматы различаются от лаборатории к лаборатории. Это затрудняет обучение агентов на масштабных данных.
Решение, по мнению специалистов, — в унификации и стандартизации биологических данных. Если инфраструктура станет такой же удобной для «машинного» восприятия, как в IT, ИИ-агенты смогут эффективнее помогать в научных открытиях. Пока же их потенциал в биологии остаётся недоиспользованным.
Анализ Anthropic подчёркивает важность данных и инфраструктуры: без качественных «рельсов» даже самые умные алгоритмы не поедут. Вопрос, насколько быстро научное сообщество сможет перестроить свои рабочие процессы, остаётся открытым.







