05.11.2025 Новости, Искусственный интеллектНовое исследование свидетельствует об очень низком уровне готовности агентов искусственного интеллекта к выполнению реальных задач, сообщает портал The Neuron. Ажиотаж: ИИ-агенты автоматизируют все рабочие процессы! Заменят фрилансеров! Будут выполнять сложные задачи от начала до конца! Реальность: жалкие 2-3% выполненных задач. Scale AI и CAIS только что опубликовали Remote Labor Index — тестирование, в котором ИИ-агенты пытались выполнить реальные задачи фрилансеров. Самая эффективная модель заработала всего 1810 долл. из 143 991 долл. доступной работы, выполнив лишь 2-3% заданий. #IMAGE_233692# Этот тест — столь необходимая проверка реальности для отраслей, тратящих невообразимые миллиарды, как злодеи из фильмов о Бонде, на гипотезу, что ИИ автоматизирует всю работу. И он позволил получить полезные данные. Исследователи протестировали реальные задачи с фриланс-платформ. Не игрушечные проблемы или академические тесты, а реальные задания, за выполнение которых людям платят: написание текстов, исследования, ввод данных и дизайнерские задачи. С чем агенты испытывают трудности: • многоэтапные рабочие процессы с неясными передачами; • неясные требования, которые мы, люди, уточняем в ходе разговора; • задачи, требующие суждения и контекста; • работа, требующая итерации и обратной связи с клиентом. Что реально могут делать агенты: в производственных средах небольшие точно настроенные модели хорошо справляются с повседневными повторяющимися задачами, а более крупные модели ...
читать далее.