20.05.2025 Экспертиза, Безопасность, Искусственный интеллектИсследование Microsoft показало, что на ликвидацию последствий инцидентов в облачных сервисах генеративного ИИ (GenAI) уходит значительно больше времени, чем в других сервисах, сообщает портал The New Stack. Облачные GenAI-сервисы уникальны тем, что предъявляют высокие требования к аппаратному обеспечению, а также к вычислительным ресурсам, работающим на его основе. Однако, несмотря на необходимость обеспечения надежности, исследований на эту тему практически не проводилось, как и на тему управления инцидентами в таких сервисах. Поэтому семь исследователей Microsoft (пять из США и двое из Китая) объединились с еще тремя исследователями из китайских университетов и двумя из Иллинойского университета Урбана-Шампейн и подготовили так называемое «комплексное исследование инцидентов с облачными сервисами GenAI» (все они взяты из практики Microsoft), посвященное изучению «симптомов, основных причин и стратегий их устранения». Их вывод? «Как и в любом крупномасштабном облачном сервисе, в облачных сервисах GenAI неизбежны сбои», — отмечают авторы. Но с точки зрения инфраструктуры эти сервисы действительно отличаются от других. GenAI уникален, и «понимание характеристик этих инцидентов, включая обнаружение, сортировку, диагностику и смягчение последствий, имеет решающее значение для повышения качества облачных сервисов GenAI». Четыре года после выхода GPT-3 Используя данные из системы управления инцидентами Microsoft за четыре года, исследователи проанализировали производственные ...
читать далее.