27.03.2026 Экспертиза, Искусственный интеллектСогласно прогнозу аналитической компании Gartner, к 2030 г. получение выводов искусственного интеллекта (инференс) с помощью большой языковой модели (LLM) с одним триллионом параметров будет обходиться поставщикам генеративного ИИ (GenAI) более чем на 90% дешевле, чем в 2025-м. ИИ-токены — это единицы данных, которые обрабатывают модели GenAI. Для целей данного анализа токен представляет собой 3,5 байта данных, или приблизительно 4 символа. «Это снижение затрат будет обусловлено сочетанием улучшений в области эффективности полупроводников и инфраструктуры, инноваций в дизайне моделей, более высокой степени использования чипов, растущего применения специализированных кремниевых чипов для инференса и применения периферийных устройств для конкретных сценариев использования», — сказал Уилл Соммер, старший директор-аналитик Gartner. На основе этих тенденций Gartner прогнозирует, что к 2030 г. LLM будут в 100 раз более экономически эффективными, чем самые ранние модели аналогичного размера, разработанные в 2022 г. Результаты прогнозного моделирования разделены на два набора сценариев для полупроводниковых технологий: • «передовые» (frontier) сценарии: работа моделей основана на новейших передовых чипах; • «комбинированные» (legacy blend) сценарии: работа моделей основана на репрезентативном сочетании доступных полупроводников, сопоставленном с прогнозами Gartner. Ожидаемые затраты в «комбинированных» сценариях значительно выше, чем в «передовых» сценариях, учитывая их меньшую ...
читать далее.