Актуальные темы
IT Channel News
itWeek
Intelligent Enterprise/RE
Бестселлеры ИТ-рынка
BYTE/Россия

Спецпредложения

До 31 марта покупайте любые товары Patriot и получайте оборотный бонус 5% на сумму перевыполнения плана закупки! Для участия в программе необходимо иметь регистрацию в B2B eCom, за подробной информацией по условиям данной программы обращайтесь к менеджерам АБСОЛЮТ
Уважаемые партнеры! Treolan приглашает вас принять участие в маркетинговой программе. Закупая участвующие в акции ноутбуки, вы получаете сумку для ноутбука IRBIS в подарок. Для участия в программе необходимо зарегистрироваться
В течение всего гарантийного срока, при обращении в наш сервисный центр, вышедший из строя ИБП CyberPower до 3 КВт включительно, будет заменен на новое устройство в день обращения (сумма восстановлена на балансе). Акция действует до конца 2026 г
Получи кешбэк на счет при покупке товаров EasyPrint и Т2: Сумма отгрузки, в руб. и % кешбэка: от 10 000 до 50 000 руб. - 2% от 50 001 до 75 000 руб. - 4% от 75 001 руб. и выше - 5% Чтобы получить приз, вам необходимо выполнить условия программы, а также зарегистрироваться, указав ...
Закупайте продукцию брендов BEKO, Indesit, Hotpoint, Stinol за период проведения программы и получайте главный приз – поездку на космодром Байконур на двоих! Станьте очевидцем запуска ТГК «Прогресс МС- 36»
12345Все

Шесть фреймворков для эффективного инференса LLM

24.09.2025  Экспертиза, Искусственный интеллект, Менеджмент

Направление вывода (инференс, генерация ответов на запросы пользователей) на основе больших языковых моделей (LLM) стремительно развивается, что обусловлено потребностью в низкой задержке, высокой пропускной способности и гибком развертывании на разнородном оборудовании. В результате появился разнообразный набор фреймворков, каждый из которых предлагает уникальные оптимизации для масштабирования, производительности и управления операциями, пишет на портале The New Stack Джанакирам МСВ, главный аналитик компании Janakiram & Associates. От эффективного использования памяти PagedAttention и непрерывной обработки запросов (continuous batching) vLLM до готовой к производству оркестровки Hugging Face TGI и дезагрегированной архитектуры обслуживания NVIDIA Dynamo, экосистема теперь охватывает платформы, ориентированные на исследования, такие как SGLang, собственные стеки Kubernetes, такие как llm-d, и корпоративные плоскости управления, такие как AIBrix. В этой статье подробно рассматриваются эти фреймворки, освещаются их архитектурные решения, технические инновации и пригодность для различных реальных сценариев развертывания. vLLM: оптимизированный инференс с PagedAttention vLLM — это высокооптимизированный механизм вывода для LLM, созданный в Калифорнийском университете в Беркли и в настоящее время развиваемый международным сообществом. Фреймворк основан на механизме PagedAttention, который обеспечивает более эффективное и детальное управление кэш-памятью с парами ... читать далее.

Рекомендовано к прочтению


НАФИ и «Ингосстрах»: 43% россиян готовы отказаться от ИИ-технологий навсегда
8 из 10 россиян положительно относятся к внедрению технологий в повседневную жизнь. При этом 75% считают, что постоянное использование смартфонов вызывает зависимость, 54% — что ИИ-технологии обесценивают человеческий труд. Больше трети (37%) с разной регулярностью прибегают к «цифровому детоксу» ...

«ОБИТ» помогает автоматизировать контакт-центр СТД «Петрович» с помощью искусственного интеллекта
Оператор ИТ-решений «ОБИТ» реализовал проект по интеллектуальной аналитике клиентских коммуникаций на базе речевой аналитики с подключением нейросети для ритейлера СТД «Петрович». Точность составила около 90%. СТД «Петрович» — один из крупнейших российских торговых сетей, которая специализируется ...

Deloitte: эффективность корпоративного применения ИИ отстает от темпов его внедрения
Новый отчет Deloitte «State of AI 2026» показывает, что внедрение искусственного интеллекта предприятиями продолжает стремительно ускоряться, однако инфраструктура данных, управление и перестройка кадрового потенциала значительно отстают. Хотя предприятия сохраняют стратегическую уверенность, они ...

Сколково поддержал ИИ для цифровой архитектуры
Уральская ИТ-компания Inpad.store (НПК «Микроструктура») получила грант Сколково на доращивание технологии в размере 10 млн рублей. Грантовая поддержка будет направлена на развитие ключевого функционала цифровой платформы UrbanSketch.pro (часть проекта «БыстроТЭПы») — генерацию сценариев застройки ...

Без ITIL: почему CIO отказываются от традиционного управления сервисами
По мере ускорения процессов изменения бизнес-требований жесткие ИТ-структуры все больше тормозят развитие организаций. Опрошенные порталом InformationWeek эксперты рассказывают о том, что заменяет традиционные модели предоставления сервисов и почему. Жесткие ИТ-структуры раньше были лучшим способом ...
     
Deloitte: эффективность корпоративного применения ИИ отстает от темпов его внедрения
Новый отчет Deloitte «State of AI 2026» показывает, что внедрение искусственного интеллекта предприятиями продолжает стремительно ускоряться, однако инфраструктура данных, управление и перестройка кадрового потенциала значительно отстают. Хотя предприятия сохраняют стратегическую уверенность, они ...

Компания «Маск Сэйф» защитила ИТ-инфраструктуру с помощью SIEM от «СёрчИнформ»
Компания «Маск Сэйф» внедрила SIEM-систему от «СёрчИнформ» для выявления инцидентов и управления событиями информационной безопасности. Решение развернули на всей ИТ-инфраструктуре в сентябре 2025 года после пилотного проекта. В выборе SIEM заказчик ориентировался на следующие параметры: наличие ...

Orange Process увеличила конверсию продаж с помощью BPMSoft
ИТ-компания Orange Process автоматизировала продажи с помощью CRM-системы на базе low-code платформы BPMSoft (ИТ-холдинг LANSOFT). Решение позволило систематизировать работу с клиентской базой, снизить нагрузку на сотрудников и создать управляемый канал привлечения заказчиков. Orange Process — ...

Grandbazar перешел с с зарубежного сервиса на российскую SDLC-систему SimpleOne
Grandbazar (платформа корпоративной и клиентской лояльности корпорации ITG) перешел с зарубежного сервиса ClickUp на российскую систему управления разработкой ПО SimpleOne SDLC и этим восстановил полноценную работу Scrum-команд. SDLC-платформа обеспечила настройку спринтов и интеграцию с GitLab ...

Компания «ЭлНетМед» запустила подписание документов с пациентами через мессенджер MAX
Компания «ЭлНетМед», разработчик интеграционной платформы N3.Health, запустила подписание электронных документов через национальный мессенджер MAX в рамках собственного сервиса N3.Health СЭП, сервис электронного подписания. Для пациентов доступны разные варианты взаимодействия — через чат-бот или ...

Лидеры читательского рейтинга

Подборка по дате

Март 2026
ПнВтСрЧтПтСбВс
      1
2345678
9101112131415
16171819202122
23242526272829
3031     

© 1991–2026 ITRN (Российская служба ИТ-новостей). 109147 г. Москва, ул. Марксистская, 34, строение 10. Телефон: +7 495 974-22-60. Факс: +7 495 974-22-63. Электропочта: itrn@itrn.ru.
Версия 21.2.  Создание сайта — студия iMake.