Актуальные темы
IT Channel News
itWeek
Intelligent Enterprise/RE
Бестселлеры ИТ-рынка
BYTE/Россия

Спецпредложения

Уважаемые партнеры! Приглашаем принять участие в акции «Энергия выгоды». Закупая в Merlion ИБП и батарейные модули Ippon, вы получите бонус до 9%. Период действия акции: 05.03-04.04.2026 Описание: - Программа накопительная. Закупки суммируются и по итогам месяца начисляются бонусы. - ...
Уважаемые партнеры! Treolan приглашает принять участие в промопрограмме по клиентским решениям «Гравитон» для новых партнеров. Закупая оборудование «Гравитон» в Treolan, вы накапливаете баллы, которые сможете обменять на подарочные сертификаты на ваш выбор. Для участия в программе необходимо ...
Уважаемые партнеры! Приглашаем вас принять участие в маркетинговой акции «Бонус-сборка». Закупайте комплектующие для компьютеров в период действия акции и получите бонус 1 500 руб. за каждые 30 000 руб. отгрузок. В акции участвуют компьютерные комплектующие брендов: Bloody, Kingprice, Digma, GMNG ...
Уважаемые партнеры! Приглашаем вас принять участие в промопрограмме на всю линейку продукции Patriot. Закупая оборудование Patriot, вы накапливаете бонусы. По итогам акции накопленные бонусы выдаются в виде подарочных сертификатов различных розничных сетей по вашему выбору
Покупайте продукцию GP в период акции и получайте бонусы по схеме: Сумма отгрузки, в руб. Фиксированный бонус, в руб. 50 000 – 149 999 - 3 000 руб. 150 000 – 299 999 - 8 000 руб. 300 000 – 399 999 - 15 000 руб. более 400 000 - 25 000 руб. Регистрация обязательна! Чтобы получить ...
12345Все

Языковые модели на периферии как способ разгрузить дата-центры

27.09.2024  Экспертиза, Интернет, Искусственный интеллект, Мобильные и беспроводные решения

Локальные системы искусственного интеллекта, известные как «LLMs on the edge» (большие языковые модели на периферии), могут помочь снизить нагрузку на дата-центры, но может пройти некоторое время, прежде чем этот подход станет мейнстримом, отмечают опрошенные порталом Data Center Knowledge эксперты. Проблема, которую представляет собой ИИ для дата-центров, освещается достаточно широко. Одним из способов снизить нагрузку является использование LLM на периферии, то есть позволить системам ИИ работать на ПК, планшетах, ноутбуках, смартфонах и других устройствах. Очевидные преимущества LLM на периферии включают в себя снижение стоимости обучения LLM, уменьшение задержки при запросах к LLM, повышение конфиденциальности пользователей и надежности. Если такие локальные решения смогут снизить нагрузку на дата-центры за счет уменьшения требований к вычислениям, то смогут устранить необходимость в многогигаваттных ЦОД-фабриках. Но действительно ли такой подход осуществим? В связи с расширяющейся дискуссией о переносе LLM, лежащих в основе генеративного ИИ (GenAI), на периферию, мы рассмотрим, действительно ли такой перенос может снизить нагрузку на дата-центры. Смартфоны прокладывают путь периферийному ИИ Майкл Азофф, главный аналитик практики исследований облачных вычислений и дата-центров компании Omdia, говорит, что наиболее быстро развивающийся сценарий использования ИИ на периферии — это легкие LLM на смартфонах. Huawei разработала различные варианты размеров своей LLM Pangu 5.0 ... читать далее.

Рекомендовано к прочтению


Исследование: GenAI приносит предприятиям прибыль, несмотря на проблемы с данными
Новое исследование Snowflake «The ROI of Gen AI and Agents 2026» показывает, что генеративный искусственный интеллект (GenAI), похоже, довольно хорошо работает в корпоративной среде — вопреки другим отчетам, которые либо указывают на ажиотаж, либо на упорный скептицизм. Подавляющее большинство ...

Навикон: в 2026 году более 80% ключевых российских BI-решений будут применять элементы ИИ
Эксперты компании Навикон обозначили основные тренды, которые будут формировать российский рынок бизнес-аналитики в 2026 году. К ним относятся повсеместное внедрение искусственного интеллекта, усиление фокуса на безопасности и доверии к платформам, а также растущие требования к визуальной ...

Почему для масштабирования ИИ необходимы высокопроизводительные сети
Предприятиям необходимо обеспечить согласование производительности сети с требованиями различных функций искусственного интеллекта, пишет на портале InformationWeek Брайан Уошберн, главный аналитик Omdia по B2B-решениям для телекома. Нравится это или нет, но внедрение ИИ уже идет полным ходом ...

Правительство создало подкомиссию по развитию искусственного интеллекта
В России начала работу правительственная подкомиссия по развитию и внедрению технологий искусственного интеллекта. Первое заседание нового органа провёл заместитель председателя правительства — руководитель аппарата правительства Дмитрий Григоренко. Подкомиссия была создана распоряжением ...

Forrester: “умные” здания — это уже не просто про возвращение в офис
Сегодняшние дискуссии о рабочем месте вышли за рамки обсуждения темы возвращения в офис. Сейчас важно то, насколько эффективна физическая среда — насколько хорошо она обеспечивает продуктивность, контроль затрат, соответствие требованиям устойчивого развития и нормативным требованиям, защиту ...
     
Исследование: GenAI приносит предприятиям прибыль, несмотря на проблемы с данными
Новое исследование Snowflake «The ROI of Gen AI and Agents 2026» показывает, что генеративный искусственный интеллект (GenAI), похоже, довольно хорошо работает в корпоративной среде — вопреки другим отчетам, которые либо указывают на ажиотаж, либо на упорный скептицизм. Подавляющее большинство ...

TCO без самообмана: почему цена старта не равна стоимости владения
Термин TCO (Total Cost of Ownership, совокупная стоимость владения) в ИТ-сфере знаком почти всем. Однако на практике его часто сводят к «цене входа» — стоимости железа или облака, лицензий, внедрения — и на этой основе пытаются сравнивать экономику решений. А потом система выходит в продакшен ...

«Лаборатория Касперского» усилила безопасность контейнерных приложений СберФакторинг с помощью Kaspersky Container Security
СберФакторинг, дочерняя компания Сбера, внедрила Kaspersky Container Security для повышения уровня защиты контейнерных приложений на всех этапах их жизненного цикла — от разработки до эксплуатации. Решение позволило компании усилить контроль над уязвимостями, повысить прозрачность процессов и ...

РЕЛЭКС перезагружает систему «Эталон». От сете-центризма в Цифрогенез
ИТ-компания РЕЛЭКС совместно с научной компанией «ГиперГрафГрупп» (резидент ИНТЦ «Сириус») объявили о завершении первого этапа масштабного проекта по модернизации корпоративной информационной системы «Эталон» и ребрендингу её платформы «Цифрогенез». Созданная в далеком 1992 году, эта система успела ...

METRO запустила собственную платформу управления клиентским опытом MPULSE
Компания METRO завершила переход на собственную цифровую платформу MPULSE, предназначенную для измерения и анализа клиентского опыта. Новая система позволяет получать более полную и детальную обратную связь от покупателей и оперативно реагировать на проблемы в конкретных точках клиентского пути — ...

Лидеры читательского рейтинга

Подборка по дате

Март 2026
ПнВтСрЧтПтСбВс
      1
2345678
9101112131415
16171819202122
23242526272829
3031     

© 1991–2026 ITRN (Российская служба ИТ-новостей). Политика конфиденциальности персональных данных. 109147 г. Москва, ул. Марксистская, 34, строение 10. Телефон: +7 495 974-22-60. Факс: +7 495 974-22-63. Электропочта: itrn@itrn.ru.
Версия 21.2.  Создание сайта — студия iMake.