Актуальные темы
IT Channel News
itWeek
Intelligent Enterprise/RE
Бестселлеры ИТ-рынка
BYTE/Россия

Спецпредложения

До 31 марта покупайте любые товары Patriot и получайте оборотный бонус 5% на сумму перевыполнения плана закупки! Для участия в программе необходимо иметь регистрацию в B2B eCom, за подробной информацией по условиям данной программы обращайтесь к менеджерам АБСОЛЮТ
Уважаемые партнеры! Treolan приглашает вас принять участие в маркетинговой программе. Закупая участвующие в акции ноутбуки, вы получаете сумку для ноутбука IRBIS в подарок. Для участия в программе необходимо зарегистрироваться
В течение всего гарантийного срока, при обращении в наш сервисный центр, вышедший из строя ИБП CyberPower до 3 КВт включительно, будет заменен на новое устройство в день обращения (сумма восстановлена на балансе). Акция действует до конца 2026 г
Получи кешбэк на счет при покупке товаров EasyPrint и Т2: Сумма отгрузки, в руб. и % кешбэка: от 10 000 до 50 000 руб. - 2% от 50 001 до 75 000 руб. - 4% от 75 001 руб. и выше - 5% Чтобы получить приз, вам необходимо выполнить условия программы, а также зарегистрироваться, указав ...
Закупайте продукцию брендов BEKO, Indesit, Hotpoint, Stinol за период проведения программы и получайте главный приз – поездку на космодром Байконур на двоих! Станьте очевидцем запуска ТГК «Прогресс МС- 36»
12345Все

Vision Language Models: что нужно знать разработчику о визуально-языковых моделях

29.05.2025  Экспертиза, Искусственный интеллект

Визуально-языковые модели (Vision Language Models, VLM) могут использоваться в широком спектре приложений, требующих синтеза визуальной и текстовой информации, сообщает портал The New Stack. Недавнее появление мультимодального искусственного интеллекта означает, что системы ИИ становятся все более многоцелевыми по своей природе, поскольку они одновременно обрабатывают и генерируют различные модальности данных — включая текст, изображения, аудио и видео — в интегрированном виде. Одним из наиболее универсальных подмножеств мультимодального ИИ являются VLM, которые объединяют возможности обработки естественного языка (NLP) и компьютерного зрения (CV) для решения продвинутых визуально-языковых задач — таких, как создание текстовых описаний изображений, ответы на вопросы по изображениям, поиск и генерация изображения по тексту. Архитектура визуально-языковых моделей VLM способны обрабатывать как текстовые, так и графические данные, при этом часть модели, связанная с компьютерным зрением, анализирует и интерпретирует визуальные данные, а часть модели, связанная с обработкой естественного языка, анализирует и понимает текст. В некотором смысле, можно представить VLM как поливалентные большие языковые модели (LLM), способные понимать как слова, так и изображения. В целом, VLM состоят из следующих основных компонентов: Визуальный кодировщик. Эта часть извлекает визуальные сигналы, такие как формы, узоры и цвета, из визуальных данных и преобразует их в векторные вложения — числовые ... читать далее.

Рекомендовано к прочтению


Deloitte: эффективность корпоративного применения ИИ отстает от темпов его внедрения
Новый отчет Deloitte «State of AI 2026» показывает, что внедрение искусственного интеллекта предприятиями продолжает стремительно ускоряться, однако инфраструктура данных, управление и перестройка кадрового потенциала значительно отстают. Хотя предприятия сохраняют стратегическую уверенность, они ...

Сколково поддержал ИИ для цифровой архитектуры
Уральская ИТ-компания Inpad.store (НПК «Микроструктура») получила грант Сколково на доращивание технологии в размере 10 млн рублей. Грантовая поддержка будет направлена на развитие ключевого функционала цифровой платформы UrbanSketch.pro (часть проекта «БыстроТЭПы») — генерацию сценариев застройки ...

Без ITIL: почему CIO отказываются от традиционного управления сервисами
По мере ускорения процессов изменения бизнес-требований жесткие ИТ-структуры все больше тормозят развитие организаций. Опрошенные порталом InformationWeek эксперты рассказывают о том, что заменяет традиционные модели предоставления сервисов и почему. Жесткие ИТ-структуры раньше были лучшим способом ...

Сбер представил корпоративную платформу для создания ИИ-агентов
Сбер предоставил доступ к корпоративной платформе GigaChat Enterprise (ГигаЧат Бизнес) — с ней компании могут создавать персонализированных ИИ-агентов. Полностью российское решение настраивается под конкретные запросы и потребности бизнеса. Это помогает сотрудникам автоматизировать рутинные ...

Настоящий прорыв в робототехнике обеспечат базовые модели, а не аппаратное обеспечение
Базовые модели физического искусственного интеллекта выходят за рамки чат-ботов и обеспечивают работу автономной робототехники в реальном мире. Портал The New Stack рассказывает о том, какую роль при этом играют LBM, VLA и периферийные вычисления. Физический ИИ, также известный как воплощенный ИИ ...
     
Deloitte: эффективность корпоративного применения ИИ отстает от темпов его внедрения
Новый отчет Deloitte «State of AI 2026» показывает, что внедрение искусственного интеллекта предприятиями продолжает стремительно ускоряться, однако инфраструктура данных, управление и перестройка кадрового потенциала значительно отстают. Хотя предприятия сохраняют стратегическую уверенность, они ...

Компания «Маск Сэйф» защитила ИТ-инфраструктуру с помощью SIEM от «СёрчИнформ»
Компания «Маск Сэйф» внедрила SIEM-систему от «СёрчИнформ» для выявления инцидентов и управления событиями информационной безопасности. Решение развернули на всей ИТ-инфраструктуре в сентябре 2025 года после пилотного проекта. В выборе SIEM заказчик ориентировался на следующие параметры: наличие ...

Orange Process увеличила конверсию продаж с помощью BPMSoft
ИТ-компания Orange Process автоматизировала продажи с помощью CRM-системы на базе low-code платформы BPMSoft (ИТ-холдинг LANSOFT). Решение позволило систематизировать работу с клиентской базой, снизить нагрузку на сотрудников и создать управляемый канал привлечения заказчиков. Orange Process — ...

Grandbazar перешел с с зарубежного сервиса на российскую SDLC-систему SimpleOne
Grandbazar (платформа корпоративной и клиентской лояльности корпорации ITG) перешел с зарубежного сервиса ClickUp на российскую систему управления разработкой ПО SimpleOne SDLC и этим восстановил полноценную работу Scrum-команд. SDLC-платформа обеспечила настройку спринтов и интеграцию с GitLab ...

Компания «ЭлНетМед» запустила подписание документов с пациентами через мессенджер MAX
Компания «ЭлНетМед», разработчик интеграционной платформы N3.Health, запустила подписание электронных документов через национальный мессенджер MAX в рамках собственного сервиса N3.Health СЭП, сервис электронного подписания. Для пациентов доступны разные варианты взаимодействия — через чат-бот или ...

Лидеры читательского рейтинга

Подборка по дате

Март 2026
ПнВтСрЧтПтСбВс
      1
2345678
9101112131415
16171819202122
23242526272829
3031     

© 1991–2026 ITRN (Российская служба ИТ-новостей). 109147 г. Москва, ул. Марксистская, 34, строение 10. Телефон: +7 495 974-22-60. Факс: +7 495 974-22-63. Электропочта: itrn@itrn.ru.
Версия 21.2.  Создание сайта — студия iMake.