10.10.2024 Новости, Искусственный интеллект«Яндекс» представил новое поколение визуальной нейросети — YandexART 2.0. Модель научилась создавать надписи прямо на изображениях, придерживаться нескольких стилей на одной картинке, располагать объекты в пространстве и относительно друг друга более естественно и учитывать при генерации больше деталей из текстового запроса. Пользователи могут применять новые возможности, чтобы развивать своё дело, например: создать логотип для бренда, этикетку продукта, иллюстрации для сайта и постов в социальных сетях, а компании — чтобы повысить эффективность рекламных и маркетинговых кампаний. В основу YandexART 2.0 легла собственная разработка компании — новая гибридная архитектура модели, которая сочетает качество работы свёрточной и трансформерной нейросетей. Свёрточная модель работает по принципу человеческого глаза и выявляет на картинке важные признаки — края, текстуры и формы. При этом нейросеть с такой архитектурой не умеет учитывать длинный контекст (поэтому ей трудно справляться с большим количеством деталей в промтах), зато это умеет трансформер. Объединение двух этих моделей в YandexART 2.0 позволило ей точнее следовать текстовым запросам. Так, теперь она умеет придерживаться нескольких стилей в одном изображении и может, например, сгенерировать фотореалистичную банку лимонада, на этикетке которой будет аниме-персонаж. YandexART обучалась на сотнях миллионов пар картинок и текстовых описаний к ним. Чтобы повысить качество этих текстов и сделать их более точными, «Яндекс» ...
читать далее.