27.06.2022 Новости, Исследования и разработкиКомпания «Яндекс» представила выложенную в открытый доступ YaLM 100B – свою нейросеть для генерации и обработки текстов на русском и английском языках. Теперь ее могут использовать разработчики и исследователи со всего мира. YaLM 100В – самая большая GPT-подобная модель, находящаяся в свободном доступе. Она содержит 100 млрд параметров, больше, чем любая другая существующая модель для обработки русского языка. Это позволяет решать с ее помощью большой круг задач, связанных с обработкой естественного языка. Языковые модели из семейства YaLM определяют принцип построения текста и генерируют новые, опираясь на законы лингвистики и свои знания о мире. Например, они способны придумывать идеи для рекламных кампаний и слоганы. создавать описания товаров и видео, генерировать любые тексты (стихи, ответы, поздравления), а также классифицировать тексты по стилю речи. «Яндекс» использует нейросети YaLM более чем в 20 проектах, в том числе в Поиске и голосовом помощнике Алисе. Языковые модели помогают службе поддержки отвечать на обращения, генерируют рекламные объявления и описания сайтов (сниппеты). Нейросети YaLM также используются при подготовке быстрых ответов в Поиске. Модель обучали на суперкомпьютерах «Яндекса», в процессе обучения YaLM 100B обработала около 2 Тбайт текстов из открытых датасетов и из интернета на английском и русском языках. Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub. Как комментируют в «Яндекс Технологии» ...
читать далее.