02.02.2022 НовостиСбер объявил о том, что предоставляет разработчикам бесплатный доступ к программной библиотеке PyTorch-LifeStream, содержащей несколько алгоритмов построения эмбеддингов событийных данных. Инструмент может быть использован для подготовки различных массивов обезличенных данных (датасетов). Событийные данные могут представлять собой самые разные последовательности – истории посещений сайтов, истории покупок, событий в онлайн-играх и так далее. При этом сгенерированный на основе алгоритмов библиотеки эмбеддинг такой последовательности не будет содержать персональных данных. В библиотеке реализован алгоритм применения нейросетевого контрастного обучения к событийным данным, созданный и запатентованный в Лаборатории по искусственному интеллекту Сбера. Кроме того, в ней реализованы методы на основе сторонних научных публикаций, но адаптированные Сбером к событийным данным. Как отмечают в Сбере, недостаток очищенных, обезличенных и размеченных данных – один из главных барьеров для дальнейшего развития ИИ, создания новых продуктов и сервисов, которые смогут решать важные научные и социально значимые задачи. Свободный доступ к инструментам, которые позволяют готовить такие данные, – важное условие для преодоления барьера. Вывод библиотеки в паблик, считают в Сбере, ускорит разработку и внедрение систем ИИ в России. Ранее компания уже вывела в открытый доступ ...
читать далее.