16.03.2021 Новости, Исследования и разработкиКомпания «Наносемантика», резидент кластера информационных технологий фонда «Сколково», вышла на рынок распознавания речи, представив технологию NLab Speech. Она представляет собой набор нейросетевых алгоритмов обработки аудиосигналов и анализа текста, обученных и откалиброванных на большом количестве размеченных вручную речевых данных. Внедрение систем автоматического распознавания речи (ASR), отмечают в фонде «Сколково», способно облегчить и оптимизировать работу в различных сферах бизнеса. К примеру, голосовой помощник, наделенный речевыми возможностями высокого уровня и распознавания слов, заменяет десятки и сотни сотрудников колл-центра, что сокращает расходы компании на персонал и повышает скорость обслуживания клиентов. Медработники с помощью голосового заполнения документов смогут быстро составлять анамнезы, а люди с ограниченными возможностями за счет голосовых технологий улучшат качество своей жизни. Создание технологии заняло у «Наносемантики» более двух лет. Чтобы подготовить большой массив обучающих данных, команда разработала платформу для их разметки NLab Marker. C ее помощью данные преобразуются в формат, пригодный для обучения нейронных сетей. Нейронная сеть в NLab Speech, в отличие от человека, анализирует звуковой сигнал как изображение: каждому аудио сопоставляется его спектрограмма, после чего нейронная сеть переводит спектрограммы в текстовые предположения о том, что было произнесено в аудио. Наилучший вариант определяется при помощи языковой ...
читать далее.