23.05.2000 НовостиРечевые технологии - область, в которой трудно ожидать чудес даже на выставке крупнейшего масштаба. Связанные с речью вопросы слишком сложны для того, чтобы давать повод к сенсациям; авторы громких сообщений на эту тему традиционно быстро оказываются в неловком положении. От бодрых математических выкладок речевая тематика уводит разработчика в дебри медицинских и психологических проблем, плавно переходящих в глобальные философские вопросы. Две ключевые задачи распознавания речи - достижение стопроцентной точности на ограниченном наборе команд хотя бы для одного дикторского голоса и независимое от диктора распознавание произвольной слитной речи с приемлемым качеством - не решены, несмотря на почти полувековую историю их разработки. Более того, существуют сомнения в принципиальной решаемости обеих задач, поскольку даже человек не всегда может стопроцентно распознать речь собеседника. Если еще относительно недавно речь рассматривалась как сигнал в диапазоне примерно от 300 до 3500 Гц, обладающий рядом характерных свойств (например, наличием пауз между словами), то с точки зрения современных технологий речь - это прежде всего сигнал, исполненный смысла. Нового подхода требуют не только речевое распознавание и синтез, но даже, как оказалось, такая сугубо техническая задача, как сжатие речи.Незадолго до выставки было объявлено о слиянии компаний Dragon Systems и Lernout&Hauspie (L&H). Теперь мировая тройка технологических лидеров, обладающих средствами распознавания ...
читать далее.