06.02.1996 Новости Тестирование Непосредственным поводом к написанию этой статьи послужила публикация в "Мире ПК" (12/95) "Ой, гляди, она читает". В лучшем стиле тестовых лабораторий компьютерных журналов были проведены испытания трех российских программ распознавания печатного текста (OCR) и оценено качество этого распознавания. Главная мысль, которую я хочу донести до читателя этой статьи, - качество распознавания (в определенных пределах) никакого значения не имеет. Это утверждение может показаться крамольным, но давайте задумаемся: что такое 99% распознавания? Это одна неправильная буква из ста, одно неправильное слово из ста или один неправильный документ из ста? Разница таких оценок существенна, а многие ли знают, какая именно применяется? Мне упомянутое тестирование напомнило детские игры во дворе, когда правила меняются по ходу игры, но никого это особенно и не волнует, поскольку победа в игре не является главной целью. Но давайте по порядку. Хочется еще раз процитировать и прокомментировать замечательную фразу Владимира Арлазарова: "Сегодня задача распознавания гладких текстов решена!" Обсуждению этого высказывания в "Мире ПК" посвящена целая врезка, где его смысл окончательно смазан не относящимися к делу комментариями. А смысл этот, как я понимаю, таков. Как научная задача распознавание текстов еще стоит на повестке дня, но как практическая она решена. Иными словами, дополнительное улучшение качества распознавания не будет иметь никакого ...
читать далее.