06.10.1998 НовостиREDLAB представляет “Русский текст”Александр Ливеровский23 сентября компании REDLAB и Informix провели презентацию нового продукта “Рубрикатор” из серии продуктов “Русский Текст” и модуля расширения Data Blade “Поиск” объектно-реляционной СУБД Informix Dynamic Server.Рубрикатор позволяет производить семантический анализ текста и разбивать документы по заданным тематическим рубрикам, а также выполнять их поиск по смысловому содержанию. Рубрики могут быть организованы как в виде дерева, так и линейно, а создаваться могут вручную путем подбора ключевых слов, фраз и словосочетаний с приписанными им весами или путем автоматического анализа содержания 10 - 15 документов. Возможна ручная корректировка экспертом в предметной области. Как показывает практика, эксперту требуется около 30 мин на обработку одной рубрики. Генеральный директор REDLAB Игорь Терехов представляет “Русский текст”Распределение документов по рубрикам выполняется с использованием морфологического и частотного словарей, а также словаря синонимов.В продукт встроена возможность добавления новой рубрики в уже созданную базу документов. При этом реорганизация базы из 1 млн. документов объемом 8 Гб занимает несколько часов.Кроме того, компании представили новую версию модуля полнотекстового поиска по русскоязычным документам “Русский текст - Поиск”, расширяющего возможности объектно-реляционной СУБД Informix. Первая его версия вышла в 1997 г. Это был первый российский модуль DataBlade, сертифицированный компанией ...
читать далее.