29.10.2002 Новости В настоящее время перспективным направлением становится разработка электронных архивов, обеспечивающих хранение любой полнотекстовой информации, включая различные графические элементы, таблицы и формулы.При этом популярность приобретают методы text mining и data mining - выявление связей данных в информационном массиве.Именно по такому пути решили пойти ГНПП “Гранит-Центр”, консалтинговая группа “ТЕРМИКА” и редакция компьютерного еженедельника PC Week/RE, объединив свои программные и информационные разработки в единый совместный проект.С 1995 г. электронная версия PC Week/RE ведется консалтинговой группой “ТЕРМИКА” в среде информационной системы “Кодекс”.В течение своего “электронного” существования издание накопило огромный информационный массив материалов - тексты, таблицы, рисунки, графики, формулы, который можно рассматривать и как своеобразный плацдарм для проведения испытаний различных электронных архивов, и как поле “добычи текстовых данных” (text mining) для выявления многих интересных закономерностей и динамичных параметров (таких, например, как изменение во времени освещаемости одной и той же темы, профессиональная “плодовитость” того или иного автора, PR-активность участников компьютерного рынка и многое другое).Отправной точкой нового проекта стало успешное выполнение в июне 2002 г. работ по переносу архива электронной версии еженедельника PC Week/RE в хранилище электронных документов (“Гран-Хэд”) на базе технологии SQL Document Engine, разработанное ГНПП ...
читать далее.