12.02.2002 НовостиАлександр Антонов, начальник отдела поисковых систем корпорации "Галактика" alexa@galaktika.ru Суть проблемы Информационный мир - это зеркало нашего, физического мира. Значит, изучая этот информационный мир, можно сделать ценные выводы. И, как и в реальном мире, преимущество получает тот, кто сможет узнать не только то, что общедоступно и лежит на поверхности, выражено явным образом. Огромные пласты знания рассеяны по тысячам документов, в каждом из которых скрыта крохотная частичка необходимой кому-то информации. В результате важные решения принимаются на основе недостаточных, неполных данных. По результатам исследования фирмы IBM, решения топ-менеджеров основаны только на 7% необходимой информации. При этом в целом недостатка в информации нет, многие говорят об "информационной усталости", популярен также термин "информационное загрязнение". А дело здесь в том, что довольно большая часть знания пребывает в скрытом, неявном виде. По этой причине ощутимая часть средств управления знаниями посвящена переводу знаний из их наиболее распространенной, неявной формы в явную. Только после этой процедуры с этими знаниями можно работать. Самая информативная и самая трудная для автоматического анализа составляющая информационного мира - собственно контент, т. е. текст, изложенный на обычном человеческом языке. В информационном мире все действия оставляют следы. Однако мало просто собрать гигабайты и терабайты информации. Найти среди следов нужный, выяснить, куда ...
читать далее.