24.10.2000 МненияИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ Как найти в Сети то что нужноСмысл и цели поиска. Объем содержимого Интернета удваивается каждые два месяца, а человек способен воспринимать не более 150 страниц дайджестов в час - отсюда очевидна потребность в средствах автоматизации поиска и отбора нужных материалов. Соответствующие программы на рынке имеются, но они пока обладают существенными недостатками. Дело в том, что из огромного количества академических исследований очень сложно выбрать наиболее подходящие для реализации в прикладном продукте. В этих исследованиях обычно сочетаются технологии нейронных сетей, разбора текста на базе правил, специализированные статистические методы. Все они подразумевают возможность самообучения системы.Развитие продуктов для автоматизации работы с Интернет- и корпоративным содержимым наиболее активно будет идти по следующим направлениям:- выделение смысла путем анализа лингвистических характеристик текста;- определение тематики материала (к какой группе из списка заданных документ относится - политике, программированию, спорту и т. д.);- отбор требуемой информации с помощью сложных смысловых фильтров;- составление аннотации документа;- подбор максимально подробной информации на заданную тему (задача, противоположная некоторым предыдущим: надо не дайджест подготовить, а отобрать хорошие статьи, которые помогут в работе аналитиков, ученых, других узких специалистов);- кластеризация документов (составление виртуальных библиотек);- формирование смысловых связей ...
читать далее.