09.02.2004 МненияРоберт Д. Кугель (robert.kugel@ventanaresearch.com) - вице-президент и директор по исследованиям компании Ventana Research в области управления финансовой производительностью. Чаще всего при определении "неструктурированной" информации больше говорится о том, чем она не является. Структурированные данные обычно представляют собой буквенно-цифровые значения, которые можно легко классифицировать по определенным атрибутам, зачастую являющимся общепринятыми для различных предприятий и отраслей. Имя, индекс, баланс счета, номер транзакции - вот типичные примеры структурированных данных. Неструктурированные данные не могут быть непосредственно помещены в структурированные базы данных иначе, чем в форме BLOB (binary large objects - бинарные объекты большого объема). Стандартными примерами неструктурированных данных являются файлы документов, электронные сообщения, аудиофайлы, цифровые изображения и видеоклипы. Хотя во всех таких файлах есть некоторая структура (например, в электронных сообщениях есть адрес, тема, "тело" письма и т. д.), обычно они хранятся в форме, не позволяющей осуществлять простую и логичную классификацию, в отличие от данных, полученных посредством ввода информации в электронные формы (стандартный способ ручного ввода структурированных данных), в результате вычислений или каких-либо других компьютерных транзакций, в процессе которых автоматически создаются наборы структурированной информации. Управление неструктурированной информацией ...
читать далее.