03.07.2012 Экспертиза, Идеи и практики автоматизацииC момента своего возникновения в середине 90-х годов отрасль хранилищ данных и бизнес-аналитики смогла накопить большой опыт и разработать набор оптимальных методик и рекомендаций (best practice). Хотя не все заказчики подходили к этой тематике равнозначно требовательно, общее состояние наработанных методик и практик, связанных с управлением данными (качеством данных, управлением жизненным циклом данных, безопасностью и приватностью данных), достигло к настоящему времени достаточно зрелого уровня. Однако с возникновением феномена больших данных и появлением новых платформ разработки аналитических приложений, поддерживающих работы с информацией самого разного типа (таких, как Hadoop), появился очевидный вопрос — актуально ли применение этих накопленных методик в новых условиях? По общему признанию, не все варианты применения Hadoop были предназначены для аналитиков, однако, возможно, трудности с ранним внедрением этой платформы заслуживают их внимания. Проблема приобретает значительную остроту, если проанализировать, как большинство крупнейших ИТ-поставщиков платформ данных позиционировали Hadoop: EMC Greenplum, HP Vertica, Teradata Aster Vertica и другие рисуют картину, в которой Hadoop является лишь расширением вашего [SQL] корпоративного хранилища данных. Отсюда вытекает следующий вопрос: если Hadoop представляет собой расширение вашего хранилища данных или платформы бизнес-аналитики, следует ли применять прежние методики управления данными? Мы фокусируем наши ...
читать далее.