22.11.2013 НовостиВ мире больших данных тренд слияния реляционных и NoSQL-подходов проявился уже давно. Во многие дистрибутивы Hadoop помимо различных NoSQL-СУБД включены “прослойки” для SQL-запросов, а поставщики “тяжёлых” РСУБД расширяют их поддержкой, как минимум, слабо структурированных данных и JSON-документов. Инновационная гибридная архитектура Flex Zone в рамках аналитической платформы Vertica представлена компанией HP. Она записывает бессхемные данные (всевозможные автоматически сгенерированные отчёты, логи и т. д.) в реляционные таблицы Vertica в классическом NoSQL-формате ключ—значение, откуда их можно извлекать либо SQL-запросами, либо непосредственно из BI-движков. Подобные подходы, в принципе, уже не раз успешно реализовывались, казалось бы, что тут можно придумать нового? Сильная сторона Flex Zone в том, что само “значение” может на лету интерпретироваться как набор реляционных столбцов (полей записи) — например, если данные в хранимой текстовой строке разделены выбранными символами (пробелы, точки с запятыми и др.). Таким образом, к подобной информации можно обращаться, применяя всю мощь SQL-запросов, а при необходимости обрабатывать её NoSQL-средствами как “сырые” сведения и легко транслировать в NoSQL-СУБД HBase или Cassandra. Стремление обеспечить реляционный анализ слабо структурированных данных понятно: в обучение SQL инвестированы огромные ресурсы, а в мире NoSQL единых стандартов нет и пока не предвидится. На ...
читать далее.