31.03.2016 Новости, Открытый код/LinuxВ зависимости от типа намеченных исследований сегодня есть выбор среди нескольких платформ для бизнес-аналитики и больших данных. По оценкам экспертов, лидерство на рынке принадлежит Hadoop, прежде всего благодаря его возможностям исследовать данные практически без ограничений на объем. Проводимый с помощью Hadoop анализ легко масштабируется. Количество вычислительных узлов, используемых в расчетах, может исчисляться тысячами, совокупный объем привлекаемых данных может превышать 100 Пб. Помимо Hadoop для масштабных исследований можно также применять платформы, построенные на базе Spark или Mesos. Однако на рынке насчитается не так много компаний, которым требуются исследования таких масштабов. Остальным нужно что-то менее масштабное. Например, собирать операционную аналитику можно с помощью распределенных баз данных. Если же они вызывают трудности из-за сложности освоения, то можно остановить выбор на традиционных реляционных СУБД, таких как PostgreSQL или MySQL — при подходящих условиях они также приносят неплохие результаты. NoSQL и NewSQL Если масштаб планируемых исследований не настолько велик, и пользователю требуется решать оперативные аналитические задачи, связанные с изучением рыночных трендов и привлечением данных в реальном времени, то можно сделать выбор в пользу баз данных типа NoSQL: MongoDB, Cassandra и Couchbase. Их транзакционный механизм полностью переработан под новые условия. Теперь они хорошо удовлетворяют требованиям ACID, обеспечивают надежную ...
читать далее.