08.04.2016 ЭкспертизаКогда для Apache Hadoop и Spark обеспечена хорошая аппаратная поддержка, аналитики имеют возможность эффективно исследовать глубинные закономерности данных, предлагать ценные управленческие решения и решать тактические задачи бизнес-планирования. Однако какой должна быть аппаратная поддержка, чтобы ее можно было назвать «хорошей»? Поиск ответа начинают с вопроса, где лучше размещать систему — в облаке или на базе собственного ЦОДа? Генеральный директор компании Altiscale Рами Стата проанализировал на ресурсе DataInformed причины, которые следует принимать во внимание при выборе. Сразу следует оговориться: Стата старался убедить читателей в приоритетном выборе именно облачного решения взамен корпоративного ЦОДа. Его главный аргумент: компании должны заниматься исследованием больших данных, а не инфраструктурой. Этот подход более характерен для массового заказчика, для которого Стата искал наиболее быстрый способ выхода на рынок BI. Есть ли смысл самостоятельно развертывать и управлять ИТ-инфраструктурой для Spark и Hadoop? Если компания собирается разворачивать Spark и Hadoop в собственном ЦОДе, то ей придется вложить для этого немало денег. Они пойдут в том числе на оплату консультационных услуг, подбор оборудования и выбор поставщика. Как показывает практика, вариант собственного ЦОДа отнимает также немало времени. Развертывание узлового кластера, прокладка сети, настройка системного ПО — все это потребует новых знаний и времени. О вот инфраструктура готова. Можно начинать ...
читать далее.