31.08.2011 Обзоры, Идеи и практики автоматизацииУвеличивающееся количество гигантских массивов корпоративных данных и все технологии для их создания, хранения, перемещения, анализа, архивирования и извлечения информации — всё это “большие данные”. Огромный объем информации раздвигает границы хранилищ, серверов и периметров безопасности, создавая огромные проблемы для ИТ-отделов, подлежащие решению. Где же точка перелома? Когда данные среднего размера становятся “большими данными”? Исследовательская фирма Gartner описывает “большие данные” следующим образом: “объем, разнообразие и скорость структурированных и неструктурированных данных, текущих по сетям к процессорам и устройствам хранения, наряду с преобразованием этой информации в деловые советы для предприятий”. Эти элементы могут быть разбить на три отдельные категории: размер, разнообразие и скорость. Размер (терабайты, петабайты и, в конце концов, экзабайты): увеличивающийся объем бизнес-информации, созданной людьми и компьютерами, наносящий главный удар по ИТ-системам, старающимся сохранить и обезопасить всю эту информацию для будущего использования. Разнообразие: “большие данные” — это увеличивающееся количество типов данных, которые нужно поддерживать другим образом, нежели обычную электронную почты, журналы или записи о кредитных картах. Сюда включаются данные с сенсоров и другие машинно-собираемые данные для научных исследований, медицинская и финансовая информация, мультимедиа: фотографии, презентации с графикой, музыкой, аудио и видео ...
читать далее.