05.12.2006 НовостиДесять лет назад взял старт амбициозный проект под названием Internet Archive, призванный сохранить в едином архиве все Web-страницы Интернета вместе с самыми разнообразными видами цифрового контента. За прошедшее с тех пор время здесь скопилось 4 Пб данных (включая 1,6 Пб первичных), для хранения которых используется стандартное модульное оборудование и программное обеспечение с открытыми кодами. Стратегия этой организации в области хранения огромных массивов информации и управления ими может послужить отличным примером для любой компании, стремящейся удержать под контролем быстро растущую информационную нагрузку.К многотерабайтным вычислительным центрам мы уже постепенно привыкаем, однако петабайтное хранилище данных на сегодняшний день - все еще экзотика. Познакомиться с тем, как Internet Archive справляется с накопленной информацией невероятного размера, eWeek Labs решил прямо на месте - в Сан-Франциско, где размещена эта цифровая библиотека. Отметим, кстати, что мы оказались в совершенно новом вычислительном центре, куда организация только-только закончила переводить данные из своих прежних офисов в районе Presidio. Точнее говоря, последние серверные стойки были развернуты на новом месте всего за пару недель до нашего приезда.Успех Internet Archive во многом объясняется подходом менеджеров ИТ к проблеме хранения огромных информационных массивов - так считает цифровой библиотекарь и основатель Internet Archive Брюстер Кале: "Когда имеешь дело с петабайтными ...
читать далее.