12.07.2012 Экспертиза, Безопасность, Серверы и системы храненияБольшие данные позиционировались в 2011 г. как самый популярный тренд. Сегодня мы действительно видим большой интерес рынка к теме анализа данных. Под термином «большие данные» многие понимают самые разные явления и технологии. Самое распространенное заблуждение — это когда имеется в виду ограниченный набор источников и анализ данных, с которыми традиционно работают аналитические службы компаний. В обобщенном виде, технология больших данных — направление аналитики, складывающееся из сбора, статистики, анализа данных, получения знаний (KDD) и прогнозирования событий. Столь обширный набор технологий, которые подпадают под трактовку больших данных, лишь усложняет понимание того, зачем нужна эта технология и откуда она появилась. Что же такое большие данные на самом деле? Из самого термина становится понятно, что все дело в информации. А точнее, в существенном увеличении ее объема за последнее десятилетие. Но чтобы отнести те или иные данные именно к большим данным, важно понимать, по какому признаку их отнести к понятию «большие». Разработчики решений по обработке и анализу больших данных вводят свои методы и критерии отнесения данных к «большим». Возьмем для примера задачу построения автоматического «движка», который бы мог давать рекомендации существующим покупателям о том, что дополнительно их может заинтересовать в онлайн-магазине. И это при том, что база данных среднестатистического интернет-магазина может хранить ...
читать далее.