08.02.2024 ЭкспертизаХотя идея «озера-хранилища данных» (data lakehouse) привлекательна, на данный момент она выглядит скорее мечтой, чем реальностью, пишут на портале Datanami представители инвестиционного фонда Cota — старший юрист инвестиционной команды Эрик Ли и партнер и технический директор Рич Эллинджер. Хранилища данных (data warehouses) и озера данных (data lakes) служат четким и разным целям. Как правило, в хранилищах данных хранятся структурированные данные в соответствии с заранее определенной схемой, что позволяет быстро выполнять запросы для создания отчетов. Озера данных, с другой стороны, хранят и обрабатывают различные типы данных, включая неструктурированные, и поддерживают расширенную аналитику, обнаружение данных, а также рабочие нагрузки искусственного интеллекта и машинного обучения. Появившаяся недавно концепция озера-хранилища объединяет лучшее из двух этих миров. #IMAGE_228608# Теоретически озеро-хранилище данных избавляет от необходимости использовать две отдельные системы для хранения и анализа данных. Оно объединяет их, избавляя от необходимости перемещать данные между системами и позволяя беспрепятственно выполнять запросы ко всем наборам данных. Кроме того, поскольку компании стремятся использовать преимущества ИИ, озеро-хранилище может предоставить моделям ИИ единый источник истины и более полное представление о данных. Озеро-хранилище также позволит сократить расходы. Сегодня корпоративные клиенты жалуются, что расходы резко растут, поскольку им приходится платить ...
читать далее.