Apache Iceberg. Повний посібник. Ширан Т., Г'юз Дж., Мерсед А.
Традиційні архітектурні шаблони зберігання даних сильно обмежені. Щоб використовувати їх, доводиться застосовувати досить дорогі процеси ETL для завантаження даних у кожен інструмент, що відкриває доступ до функцій сховища даних. Відсутність гнучкості в цих шаблонах змушує замикатися на деякому наборі інструментів і форматів, що викликає дрейф даних. Ця книга демонструє більш вдале рішення. Apache Iceberg пропонує високу продуктивність, масштабованість і економічність - головні переваги, властиві відкритим озерам даних.
Прочитавши книгу, ви дізнаєтеся:
- як організована архітектура таблиць Apache Iceberg;
- що відбувається за лаштунками, коли ви виконуєте операції з таблицями Iceberg;
- як ще більше оптимізувати таблиці Iceberg, щоб домогтися максимальної продуктивності;
- як використовувати Iceberg з популярними рушіями даних, такими як Apache Spark, Apache Flink і Dremio.
Книга адресована фахівцям, які займаються обробкою та аналізом даних, а також адміністраторам, які обслуговують озера даних.
Інформація про книгу | |
Обкладинка | Тверда |
Кількість сторінок | 368 |
Мова видання | Російська |
Ілюстрації | Чорно-білі |
Автори | Ширан Т., Г'юз Дж., Мерсед А. |