Apache Airflow і конвеєри обробки даних. Харенслак Б., де Руйтер Дж.
Конвеєри обробки даних керують потоком даних з моменту їхнього початкового збору до консолідації, очищення, аналізу, візуалізації та багато іншого. Apache Airflow надає єдину платформу, яку можна використовувати для проектування, реалізації, моніторингу та обслуговування конвеєрів. Простота інтерфейсу користувача, можливості plug-and-play і гнучкі сценарії Python оптимізують рішення будь-яких завдань, що стосуються управління даними.
Ця книга навчить вас створювати та супроводжувати ефективні конвеєри обробки даних. Ви вивчите найбільш поширені моделі їх використання, особливості орієнтованих ациклічних графів (ОАГ), які забезпечують роботу Airflow, а також способи їх налаштування відповідно до потреб вашого конвеєра.
Видання призначене для фахівців з DevOps, обробки та зберігання даних, машинного навчання, а також системних адміністраторів із навичками програмування на Python.
Інформація про книгу | |
Автор | Харенслак Б. де Руйтер Дж. |
Кількість сторінок | 502 |
Мова видання | російска |
Видавництво | ДМК Прес |
Рік видання | 2021 |
ISBN | 978-5-97060-970-5 |
Вид палітурки | Твердий |
Стан | Нове |