Apache Airflow і конвеєри обробки даних. Харенслак Бас, Джуліан де Руйтер
Конвеєри обробки даних керують потоком даних з моменту їхнього початкового збору до консолідації, очищення, аналізу, візуалізації та багато іншого. Apache Airflow надає єдину платформу, яку можна використовувати для проектування, реалізації, моніторингу та обслуговування конвеєрів. Простота інтерфейсу користувача, можливості plug-and-play і гнучкі сценарії Python оптимізують рішення будь-яких завдань, що стосуються управління даними.
Ця книга навчить вас створювати та супроводжувати ефективні конвеєри обробки даних. Ви вивчите найбільш поширені моделі їх використання, особливості орієнтованих ациклічних графів (ОАГ), які забезпечують роботу Airflow, а також способи їх налаштування відповідно до потреб вашого конвеєра.
Видання призначене для фахівців з DevOps, обробки та зберігання даних, машинного навчання, а також системних адміністраторів із навичками програмування на Python.
Інформація про книгу | |
Автор | Харенслак Бас, Джуліан де Руйтер |
Кількість сторінок | 502 |
Мова видання | Російська |
Видавництво | PRINT2PRINT |
Вид палітурки | Тверда |