Spark в действии. Жан-Жорж Перрен
Анализ корпоративных данных начинается с чтения, фильтрации и объединения файлов и потоков из многих источников. Механизм обработки данных Spark способен обрабатывать эти разнообразные объемы информации как признанный лидер в этой области, обеспечивая в 100 раз большую скорость, чем например Hadoop.
Благодаря поддержке SQL, интуитивно понятному интерфейсу и простому и ясному многоязыковому API вы можете использовать Spark без глубокого изучения новой сложной экосистемы.
Эта книга научит вас создавать полноценные и завершенные аналитические приложения. В качестве примера используется полный конвейер обработки данных, поступающих со спутников NASA.
Для чтения этой книги не требуется какой-либо предварительный опыт работы со Spark, Scala или Hadoop.
Информация о книге | |
Автор | Жан-Жорж Перрен |
Количество страниц | 636 |
Язык издания | Русский |
Издательство | Питер |
Год издания | 2020 |
ISBN | 978-5-97060-879-1 |
Вид переплета | Твердый |
Состояние | Новое |