Алгоритми та структури для масивних наборів даних. Джейла Меджедович, Емін Тахірович
Стандартні алгоритми та структури при застосуванні до великих розподілених наборів даних можуть ставати повільними або взагалі не працювати. Правильний підбір алгоритмів, призначених для роботи з великими даними, заощаджує час, підвищує точність та знижує вартість обробки.
Книга знайомить із методами обробки та аналізу великих розподілених даних. Насичене галузевими історіями та цікавими ілюстраціями, це зручне керівництво дозволяє легко зрозуміти навіть складні концепції. Ви навчитеся застосовувати на реальних прикладах такі потужні алгоритми, як фільтри Блума, малюнок count-min, HyperLogLog та LSM-дерева у своїх власних проектах.
Наведено приклади на Python, R та в псевдокоді.
Основні теми:
- імовірнісні структури даних у вигляді нарисів;
- вибір правильного движка бази даних;
- конструювання ефективних дискових структур даних та алгоритмів;
- розуміння алгоритмічних компромісів у великомасштабних системах;
- правильне формування вибірок із потокових даних;
- обчислення процентилей при обмежених просторових ресурсах.
«Доступне та чудово ілюстроване введення у ймовірнісні дискові структури даних та алгоритми».
Маркус Янг, Prosper Marketplace
«Підвищить ваші знання про алгоритми та структури даних з рівня підручника до рівня реального світу».
Руї Лю, Oracle
«Чудово пояснює масштабовані структури даних та алгоритми. Обов'язкове читання для будь-якого інженера даних».
Алекс Гоур, Shopify
"Детальний практичний підхід до роботи з розподіленими системами та архітектурами даних".
Сатедж Кумар Саху, Honeywell
Інформація про книгу | |
Автор | Джейла Меджедович, Емін Тахірович |
Обкладинка | Твердий |
Мова видання | Російська |
Сторінок | 340 |