Алгоритмы и структуры для массивных наборов данных. Джейла Меджедович, Эмин Тахирович
Стандартные алгоритмы и структуры при применении к крупным распределенным наборам данных могут становиться медленными — или вообще не работать. Правильный подбор алгоритмов, предназначенных для работы с большими данными, экономит время, повышает точность
и снижает стоимость обработки.
Книга знакомит с методами обработки и анализа больших распределенных данных. Насыщенное отраслевыми историями и занимательными иллюстрациями, это удобное руководство позволяет легко понять даже сложные концепции. Вы научитесь применять на реальных примерах такие мощные алгоритмы, как фильтры Блума, набросок count-min, HyperLogLog и LSM-деревья, в своих собственных проектах.
Приведены примеры на Python, R и в псевдокоде.
Основные темы:
- вероятностные структуры данных в виде набросков;
- выбор правильного движка базы данных;
- конструирование эффективных дисковых структур данных и алгоритмов;
- понимание алгоритмических компромиссов в крупно-масштабных системах;
- правильное формирование выборок из потоковых данных;
- вычисление процентилей при ограниченных пространст-венных ресурсах.
«Доступное и прекрасно иллюстрированное введение в вероятностные дисковые структуры данных и алгоритмы».
Маркус Янг, Prosper Marketplace
«Повысит ваши знания об алгоритмах и структурах данных с уровня учебника до уровня реального мира».
Руи Лю, Oracle
«Прекрасно объясняет масштабируемые структуры данных и алгоритмы. Обязательное чтение для любого инженера данных».
Алекс Гоур, Shopify
«Подробный практический подход к работе с распределенными системами и архитектурами данных».
Сатедж Кумар Саху, Honeywell
Информация о книге | |
Автор | Джейла Меджедович, Эмин Тахирович |
Обложка | Твердый |
Язык издания | Русский |
Страниц | 340 |