Нечітке зіставлення даних у SQL. Джим Лемер
Практики, методики та прийоми, які допоможуть вам виявляти та видаляти дублікати
Ви отримали два різні, але пов'язані між собою набори даних? Що робити? Які інструменти використовувати для пошуку збігів? А якщо все, що у вас є, - це доступ до бази даних за допомогою запиту SQL SELECT? Джим Лемер познайомить вас із найкращими практиками, техніками та хитрими прийомами, що допоможуть імпортувати, очищати, зіставляти, оцінювати й осмислювати різнорідні дані за допомогою SQL.
Адміністратори баз даних, розробники, бізнес-аналітики та фахівці data science дізнаються, як виявляти й видаляти дублікати, парсити рядки, витягувати дані з XML і JSON, упорядковувати дані, а також працювати над якістю даних і виконувати операції ETL для пошуку схожості та відмінності між різними уявленнями однакових даних.
Приклади в книзі містять реальні кейси та робочий код.
5 причин прочитати:
- Ви дізнаєтеся, як знаходити і видаляти дублікати в різних наборах даних за допомогою SQL.
- Навчитеся нормалізувати дані та підвищувати їхню якість за допомогою SQL.
- Будете генерувати SQL за допомогою SQL для підвищення продуктивності.
- Зможете готувати набори даних для імпорту, об'єднання та кращого аналізу за допомогою SQL.
- Підвищите якість даних і навчитеся виконувати операції ETL для пошуку подібностей і відмінностей між різними уявленнями однакових даних.
Інформація про книгу | |
Автор | Джим Лемер |
Обкладинка | М'яка |
Кількість сторінок | 288 |
Мова видання | Російська |
Ілюстрації | Чорно-білі |
Рік видання | 2024 |