Вы получили два разных, но связанных между собой набора данных? Что делать? Какие инструменты использовать для поиска совпадений? А если все, что у вас есть, — это доступ к базе данных с помощью запроса SQL SELECT? Джим Лемер познакомит вас... с лучшими практиками, техниками и хитрыми приемами, которые помогут импортировать, очищать, сопоставлять, оценивать и осмысливать разнородные данные с помощью SQL.Администраторы баз данных, разработчики, бизнес-аналитики и специалисты data science узнают, как выявлять и удалять дубликаты, парсить строки, извлекать данные из XML и JSON, упорядочивать данные, а также работать над качеством данных и выполнять операции ETL для поиска сходств и различий между разными представлениями одинаковых данных.Примеры в книге содержат реальные кейсы и рабочий код.
Автор: Джим Лемер
Издательство: Питер
Серия: Бестселлеры O'Reilly
Возрастные ограничения: 16+
Год издания: 2024
ISBN: 9786010840379
Кол-во страниц: 288
Размер: 233х165х17 мм
Тип обложки: мягкая
Вес: 288 г
Способы доставки
Выбери подходящий способ доставки
Забрать самому из магазина
0.00 £
Доставка курьером