Описание
В книге разобраны восемь сценариев, с которыми неизбежно придется иметь дело любому аналитику данных. Рассказано, как на языке Python обращаться не только с готовыми, но и с частично обработанными и фрагментарными данными. Рассмотрены инструменты из популярных библиотек Pandas и Numpy, освещена проблема доведения незавершенных проектов до результата, объяснено, как построить минимальную полноценную модель и проверить ее работоспособность. Особое внимание уделено анализу временных рядов и других данных, которые могут быстро меняться.
Для начинающих аналитиков данных
Книга предназначена для начинающих аналитиков данных. Дэвид Эсбот — автор книги, архитектор ПО и преподаватель курсов по Data Science, один из ведущих подкаста Half Stack Data Science.
Отзывы о книге
Продуманная и хорошо написанная книга, демонстрирующая, как решать всевозможные проблемы, связанные с анализом данных.
Наоми Седер, член фонда Python Software Foundation
Отличный материал для любого амбициозного исследователя данных!
Эндрю Р. Фрид, компания IBM
Дэвид выстроил ясный и легко воспроизводимый аппарат, который поможет вам справиться с не до конца сформулированными требованиями заказчика и найти решение гораздо быстрее, чем от вас ожидают!
Шон Макгирр, компания DevOn Software Services
В этой книге маститый аналитик данных рассказывает, как справляться с распространёнными проблемами, возникающими на практике, не забыв о тех коварных приемах мастеров, говорить о которых не принято.
Рэнди Ау, компания Google
В реальной практике анализ данных бывает сложным и запутанным.Чтобы преуспеть в нем, придется освоить работу с не вполне достоверными источниками данных, неоднозначными запросами и несовместимыми форматами — зачастую без источников.
В этой книге вы не найдёте чистеньких структурированных примеров, которые разбираются на курсах и тренингах. Напротив, здесь пошагово объяснён профессиональный подход, вооружившись которым, вы справитесь с обработкой данных любой сложности.
В книге разобраны восемь сценариев, с которыми неизбежно придется иметь дело любому аналитику данных.
Вы научитесь:
- моделировать данные, вычленяя пользовательские записи;
- ориентироваться в плохо очерченных метриках;
- извлекать данные из PDF — и многому другому;
- подхватывать и доводить до конца незавершенные проекты;
- в кратчайшие сроки создавать прототипы, опираясь на реальные данные.
Особое внимание уделено обработке временных рядов и данных, которые динамически обновляются в режиме реального времени. Книга проиллюстрирована подробными листингами на языке Python.
Основные библиотеки, на материале которых автор строит примеры, — Pandas и NumPy. Вооружившись этими знаниями, вы обзаведетесь внушительным портфолио — не забудьте похвастаться им на собеседовании.

Дэвид Эсбот — магистр наук о данных с более чем десятилетним опытом разработки ПО и веб-технологий в различных отраслях. В настоящее время работает как независимый консультант и преподаватель, исследуя навыки, необходимые аналитикам будущего.
Дэвид — соавтор подкаста Half Stack Data Science о реальных приложениях Data Science, спикер крупных конференций (включая Data Science Festival в Лондоне) и автор корпоративных курсов для банков и консалтинговых фирм. Обучив основам науки о данных сотни студентов, он написал эту книгу, чтобы помочь тем, кто уже освоил базу и хочет двигаться дальше.







Отзывы
Отзывов пока нет.