Книга позволяет изучить науку о данных (Data Science) и применить полученные знания на практике. Она содержит краткий курс языка Python, элементы линейной алгебры, статистики, теории вероятностей, методов обработки данных. Приведены основы машинного обучения. Описаны алгоритмы k ближайших соседей, наивной байесовой классификации, линейной и логистической регрессии, а также модели на основе деревьев принятия решений, нейронных сетей и кластеризации. Рассмотрены приемы обработки естественного языка, методы анализа социальных сетей, основы баз данных, SQL и MapReduce.
Во втором издании примеры переписаны на Python 3.6, игрушечные наборы данных заменены на «реальные», добавлены материалы по глубокому обучению и этике данных, статистике и обработке естественного языка, рекуррентным нейронным сетям, векторным вложениям слов и разложению матриц.
Для аналитиков данных.
Любопытная книга, не претендующая на прорыв.Будет интересна с точки зрения введения в Python, эдакое введение для продвинутых, для подготовленных читателей. Кикстарт на примерах. Автор показывает лучшие стороны языка, которые дают возможность не заморачиваться на мелочах, а заниматься непосредственно делом. Автор как будто все время говорит: «Смотри, какая непростая штука,» – и тут же приводит наглядный пример реализации и подытоживает: «Клево, правда?».В общем понравилось.
Книга – галопом по европам, про все и ни о чем, есть полезные ссылки, скорее это набор теории – что вы должны знать чтобы считаться ds, все поняли значит ds, не все – что не поняли, учите