Python Data Science Handbook: Essential Tools for working with Data, by Jake VanderPlas

Jake VanderPlas is a long-time user and developer of the Python scientific stack. He currently works as an interdisciplinary research director at the University of Washington, conducts his own astronomy research, and spends time advising and consulting with local scientists from a wide range of fields.
Ich erkläre zunächst meinen eigenen Background und darauf aufbauend, was ich an anderen Python-Büchern/Tutorials vermisst habe:Ich bin promovierter Statistiker mit langjähriger Erfahrung in R und arbeite seit etwas mehr als 2 Jahren mit Linux. Shell-Skills (bash) sind zwar vorhanden, aber definitiv noch ausbaufähig. Ich stehe am Anfang einer Data Science-Karriere in der Industrie. Da Data Science nach meinem Verständnis aus Computer Science + Statistik + epsilon besteht und da ich einen starken Mathematik/Statistik-Background habe, möchte ich meine Programmier-Skills verbessern. Dazu gehört das Erlernen weiterer Programmiersprachen wie Python und C++.Mein Ziel: Lerne Datenanalyse in Python. Insbesondere NumPy, SciPy, Pandas und Matplotlib.Dies ist nicht mein erstes Python-Buch. Was mir an anderen Büchern/Onlinetutorien aufgefallen ist, dass diese oft auf Computer Scientists (Informatiker) zugeschnitten sind. Es war regelmäßig frustrierend, wenn kleine Details nicht erklärt wurden, die für Informatiker selbstverständlich sind.Das Buch "Python Data Science Handbook" ist anders. Es erklärt vieles, was für einen Nicht-Informatiker nicht selbstverständlich ist. Insbesondere ist das erste Kapitel wertvoll für einen Statistiker wie mich. Es erklärt detailliert, wie man mit ipython in einer Shell arbeitet.Fazit: Für Informatiker, die tiefes Verständnis für Python aufbauen wollen, sind andere Bücher empfehlenswert. Wenn man dagegen Grundkenntnisse in Python mitbringt und hauptsächlich an der Datenanalyse in Python interessiert ist, kann ich dieses Buch herzlichst empfehlen.
Das Buch hält was es verspricht. Man kann es auch komplett gratis online lesen (der Autor hat es auf Github veröffentlicht), aber für die Lektüre ist die Druckausgabe hilfreich. Und so unterstützt man auch den Autor. Würde ich wieder kaufen.
Very well written, I have no statistics or profound math background, but the author definitely managed to write a readable, well digestable book on data science with python. Btw, I used it to gain an understanding behind the algorithms and math covered in machine learning with python before actually reading about ML and it was a good decision to do so. Thank you Jake!
I was beginerr in data analysis and this book help me. I think, that this book is best book about data science in Python. You will learn a lot. I recommend it.
Ich war bis vor Kurzem der Meinung, dass sich ein Real-Programmer nicht mit so etwas wie Python die Hände schmutzig machen sollte. In Vorbereitung für ein Projekt habe ich es mir doch näher angeschaut. Über die Sprache kann man diskutieren, aber die Bibliotheken sind wirklich brauchbar und offensichtlich auch sehr effizient implementiert (es werden good old Fortran und C Bibliotheken aufgerufen). Das Buch bietet eine sehr gründliche und genaue EInführung in die Grundlegenden Pakete (mit Ausnahme von Tensorflow). Zu Beginn habe ich mir weniger Doku und mehr Beispiele gewünscht. Allerdings nimmt der Umfang im Laufe des Buches deutlich zu. In Kombination mit A. Geron "Hands-On Machine Learning with SciKit-Learn & Tensorflow" bekommt man einen sehr guten Einblick was man mit den wichtigsten Python-Statistik-Libraries anstellen kann.
