Der dreitägige Data Science Kurs in Python für die Verwendung von Python für Data Science erklärt die notwendigen Grundlagen für die Datenanalyse und die Anwendung von Machine Learning Algorithmen. Bei den Algorithmen wird nur das notwendige theoretische Verständnis geschult, da das Ziel in der Schulung auf der praktischen Umsetzung der Algorithmen in Python mit dem Paket scikit-learn liegt. Am Ende des Seminars können Sie selbstständig erste Daten Analysen umsetzen und einfache Machine Learning Algorithmen für die Datenanalyse einsetzen. Das Paket pandas ist ein Schwerpunkt dieser Data Science Schulung, da dieses Paket speziell für Data Science entwickelt wurde. Die wichtigsten Schritte für die Datenaufbereitung mit pandas werden eingeübt. Zur Erstellung von Plots und Grafiken wird im Kurs das Paket seaborn verwendet und eine kurze Einführung in matplotlib gegeben. Matplotlib überzeugt durch die Fülle an Möglichkeiten einen Plot anzupassen, seaborn durch die Einfachheit auch komplexere Plots mit wenig Code zu erstellen. Nach den Grundlagen für Python (Datenstrukturen, eigene Funktionen schreiben) und der Erläuterung von pandas für die Auswertung von Daten, erhalten Sie einen Überblick über Machine Learning Algorithmen, welche wir in Python mit dem Paket scikit-learn selbst programmieren werden. Ein wichtiger Bestandteil vom Data Science Python Seminar ist das eigenständige Arbeiten und Lösen von Übungsaufgaben, so dass Sie mit direkter Hilfe des Trainers das Besprochene direkt in der Praxis umsetzen und so Schritt für Schritt die Anwendung von Data Science lernen können.
Was lernen Sie im Python Data Science Kurs?
Sie erhalten einen Überblick über Python für Data Science, wobei die Programmiersprache Python auch im Machine Learning und Deep Learning sehr populär ist. Wir verwenden die Anaconda Distribution (nach eigenen Angaben “The World’s most popular data science platform”) und als Entwicklungsumgebung/IDE wird jupyter lab verwendet. Nach dem Seminar können Sie Daten aus verschiedenen Formaten einlesen, Daten mit seaborn/matplotlib plotten bzw. Daten mit pandas bereinigen (fehlende Werte ersetzen, Zeilen und Spalten anpassen, neue Spalten erzeugen). Sie können eigene einfache Funktionen schreiben und kennen die Umsetzung von Control Flows (For-Schleife, If-Else). Sie verstehen das Grundkonzept eines pandas DataFrames und können damit Data Wrangling und Data Cleaning durchführen. Die Einteilung von Machine Learning in supervised-unsupervised und Reinforcement Learning ist Ihnen bekannt und Sie können mit scikit-learn eigenständig Algorithmen in Python trainieren, validieren, einen Train-Test Datensplit durchführen und Gütekriterien zur Beurteilung eines Algorithmus berechnen und interpretieren. Bekannte Algorithmen im Machine Learning werden erläutert und Sie können die verschiedenen Algorithmen verstehen und in Python coden. Das Seminar umfasst Algorithmen für die Regression, Klassifikation und dem Clustering: Entscheidungsbaum, K-means clustering, DBSCAN Clustering, Multi-Layer-Perceptron und K-Nearest Neighbors. Sie kennen die Data Science Grundlagen und die Einstiegshürde für die Benutzung von Python für Machine Learning ist genommen, so dass Sie eigenständig Ihr Wissen nach dem Data Science Seminar erweitern können. Der Schwerpunkt liegt auf der eigenen Umsetzung auf Ihrem Laptop mit Unterstützung des Dozenten. Dieses Training findet in Kooperation mit Enable AI statt.