Big Data Analytics Seminar mit PySpark

Merken

allskills Training

Ansprechpartner

Conny Metzner

Adresse

Kastanienallee 53
10119 Berlin

Telefon

0304492545

Fax

030 443 40 435

Webseite

https://www.allskills-training.com

Big Data Analytics Seminar mit PySpark

Beschreibung
Der Kurs gliedert sich thematisch in drei Breiche, die die Teilnehmer schrittweise an Apache Spark heranführen. Der erste (eher theoretische) Teil gibt einen knappen Überblick aktueller Technologien zur Speicherung und Verarbeitung großer Datenmengen (Hadoop und Kubernetes), und welchen Platz Spark als wichtiges Datenverarbeitungsframework darin einnimmt. Der zweite, praktisch angelegte Teil umfasst eine ausführliche Einführung in die Arbeit mit Apache Spark mit Python (PySpark). Dieses Modul stellt den Kern des Workshops dar. Dementsprechend werden dabei alle wichtigen Punkte angesprochen:-Einladen von Daten -Datenaufbereitung (Transformation, Filtern, Joinen, Aggregation) -Anbindung verschiedener Datenquellen -Ausführungsmodelle von Apache Spark -Integration von dem Python Data Science Module Pandas  und wichtige Unterschiede Die Teilnehmer werden all diese Schritte direkt an praktischen Beispielen und Übungen umsetzen. Zusätzlich werden auch gängige Grundkonzepte zur Datenorganisation in Big Data Projekten angesprochen. Der dritte Teil behandelt schließlich die in Spark vorhandenen Möglichkeiten zur Datenanalyse und zum maschinellen Lernen (ML). Es werden kurz die grundlegenden Konzepte und Vorgehensweisen von ML erläutert und an einem Beispiel mit PySpark praktisch angewandt.

Was lernen Sie im PySpark Seminar?

Der Fokus des Workshops liegt auf dem Umgang mit PySpark zur Verarbeitung und Analyse großer Datenmengen. Der Bereich „Machine Learning“ wird im letzten Teil ebenfalls besprochen, jedoch wird das Thema aufgrund der inherenten Komplexität theoretisch nur knapp umrissen. Im Mittelpunkt steht vielmehr, welche Möglichkeiten Apache Spark zu diesem Anwendungsgebiet anbietet, und unter welchen Bedingungen der Einsatz von PySpark anderen Alternativen vorzuziehen ist. Der Workshop versetzt die Teilnehmer in die Lage, selbständig Daten mit Hilfe von Apache Spark zu transformieren und analyieren. Dieses Training findet in Kooperation mit Enable AI statt.
Zielgruppe
Der Kurs wendet sich primär an Data Scientists und Data Analysts, die mit Hilfe von Python und Apache Spark (PySpark) große Datenmengen verarbeiten und analysieren möchten.
Voraussetzung
Die Teilnehmer sollten grundlegende Programmier- und SQL Kenntnisse besitzen. Alle Programmierbeispiele für Apache Spark werden in Python umgesetzt. Die Erfahrung zeigt, dass sich Teilnehmer mit Kenntnissen in anderen Programmiersprachen schnell in Python
Sprache
Deutsch
Teilnehmerzahl
3 bis 8
Zertifikat
Anbieter-Zertifikat
Preis inkl. MwSt.
1.370,00 € (pro Person)
Veranstaltungsart
Live Online-Kurs
Durchführung
Tageskurs
Veranstaltungszeiten
Im Allgemeinen findet der Kurs von 9:00 bis 16:30 statt.

Termine und Orte

Von Bis Ort Durchführungs-
garantie
Frühbucher bis
Betrag
Lastminute ab
Betrag
18.08.2025 19.08.2025 Live Online-Kurs
18.11.2025 19.11.2025 Live Online-Kurs