Cloud Workshops

Spark für Big Data

Datenanalyse mit Text Mining und Machine Learning Methoden.

Ihren Termin anfragen

Was Sie erwartet

Anhand eines real-world Use Case lernen Sie Spark als Big Data Analysetool kennen.

Dauer

3 Tage

Format

Online oder Präsenz

Preis

EUR 2.200,00 pro Person

Tobias

Apache Spark ist die führende Engine für Big Data Processing. Lernen Sie, wie Sie große Datenmengen effizient analysieren.

Senior Engineer

Das Training richtet sich an:

Data Engineers mit Erfahrung in Datenverarbeitung
Data Scientists, die große Datenmengen analysieren
Entwickler, die Big Data Processing umsetzen

Nach dem Training beherrschen Sie:

Big Data mit Apache Spark analysieren
Machine Learning mit MLlib umsetzen
Spark-Anwendungen für Production optimieren

Agenda

So läuft Ihr Training ab

Training anfragen

Tag 1 - Grundlagen
- Überblick: Was ist Big Data
- Spark Grundlagen I: RDD
- Lab: Anwendung von Dataframes
- Überblick: Microsoft Azure
- Python Crashkurs (optional)
Tag 2 - Streaming
- Überblick: Was ist Streaming
- Spark Grundlagen II: Spark Streaming
- Day-Lab: Twitter Streaming mit Spark (Datenabzug, Auswertung mit Spark Streaming, Speichern in einem Datalake, und Erstellen einer Data Pipeline)
Tag 3 - Textmining
- Überblick: Machine Learning und Text Mining
- Machine Learning mit MLlib
- Day-Lab: Text Mining mit Machine Learning Modellen (Regression, Random Forest), Tokenization und Sentimentanalysis

Thinkport-Methode

Praxisnah und interaktiv lernen

Kombination aus Theorie, Live-Demos und Hands-on Labs

Interaktive Diskussionen und individuelle Fragen willkommen

Trainer mit Know-how aus realen Kundenprojekten

Training-Anfrage

Training anfragen 📚

Füllen Sie das Formular aus, um eine Anfrage für dieses Training zu stellen. Wir melden uns schnellstmöglich bei Ihnen.

Tobias

Senior Engineer

Training

Spark für Big Data

Datenanalyse mit Text Mining und Machine Learning Methoden.

Dauer: 3 Tage

Format: Online oder Präsenz

Level: Fortgeschritten

Preis: EUR 2.200,00 pro Person

Ihre Lernziele

Big Data mit Apache Spark analysieren

Machine Learning mit MLlib umsetzen

Spark-Anwendungen für Production optimieren

Training anfragen

Füllen Sie das folgende Formular aus, um eine Anfrage für dieses Training zu stellen. Wir melden uns schnellstmöglich bei Ihnen.

Training

Vorname *

Nachname *

E-Mail-Adresse *

Telefonnummer

Unternehmen

Position

Ich habe die Datenschutzerklärung zur Kenntnis genommen.*
Wir behandeln Ihre Daten vertraulich und verantwortungsvoll.
DSGVO-konform und sicher.

* Pflichtfelder. Die Training-Anfrage ist unverbindlich.

FAQs

Häufig gestellte Fragen

Welche Vorkenntnisse benötige ich für das Training?

Grundkenntnisse in Python oder Scala und Datenverarbeitung sind erforderlich. Erfahrung mit Hadoop ist hilfreich.

Welche Programmiersprache wird verwendet?

Wir arbeiten hauptsächlich mit Python (PySpark). Scala-Kenntnisse sind hilfreich, aber nicht erforderlich.

Ist das Training auch für Teams geeignet?

Ja, das Training ist ideal für Teams. Wir können die Inhalte an Ihre spezifischen Anforderungen anpassen.

Gibt es praktische Übungen während des Trainings?

Ja, das Training besteht zu 60% aus praktischen Übungen und Hands-on Labs, damit Sie die Konzepte direkt anwenden können.

Kann ich das Training auch remote absolvieren?

Ja, das Training ist sowohl remote als auch vor Ort verfügbar. Die Remote-Version bietet die gleiche Qualität und Interaktivität.

Passende Trainings

Airflow in der Cloud

Orchestrierung von skalierbaren Workflows mit Apache Airflow Cloud oder agnostisch in Kubernetes

Mehr erfahren

Kafka Fundamentals

Echtzeit Eventstreaming Plattformen kennenlernen und erste Lernerfahrungen gewinnen.

Mehr erfahren

Databricks MLOps

Werden Sie MLOps Expert:in mit unserem Training

Mehr erfahren

Kubernetes & Docker

Cluster Management und Skalierbarkeit kennenlernen.

Mehr erfahren

Spark für Big Data

Was Sie erwartet

Dauer

Format

Preis

Tobias

Das Training richtet sich an:

Nach dem Training beherrschen Sie:

So läuft Ihr Training ab

Tag 1 - Grundlagen

Tag 2 - Streaming

Tag 3 - Textmining

Praxisnah und interaktiv lernen

Training anfragen 📚

Tobias

Spark für Big Data

Ihre Lernziele

Training anfragen

FAQs

Passende Trainings

Airflow in der Cloud

Kafka Fundamentals

Databricks MLOps

Kubernetes & Docker