Cloud Workshops

Spark für Big Data

Datenanalyse mit Text Mining und Machine Learning Methoden.

Was Sie erwartet

Anhand eines real-world Use Case lernen Sie Spark als Big Data Analysetool kennen.

Dauer

3 Tage

Format

Online oder Präsenz

Preis

EUR 2.200,00 pro Person

Portrait von Julius Taylor Taylor

Julius Taylor

Apache Spark ist die führende Engine für Big Data Processing. Lernen Sie, wie Sie große Datenmengen effizient analysieren.

Business Unit Lead - Data Intelligence

Das Training richtet sich an:

  • Data Engineers mit Erfahrung in Datenverarbeitung
  • Data Scientists, die große Datenmengen analysieren
  • Entwickler, die Big Data Processing umsetzen

Nach dem Training beherrschen Sie:

  • Big Data mit Apache Spark analysieren
  • Machine Learning mit MLlib umsetzen
  • Spark-Anwendungen für Production optimieren

Agenda

So läuft Ihr Training ab

  • Tag 1 - Grundlagen

    • Überblick: Was ist Big Data
    • Spark Grundlagen I: RDD
    • Lab: Anwendung von Dataframes
    • Überblick: Microsoft Azure
    • Python Crashkurs (optional)

  • Tag 2 - Streaming

    • Überblick: Was ist Streaming
    • Spark Grundlagen II: Spark Streaming
    • Day-Lab: Twitter Streaming mit Spark (Datenabzug, Auswertung mit Spark Streaming, Speichern in einem Datalake, und Erstellen einer Data Pipeline)

  • Tag 3 - Textmining

    • Überblick: Machine Learning und Text Mining
    • Machine Learning mit MLlib
    • Day-Lab: Text Mining mit Machine Learning Modellen (Regression, Random Forest), Tokenization und Sentimentanalysis

Thinkport-Methode

Praxisnah und interaktiv lernen

Kombination aus Theorie, Live-Demos und Hands-on Labs

Interaktive Diskussionen und individuelle Fragen willkommen

Trainer mit Know-how aus realen Kundenprojekten

Training-Anfrage

Training anfragen 📚

Füllen Sie das Formular aus, um eine Anfrage für dieses Training zu stellen. Wir melden uns schnellstmöglich bei Ihnen.

Portrait von Julius Taylor

Julius Taylor

Business Unit Lead - Data Intelligence

Training

Spark für Big Data

Datenanalyse mit Text Mining und Machine Learning Methoden.

Dauer: 3 Tage
Format: Online oder Präsenz
Level: Fortgeschritten
Preis: EUR 2.200,00 pro Person

Ihre Lernziele

Big Data mit Apache Spark analysieren
Machine Learning mit MLlib umsetzen
Spark-Anwendungen für Production optimieren

Training anfragen

Füllen Sie das folgende Formular aus, um eine Anfrage für dieses Training zu stellen. Wir melden uns schnellstmöglich bei Ihnen.

* Pflichtfelder. Die Training-Anfrage ist unverbindlich.

FAQs

Häufig gestellte Fragen

Welche Vorkenntnisse benötige ich für das Training?

Grundkenntnisse in Python oder Scala und Datenverarbeitung sind erforderlich. Erfahrung mit Hadoop ist hilfreich.

Welche Programmiersprache wird verwendet?

Wir arbeiten hauptsächlich mit Python (PySpark). Scala-Kenntnisse sind hilfreich, aber nicht erforderlich.

Ist das Training auch für Teams geeignet?

Ja, das Training ist ideal für Teams. Wir können die Inhalte an Ihre spezifischen Anforderungen anpassen.

Gibt es praktische Übungen während des Trainings?

Ja, das Training besteht zu 60% aus praktischen Übungen und Hands-on Labs, damit Sie die Konzepte direkt anwenden können.

Kann ich das Training auch remote absolvieren?

Ja, das Training ist sowohl remote als auch vor Ort verfügbar. Die Remote-Version bietet die gleiche Qualität und Interaktivität.

Passende Trainings

Stream-Verarbeitung mit Apache Kafka

Echtzeit Eventstreaming Plattformen meistern.

Databricks MLOps

Werden Sie MLOps Expert:in mit unserem Training

Cloud Architecture Review

Prüfen Sie mit uns Ihre Cloud Architektur. Dabei berücksichtigen wir die Herausforderungen und Besonderheiten Ihres Unternehmens.

Hybrid-Cloud-Architekturen

Best Practices für Multi- und Hybrid-Cloud-Umgebungen mit Azure, AWS und GCP.