Best
 
Fantom Tag

Schulung - Big Data - Data Engineering Grundlagen

Big Data-Architektur, -Aufbau und die Komponenten

  • Live Online oder Präsenz
  • 4REAL
    4REAL© steht für eine neue Generation der Weiterbildung: heterogene und personalisierbare Trainings für einen nachhaltigen Lerntransfer in die Arbeitsumgebung. Mehr erfahren
Download als PDF
DURCHFÜHRUNG MIT TERMIN
Nr.
54010

Dauer
3 Tage (21 Stunden)

Preis
2.990,00 € netto
3.558,10 € inkl. 19% MwSt.

TERMIN UND ORT NACH ABSPRACHE
Nr.
54010

Dauer
3 Tage (21 Stunden)

On-demand Training
Sind Sie an diesem Thema interessiert?
Unsere Experten entwickeln Ihr individuell angepasstes Seminar!

Teilen Sie dieses Seminar

4REAL - Real Efficient Adaptive LearningDas Thema Big Data ist aktueller denn je, pro Tag werde viele Petabyte an Daten generiert und warten darauf analysiert und verarbeitet zu werden. Mit dem Apache Hadoop ökosystem wurde eine Möglichkeit geschaffen, große Datenmengen in einem verteilten System zu persistieren und Analysen und Vorhersagen auszuführen. Die damit verbundenen Begriffe rund um Data Science und Data Engineering sind allgegenwärtig. Nur was verbirgt sich hinter all den Trendbegriffen? Die Schulung gibt einen ersten Ein- und überblick über die Komponenten, Methoden und Begrifflichkeiten zu diesen Themen. Dieser beschränkt sich nicht auf reine Theorie, sondern ermöglicht Ihnen erste praktische Erfahrungen anhand eines fiktiven Projekts zu sammeln. Nach einer Einführung in die Paradigmen von Big Data lernen Sie anhand eines realen Twitter Datensets, wie einfach Sie Daten in den Hadoop Cluster streamen können. Danach nehmen Sie eigenhändig Daten-Transformationen vor und orientieren sich dabei immer am besprochenen Data Lake Konzept. Am Ende des Data Engineering Parts haben Sie die Daten soweit verdichtet und aufbereitet, dass Sie im nächsten Schritt mit Data Science Methoden Analysen darauf ausführen. Unsere Lernplattform LearningHub @Cegos ist Bestandteil dieses Präsenzseminars. Neben den digitalen Seminarunterlagen ist das Training um weitere Lernformate und Medien angereichert. Um einen nachhaltigen Wissenstransfer in den Arbeitsalltag zu erzielen, wird das Seminar nach unserem 4REAL-Vorgehensmodell umgesetzt.

Lesen Sie mehr
Zielgruppe

Wer sollte teilnehmen:

Zielgruppe

Das Seminar richtet sich an Datenbank Experten, BigData Experten, Sicherheitsexperten, Systemadministratoren, Netzwerkadministratoren, Data Science Mitarbeiter, Entwickler sowie alle Interessierten, die dem Thema BigData tiefer unter die Haube schauen möchten.

Voraussetzungen

Neben generellen IT Kenntnissen in SQL und Programmierung sind keine besonderen Vorkenntnisse erforderlich. Der vorherige Besuch unseres Grundlagenseminars 4704 4704 erleichtert das Verständnis.

Trainingsprogramm

Trainingsprogramm

Data Engineering

Einführung Big Data:

  • Was ist Big Data?
  • Die drei Vs
  • Abgrenzung zu relationalen Datenbanken
  • Data Lake und hybride Architektur Konzept

IT-Grundlagen:

  • Basiswissen Netzwerke
  • Basiswissen verteilte Systeme

ökosystem Hadoop:

  • Hadoop Cluster Architektur
  • überblick über die Hadoop Distributionen
  • HBase
  • HDFS
  • Hive
  • Kafka
  • NiFi
  • Pig
  • Spark / Spark Streaming
  • Sqoop
  • Ambari
  • Zookeeper
  • überblick weiterer Komponenten

Security in Hadoop:

  • Ranger
  • Kerberos

Hands on Hadoop – Praxisteil:

  • HDFS Puzzle
  • Administration Grundlagen
  • Ambari Monitoring M/R
  • HDFS Strukturen anlegen
  • Zookeeper Nodes
  • HBase
  • HDFS
  • Hive
  • Kafka
  • NiFi
  • Pig
  • Spark / Spark Streaming
  • Sqoop

Vertiefung der Hadoop Komponenten - Praxisteil:

  • Streaming
  • Buffering
  • Archivierung
  • Transformation
  • Analyse

Schulungsmethode

Schulungsmethode

Die Inhalte werden durch Vorträge, Diskussionen, Demonstrationen und Praktikum am System vermittelt.

Hinweis

Hinweis

Weitere Seminare aus dem Bereich Big Data

Weitere Informationen

Weitere Informationen

Schulung - Big Data - Data Engineering Grundlagen