Big Data on AWS (AWSBD)

"Big Data in AWS" bietet eine Einführung in Cloud-basierte Big Data-Lösungen und Amazon Elastic MapReduce (EMR), die AWS-Plattform für Big Data. In diesem Kurs zeigen wir Ihnen, wie Sie Amazon EMR zum Verarbeiten von Daten mithilfe des umfassenden Angebots an Hadoop-Tools wie beispielsweise Pig und Hive einsetzen. Sie erfahren außerdem, wie Sie Big Data-Umgebungen erstellen, mit Amazon DynamoDB, Amazon Redshift und Amazon Kinesis arbeiten, und wie Sie durch Befolgen bewährter Methoden sichere und wirtschaftliche Big Data-Umgebungen einrichten.

Zielgruppe
  • Zuständige für die Konzeption und Umsetzung von Big Data-Lösungen, d. h. Solutions Architects und SysOps-Administratoren
  • Big Data-Manager und Big Data-Analysten, die sich für Big Data-Lösungen in AWS interessieren

Voraussetzungen
  • Grundkenntnisse in Big Data-Technologien einschließlich Apache Hadoop und HDFS
  • Kenntnisse in Big Data-Technologien wie Pig, Hive und MapReduce sind hilfreich, aber nicht erforderlich
  • Arbeitskenntnisse der wichtigen AWS-Services und Implementierung öffentlicher Clouds
  • Teilnehmer müssen den Kurs AWS Technical Essentials (AWSE) absolviert haben oder eine ähnliche Erfahrung aufweisen
  • Grundlegendes Verständnis von Data Warehouses, relationalen Datenbanksystemen und Datenbank-Design

Kursziele
Nach Kursabschluss sollten Sie folgende Ziele erreicht haben:
  • Verstehen von Apache Hadoop im Kontext von Amazon EMR
  • Verstehen der Architektur eines Amazon EMR-Clusters
  • Starten eines Amazon EMR-Clusters mithilfe eines geeigneten Amazon-Computerabbilds (AMI) und Amazon EC2-Instance-Typs
  • Auswählen passender AWS-Datenspeicheroptionen für Amazon EMR
  • Verstehen der Optionen für die Eingabe, Übertragung und Komprimierung von Daten zur Nutzung mit Amazon EMR
  • Einsetzen gängiger Programmierungs-Frameworks, die für Amazon EMR zur Verfügung stehen, wie z. B. Hive, Pig und Streaming
  • Implementieren einer Big Data-Lösung mithilfe von Amazon Redshift
  • Nutzen von Software zur Visualisierung von Big Data
  • Auswählen geeigneter Sicherheitsoptionen für Amazon EMR und Ihre Daten
  • Ausführen von In-Memory-Datenanalysen mithilfe von Spark und Shark in Amazon EMR
  • Auswählen passender Optionen zur wirtschaftlichen Verwaltung Ihrer Amazon EMR-Umgebung
  • Verstehen der Vorteile der Nutzung von Amazon Kinesis für Big Data


 
Details anzeigen
Kursmodule
1. Tag
  • Übersicht zu Big Data, Apache Hadoop und den Vorteilen von Amazon EMR
  • Architektur von Amazon EMR
  • Verwenden von Amazon EMR
  • Starten und Nutzen eines Amazon EMR-Clusters
  • Hadoop-Programmierungs-Frameworks
2. Tag
  • Verwenden von Hive für die Analyse von Werbung
  • Verwenden von Streaming für biowissenschaftliche Analysen
  • Übersicht: Spark und Shark für In-Memory-Analysen
  • Verwenden von Spark und Shark für In-Memory-Analysen
  • Kostenmanagement für Amazon EMR
  • Übersicht über die Amazon EMR-Sicherheit
  • Eingabe, Übertragung und Komprimierung von Daten
  • Verwenden von Amazon Kinesis für die Verarbeitung von Big Data in Echtzeit
3. Tag
  • Verwenden von Amazon Kinesis und Amazon EMR für Streaming und Verarbeitung von Big Data
  • Optionen für die Datenspeicherung in AWS
  • Verwenden von DynamoDB mit Amazon EMR
  • Übersicht: Amazon Redshift und Big Data
  • Verwenden von Amazon Redshift für Big Data
  • Visualisieren und Orchestrieren von Big Data
  • Visualisieren von Big Data mit Tableau Desktop oder Jaspersoft BI