Data Engineering und Big Data
- Fakultät
Wirtschafts- und Sozialwissenschaften
- Version
Version 10.0 vom 08.02.2019
- Modulkennung
22M0989
- Modulname (englisch)
Data Engineering and Big Data
- Studiengänge mit diesem Modul
Wirtschaftsinformatik (Master) (M.Sc.)
- Niveaustufe
4
- Kurzbeschreibung
Das Modul vermittelt den Umgang mit strukturierten, semi-strukturierten, polystrukturierten und unstrukturierten Daten durch eine nachhaltige Datenbewirtung sowohl für klassische Anwendungsgebiete als auch für Big Data-Anwendungen, bei denen Volume, Variety und Velocity besondere Relevanz haben.
- Lehrinhalte
- Notwendigkeit und Herausforderungen klassischer Datenbewirtschaftung und Big DataDatenhaltung (Objektrelational und NoSQL)Datenhaltungsarchitekturen (einschl. Replica, Sharding, Scale-out , Scale-up Konzepte)
- Cluster-Datenbanken
- Föderierte Datenbanken
- Parallele und verteilte DatenbankenDatenbewirtschaftungsarchitekturen
- Data Warehousing (einschl. ETL-Prozesse)
- Data Lakes (einschl. ELT-Prozesse)
- Datenbewirtschaftung und Internet of Things / Industrie 4.0
- Datenbewirtschaftung für WearablesDatenintegrationsansätzeAusgewählte Aspekte der Big Data LandscapeAktuelle, etablierte Big Data FrameworksDatenstrommanagementsystemeDatenvorverarbeitung in Datenanalyseprozessen
- Lernergebnisse / Kompetenzziele
Wissensverbreiterung
Studierende, die dieses Modul erfolgreich studiert haben, kennen grundlegende Konzepte und Verfahren zur Datenhaltung, -bewirtschaftung, -integration und -vorverarbeitung, auch unter Berücksichtigung von Big Data. Sie sind in der Lage, Datenbewirtschaftungsarchitekturkonzepte hinsichtlich ihrer Eignung zu bewerten und ausgewählte Aufgabenstellungen zu bearbeiten.
Wissensvertiefung
Die Studierenden, die dieses Modul erfolgreich studiert haben, verfügen über detailliertes Wissen zu Aufgaben und Möglichkeiten moderner Datenbewirtschaftungsansätze. Darüber hinaus verfügen Sie über Spezialwissen hinsichtlich der Verarbeitung von Daten aus verschiedenen Quellen.
Können - instrumentale Kompetenz
Die Studierenden können die Einführung und den Betrieb (datengetriebener), zeitgemäßer und nachhaltiger Datenhaltung begleiten. Sie sind in der Lage, Daten aus vielfältigen Quellen zu integrieren und die Daten nachgelagerten Systemen, z.B. der Datenanalyse, integriert, transformiert und ggf. aufgabengerecht bereitzustellen.
Können - kommunikative Kompetenz
Die Studierenden sind in der Lage, gemeinsam mit Domänenexperten Lösungsansätze zu diskutieren. Ihre sozio-kommunikative Kompetenz befähigt sie, ihre Standpunkte und Erkenntnisse sprachadäquat gegenüber Fach- und Domänenexperten zu vertreten und zu begründen.
Können - systemische Kompetenz
Die Studierenden sind in befähigt, Datenhaltung, -integration und -bereitstellung ganzheitlich zu betrachten, um eine konsistente, effiziente Datenbewirtschaftung zu ermöglichen. Sie sind in der Lage, sich in neue Datenverarbeitungsframeworks selbständig einzuarbeiten, diese auf der Basis der vermittelten Konzepte zu bewerten und ggf. in eine Datenhaltungslandschaft zu integrieren
- Lehr-/Lernmethoden
In seminaristischen Vorlesungen werden die theoretischen Grundlagen vermittelt und in zunehmend komplexeren Übungen anhand von Fallbeispielen behandelt.
- Empfohlene Vorkenntnisse
(relationale) Datenbanken, Programmierkenntnisse sind von Vorteil
- Modulpromotor
Tapken, Heiko
- Lehrende
Tapken, Heiko
- Leistungspunkte
5
- Lehr-/Lernkonzept
Workload Dozentengebunden Std. Workload Lehrtyp 24 Vorlesungen 7 Teletutorien Workload Dozentenungebunden Std. Workload Lehrtyp 50 Veranstaltungsvor-/-nachbereitung 69 Übungen
- Literatur
Big Data in der Praxis: Lösungen mit Hadoop, Spark, HBase und Hive. Daten speichern, aufbereiten, visualisieren, Jonas Freiknecht, 2018
NoSQL: Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken, Stefan Edlich und Achim Friedland, 2011
Data Mining: Concepts and Techniques, 3rd Edition, Jiawei Han, Micheline Kamber, Jian Pei, 2011
Big Data: Entwicklung und Programmierung von Systemen für große Datenmengen und Einsatz der Lambda-Architektur, Nathan Marz und James Warren, 2016
Verteiltes und Paralleles Datenmanagement: Von verteilten Datenbanken zu Big Data und Cloud, Erhard Rahm und Gunter Saake, 2015
- Prüfungsleistung
- Hausarbeit
- Portfolio Prüfung
- Projektbericht, schriftlich
- Bemerkung zur Prüfungsform
Die Portfolio Prüfung umfasst insgesamt 100 Punkte. Sie setzt sich zusammen aus einem Referat (40 Punkte) und einer Hausarbeit (60 Punkte).
- Dauer
1 Semester
- Angebotsfrequenz
Nur Sommersemester
- Lehrsprache
Deutsch