Einführung in Data Science

 

Studienführer Einführung in Data Science (WS 2020/2021)

Aufgrund des Coronavirus werden die Vorträge online sein und über RWTHmoodle verteilt. Überprüfen Sie RWTHmoodle auf die neuesten Informationen und verwenden Sie nur , um die Dozenten zu kontaktieren

Dozenten

  • Prof. Dr. Wil van der Aalst (Vorlesungen)
  • Miriam Wagner M.Sc.
  • Lisa Mannel M.Sc.
  • Anahita Farhang Ghahfarokhi M.Sc.
  • Gyunam Park M.Sc.
  • Mahnaz Qafari M.Sc.
  • Mahnaz Mirbolouki Dr.

Kursziel

Ziel des Kurses ist es, einen umfassenden Überblick auf dem Gebiet Data Science zu
vermitteln und die Studierenden mit realen Datensätzen und Werkzeugen vertraut zu
machen.

Der Kurs beinhaltet drei Sichtweisen auf den Bereich Data Science:

  1. Infrastruktur unter besonderer Berücksichtigung von Volumen und Geschwindigkeit.
    Themen sind u.a. Instrumentarium, Big Data-Infrastrukturen sowie verteilte Systeme,
    Datenbanken, Datenmanagement und Programmierung. Die größte Herausforderung
    besteht darin, eine Skalierbarkeit und sofortige Verfügbarkeit herzustellen.
  2. Datenwissenschaftliche Analysen, die sich mit der Extraktion von Daten aus Wissen
    beschäftigen. Zu diesen Themen gehören Statistik, Data- und Process Mining, maschinelles
    Lernen / künstliche Intelligenz, Operations Research, Algorithmen und Visualisierung.
    Die größte Herausforderung besteht darin, Antworten auf bekannte und unbekannte
    Fragen zu erhalten.
  3. Auswirkung von Data Science auf Menschen, Organisationen und die Gesellschaft. Zu
    den Themen gehören u.a. Ethik und Datenschutz, IT-Recht, Interaktion Mensch-Technik,
    Betriebsführung, Geschäftsmodelle, Unternehmerschaft. Die größte Herausforderung
    besteht darin, ein verantwortungsbewusstes Handeln bezüglich aller oben genannten Aspekte zu
    ermöglichen.

Der Kurs wird folgende Themen eingehender behandeln:

  • Datenexploration
  • Datenvisualisierung
  • Probleme mit der Datenqualität und Datenvorbereitung
  • Datentypen: von Tabellen und Ereignisprotokollen bis hin zu unstrukturierten Daten
  • Betreutes Lernen
  • Lernen von Entscheidungsbäumen
  • Unbeaufsichtigtes Lernen
  • Clustering
  • Pattern Mining
  • Process Mining
  • Text Mining
  • Bewertungsverfahren
  • Verteilung mittels MapReduce
  • Verantwortung im Bereich Data Science: Fairness, Genauigkeit, Vertraulichkeit und
    Transparenz
  • Diskriminierungsbewusstsein im Bereich des Data Mining
  • Anonymisierung versus Verschlüsselung

Dieses wird durch praktische Übungen ergänzt, bei denen verschiedene Datensätze und und Software-Tools zum Einsatz kommen (weitere Informationen folgen).

Lernziel

Nach Abschluss des Kurses sollte der Studierende einen guten Überblick über den umfangreichen
Bereich der Data Science erhalten haben. Praktische Übungen mit realen Datensätzen erlauben es
den Studierenden, die Herausforderungen in den verschiedenen Teilbereichen der Data Science
besser verstehen. Darüber hinaus werden ausgewählte Themen eingehender betrachtet,
die dann auch weitergehend theoretisch beleuchtet werden.

Kontakt

 

Häufig gestellte Fragen

Dieser Kurs ist nicht Teil meines Studienplans. Wie kann ich mich einschreiben?

Informationen zur Studienplanänderung finden Sie hier. Diese Informationen sind zwar für Maschinenbauer, aber für andere Studiengänge ist der Prozess ähnlich. Um zu Moodle hinzugefügt zu werden, senden Sie bitte eine E-Mail mit Ihrer RWTH-Adresse an , in der die Situation kurz erläutert wird.

Ich möchte den Kurs über eine freie Anmeldung belegen, kann mich aber nicht selbst einschreiben.

Bitte senden Sie eine E-Mail mit Ihrer Immatrikulationsnummer an und erläutern Sie kurz die Situation.