Kursinformation | Data Mining und Maschinelles Lernen 2021

Data Mining und Maschinelles Lernen 2021

Ziel: Der Kurs soll ein Grundverständnis für den aktuellen Motor der Künstlichen Intelligenz: Data Mining und Maschinelle Lernen vermitteln.
Ausgehend von einer kurzen Geschichte der KI und einer Klärung wie Data Mining/Maschinelles Lernen und KI zu einander stehen, werden die grundlegenden Lernaufgaben (Klassifikation, Regression, Clusteranalyse) und -settings (überwacht, unüberwacht, verstärkend) sowie Assoziationsregeln vorgestellt.
Weiterhin werden verschiedene Modelltypen des maschinellen Lernens behandelt; von linearen Modellen, baumbasierten Verfahren, Support-Vektor-Maschinen bis hin zu tiefen neuronalen Netzen. Ein weiterer Fokus wird darauf gelegt, wie diese Modelle evaluiert, in einem Ensemble kombiniert und die Wahl für eine Modell-Entscheidung begründet werden kann.

Themenübersicht:

Überblick zum Maschinellen Lernens
Datenanalyse-Zyklus (CRISP)
K-nächste-Nachbarn
Kreuzvalidierung
Überanpassung
Bias-Varianz Tradeoff
Klassifikation
Regression
Lineare Modelle
Modell-Selektion und Evaluierung
Baumbasierte Verfahren
Ensemble Methoden (Bagging & Boosting)
Naive Bayes
Bayes'sche Netzwerke
Stützvektormethode
K-Means
Deep Learning
Multi-Layer Perceptron
Faltungsnetzwerke
Assoziationsregeln

In der Übung wird der Stoff anhand von praktischen Aufgaben in Python und der Bibliothek Scikit-Learn vertieft.
Theoretische Übungsaufgaben, die unter anderem auf die Annahmen und Limitierungen der Modelltypen abzielen, ergänzen dabei die Programmieraufgaben.

Dozent*in: Johannes Czech
Dozent*in: Kristian Kersting