Ziel: Der Kurs soll ein Grundverständnis für den aktuellen Motor der Künstlichen Intelligenz: Data Mining und Maschinelle Lernen vermitteln.
Ausgehend von einer kurzen Geschichte der KI und einer Klärung wie Data Mining/Maschinelles Lernen und KI zu einander stehen, werden die grundlegenden Lernaufgaben (Klassifikation, Regression, Clusteranalyse) und -settings (überwacht, unüberwacht, verstärkend) sowie Assoziationsregeln vorgestellt.
Weiterhin werden verschiedene Modelltypen des maschinellen Lernens behandelt; von linearen Modellen, baumbasierten Verfahren, Support-Vektor-Maschinen bis hin zu tiefen neuronalen Netzen.
Ein weiterer Fokus wird darauf gelegt, wie diese Modelle evaluiert, in einem Ensemble kombiniert und die Wahl für eine Modell-Entscheidung begründet werden kann.
Themenübersicht:
- Überblick zum Maschinellen Lernens
- Datenanalyse-Zyklus (CRISP)
- K-nächste-Nachbarn
- Kreuzvalidierung
- Überanpassung
- Bias-Varianz Tradeoff
- Klassifikation
- Regression
- Lineare Modelle
- Modell-Selektion und Evaluierung
- Baumbasierte Verfahren
- Ensemble Methoden (Bagging & Boosting)
- Naive Bayes
- Bayes'sche Netzwerke
- Stützvektormethode
- K-Means
- Deep Learning
- Multi-Layer Perceptron
- Faltungsnetzwerke
- Assoziationsregeln
In der Übung wird der Stoff anhand von praktischen Aufgaben in Python und der Bibliothek Scikit-Learn vertieft.
Theoretische Übungsaufgaben, die unter anderem auf die Annahmen und Limitierungen der Modelltypen abzielen, ergänzen dabei die Programmieraufgaben.
- Dozent*in: Johannes Czech
- Dozent*in: Kristian Kersting