Ziel: Der Kurs soll ein Grundverständnis für den aktuellen Motor der Künstlichen Intelligenz: Data Mining und Maschinelle Lernen vermitteln.
Ausgehend von einer kurzen Geschichte der KI und einer Klärung wie Data Mining/Maschinelles Lernen und KI zu einander stehen, werden die grundlegenden Lernaufgaben (Klassifikation, Regression, Clusteranalyse) und -settings (überwacht, unüberwacht, verstärkend) sowie Assoziationsregeln vorgestellt.
Weiterhin werden verschiedene Modelltypen des maschinellen Lernens behandelt; von linearen Modellen, baumbasierten Verfahren, Support-Vektor-Maschinen bis hin zu tiefen neuronalen Netzen. Ein weiterer Fokus wird darauf gelegt, wie diese Modelle evaluiert, in einem Ensemble kombiniert und die Wahl für eine Modell-Entscheidung begründet werden kann.

Themenübersicht:

  • Überblick zum Maschinellen Lernens
  • Datenanalyse-Zyklus (CRISP)
  • K-nächste-Nachbarn
  • Kreuzvalidierung
  • Überanpassung
  • Bias-Varianz Tradeoff
  • Klassifikation
  • Regression
  • Lineare Modelle
  • Modell-Selektion und Evaluierung
  • Baumbasierte Verfahren
  • Ensemble Methoden (Bagging & Boosting)
  • Naive Bayes
  • Bayes'sche Netzwerke
  • Stützvektormethode
  • K-Means
  • Deep Learning
  • Multi-Layer Perceptron
  • Faltungsnetzwerke
  • Assoziationsregeln

In der Übung wird der Stoff anhand von praktischen Aufgaben in Python und der Bibliothek Scikit-Learn vertieft.
Theoretische Übungsaufgaben, die unter anderem auf die Annahmen und Limitierungen der Modelltypen abzielen, ergänzen dabei die Programmieraufgaben.