Das Herbstsemester 2020 findet in einer gemischten Form aus Online- und Präsenzunterricht statt.
Bitte lesen Sie die publizierten Informationen zu den einzelnen Lehrveranstaltungen genau.

401-6245-00L  Data-Mining

SemesterHerbstsemester 2016
DozierendeM. Mächler
Periodizität2-jährlich wiederkehrende Veranstaltung
LehrspracheDeutsch
KommentarFachstudierende "Universität Zürich (UZH)" im Master-Studiengang Biostatistik von der UZH können diese Lerneinheit nicht direkt in myStudies belegen. Leiten Sie die schriftliche Teilnahmebewilligung des Dozenten an die Kanzlei weiter. Als Einverständnis gilt auch ein direktes E-Mail des Dozenten an kanzlei@ethz.ch. Die Kanzlei wird anschliessend die Belegung vornehmen.


KurzbeschreibungBlock über "Prognoseprobleme", bzw. "Supervised Learning"

Teil 1, Klassifikation: logistische Regression, Lineare/Quadratische Diskriminanzanalyse, Bayes-Klassifikator; additive & Baummodelle, weitere flexible ("nichtparametrische") Methoden.

Teil 2, Flexible Vorhersage: Additive Modelle, MARS, Y-Transformations-Modelle (ACE,AVAS); Projection Pursuit Regression (PPR), Neuronale Netze.
Lernziel
InhaltAus dem weiten Feld des "Data Mining" behandeln wir in diesem Block nur sogenannte "Prognoseprobleme", bzw. "Supervised Learning".

Teil 1, Klassifikation, repetiert logistische Regression und Lineare / Quadratische Diskriminanzanalyse (LDA/QDA), und erweitert diese (im Rahmen des "Bayes-Klassifikators") auf (generalisierte) additive ("GAM") und Baummodelle ("CART"), und (summarisch/kurz) auf weitere flexible ("nichtparametrische") Methoden.

Teil 2, Flexible Vorhersage (kontinuierliche oder Klassen-Zielvariable) umfasst Additive Modelle, MARS, Y-Transformations-Modelle (ACE, AVAS); Projection Pursuit Regression (PPR), Neuronale Netze.
SkriptGrundlage des Kurses ist das Skript.
Voraussetzungen / BesonderesDie Uebungen werden ausschliesslich mit der (Free, open source) Software "R"
(http://www.r-project.org) durchgeführt, womit am Schluss auch eine "Schnellübung" als Schlussprüfung stattfindet.