401-3632-00L  Computational Statistics

SemesterFrühjahrssemester 2017
DozierendeM. Mächler, P. L. Bühlmann
Periodizitätjährlich wiederkehrende Veranstaltung
LehrspracheEnglisch


Kurzbeschreibung"Computational Statistics" deals with modern methods of data analysis (aka "data science") for prediction and inference. An overview of existing methodology is provided and also by the exercises, the student is taught to choose among possible models and about their algorithms and to validate them using graphical methods and simulation based approaches.
LernzielGetting to know modern methods of data analysis for prediction and inference.
Learn to choose among possible models and about their algorithms.
Validate them using graphical methods and simulation based approaches.
InhaltDas Schliessen von beobachteten Daten auf komplexe Modelle ist ein zentrales Thema der rechnerorientierten Statistik. Die Modelle sind oft unendlich-dimensional und die statistischen Verfahren deshalb Computer-intensiv.
Als Grundlage wird die klassische multiple Regression eingeführt. Danach werden einige nichtparametrische Verfahren für die Regression und die Klassifikation vorgestellt: Kernschätzer, glättende Splines, Regressions-/Klassifikationsbäume, additive Modelle, Projection Pursuit und (kurz) Neuronale Netze, wobei einige davon gut interpretierbar und andere für genaue Prognosen geeignet sind. Insbesondere werden auch die Problematik des Fluchs der Dimension und die stochastische Regularisierung diskutiert. Hochdimensionale Modelle werden mit LASSO u.ä. Verfahren regularisiert. Nebst dem Anpassen eines (komplexen) Modells werden auch die Evaluation, Güte und Unsicherheit von Verfahren und Modellen anhand von Resampling, Bootstrap und Kreuz-Validierung behandelt.

In den Übungen wird mit dem Statistik-Paket R (https://www.R-project.org) gearbeitet. Es werden dabei auch praxis-bezogene Probleme bearbeitet. Aktive Teilnahme an den Übungen wird sehr empfohlen. Detailinformation sind auf https://stat.ethz.ch/lectures/ (-> "Computational Statistics").
Skriptlecture notes are available online; see
http://stat.ethz.ch/lectures/ (-> "Computational Statistics").
Literatur(see the link above, and the lecture notes)
Voraussetzungen / BesonderesBasic "applied" mathematical calculus (incl. simple two-dimensional) and linear algebra (including Eigenvalue decomposition) similar to two semester "Analysis" in an ETH (math or) engineer's bachelor.

At least one semester of (basic) probability and statistics, as e.g., taught in an ETH engineer's or math bachelor.

Programming experience in either a compiler-based computer language (such as C++) or a high-level language such as python, R, julia, or matlab. The language used in the exercises and the final exam will be R (https://www.r-project.org) exclusively. If you don't know it already, some extra effort will be required for the exercises.