263-5200-00L Data Mining: Learning from Large Data Sets
Semester | Frühjahrssemester 2015 |
Dozierende | A. Krause |
Periodizität | jährlich wiederkehrende Veranstaltung |
Lehrveranstaltung | Findet dieses Semester nicht statt. |
Lehrsprache | Englisch |
Kommentar | The course will be offered again in the autumn semester 2015. |
Lehrveranstaltungen
Nummer | Titel | Umfang | Dozierende | |
---|---|---|---|---|
263-5200-00 V | Data Mining: Learning from Large Data Sets Findet dieses Semester nicht statt. | 2 Std. | A. Krause | |
263-5200-00 U | Data Mining: Learning from Large Data Sets Findet dieses Semester nicht statt. | 1 Std. | A. Krause |
Katalogdaten
Kurzbeschreibung | Many scientific and commercial applications require insights from massive, high-dimensional data sets. This courses introduces principled, state-of-the-art techniques from statistics, algorithms and discrete and convex optimization for learning from such large data sets. The course both covers theoretical foundations and practical applications. |
Lernziel | Many scientific and commercial applications require us to obtain insights from massive, high-dimensional data sets. In this graduate-level course, we will study principled, state-of-the-art techniques from statistics, algorithms and discrete and convex optimization for learning from such large data sets. The course will both cover theoretical foundations and practical applications. |
Inhalt | Topics covered: - Dealing with large data (Data centers; Map-Reduce/Hadoop; Amazon Mechanical Turk) - Fast nearest neighbor methods (Shingling, locality sensitive hashing) - Online learning (Online optimization and regret minimization, online convex programming, applications to large-scale Support Vector Machines) - Multi-armed bandits (exploration-exploitation tradeoffs, applications to online advertising and relevance feedback) - Active learning (uncertainty sampling, pool-based methods, label complexity) - Dimension reduction (random projections, nonlinear methods) - Data streams (Sketches, coresets, applications to online clustering) - Recommender systems |
Voraussetzungen / Besonderes | Prerequisites: Solid basic knowledge in statistics, algorithms and programming. Background in machine learning is helpful but not required. |
Leistungskontrolle
Information zur Leistungskontrolle (gültig bis die Lerneinheit neu gelesen wird) | |
Leistungskontrolle als Semesterkurs | |
ECTS Kreditpunkte | 4 KP |
Prüfende | A. Krause |
Form | Sessionsprüfung |
Prüfungssprache | Englisch |
Repetition | Die Leistungskontrolle wird nur in der Session nach der Lerneinheit angeboten. Die Repetition ist nur nach erneuter Belegung möglich. |
Prüfungsmodus | schriftlich 120 Minuten |
Zusatzinformation zum Prüfungsmodus | The grade is determined by a project [30%] and the final written exam [70%]. |
Hilfsmittel schriftlich | Two A4-pages (i.e. one A4-sheet of paper), either handwritten or 11 point minimum font size |
Diese Angaben können noch zu Semesterbeginn aktualisiert werden; verbindlich sind die Angaben auf dem Prüfungsplan. |
Lernmaterialien
Hauptlink | Information |
Es werden nur die öffentlichen Lernmaterialien aufgeführt. |
Gruppen
Keine Informationen zu Gruppen vorhanden. |
Einschränkungen
Keine zusätzlichen Belegungseinschränkungen vorhanden. |