263-5200-00L  Data Mining: Learning from Large Data Sets

SemesterFrühjahrssemester 2015
DozierendeA. Krause
Periodizitätjährlich wiederkehrende Veranstaltung
LehrveranstaltungFindet dieses Semester nicht statt.
LehrspracheEnglisch
KommentarThe course will be offered again in the autumn semester 2015.



Lehrveranstaltungen

NummerTitelUmfangDozierende
263-5200-00 VData Mining: Learning from Large Data Sets
Findet dieses Semester nicht statt.
2 Std.A. Krause
263-5200-00 UData Mining: Learning from Large Data Sets
Findet dieses Semester nicht statt.
1 Std.A. Krause

Katalogdaten

KurzbeschreibungMany scientific and commercial applications require insights from massive, high-dimensional data sets. This courses introduces principled, state-of-the-art techniques from statistics, algorithms and discrete and convex optimization for learning from such large data sets. The course both covers theoretical foundations and practical applications.
LernzielMany scientific and commercial applications require us to obtain insights from massive, high-dimensional data sets. In this graduate-level course, we will study principled, state-of-the-art techniques from statistics, algorithms and discrete and convex optimization for learning from such large data sets. The course will both cover theoretical foundations and practical applications.
InhaltTopics covered:
- Dealing with large data (Data centers; Map-Reduce/Hadoop; Amazon Mechanical Turk)
- Fast nearest neighbor methods (Shingling, locality sensitive hashing)
- Online learning (Online optimization and regret minimization, online convex programming, applications to large-scale Support Vector Machines)
- Multi-armed bandits (exploration-exploitation tradeoffs, applications to online advertising and relevance feedback)
- Active learning (uncertainty sampling, pool-based methods, label complexity)
- Dimension reduction (random projections, nonlinear methods)
- Data streams (Sketches, coresets, applications to online clustering)
- Recommender systems
Voraussetzungen / BesonderesPrerequisites: Solid basic knowledge in statistics, algorithms and programming. Background in machine learning is helpful but not required.

Leistungskontrolle

Information zur Leistungskontrolle (gültig bis die Lerneinheit neu gelesen wird)
Leistungskontrolle als Semesterkurs
ECTS Kreditpunkte4 KP
PrüfendeA. Krause
FormSessionsprüfung
PrüfungsspracheEnglisch
RepetitionDie Leistungskontrolle wird nur in der Session nach der Lerneinheit angeboten. Die Repetition ist nur nach erneuter Belegung möglich.
Prüfungsmodusschriftlich 120 Minuten
Zusatzinformation zum PrüfungsmodusThe grade is determined by a project [30%] and the final written exam [70%].
Hilfsmittel schriftlichTwo A4-pages (i.e. one A4-sheet of paper), either handwritten or 11 point minimum font size
Diese Angaben können noch zu Semesterbeginn aktualisiert werden; verbindlich sind die Angaben auf dem Prüfungsplan.

Lernmaterialien

 
HauptlinkInformation
Es werden nur die öffentlichen Lernmaterialien aufgeführt.

Gruppen

Keine Informationen zu Gruppen vorhanden.

Einschränkungen

Keine zusätzlichen Belegungseinschränkungen vorhanden.

Angeboten in

StudiengangBereichTyp
CAS in InformatikFokusfächer und WahlfächerWInformation
Informatik MasterWahlfächer der Vertiefung in Information SystemsWInformation
Informatik MasterWahlfächer der Vertiefung in Visual ComputingWInformation
Robotics, Systems and Control MasterArtificial IntelligenceWInformation
Statistik MasterStatistische und mathematische FächerWInformation