Servicenavigation


Sie sind hier:

Lehrstuhlinhaber

Sekretariat

Data Mining Cup

Der Data Mining Cup 2013 findet vom 3. April bis 15. Mai 2013 statt.

Das Datum bezieht sich auf den offiziellen Wettbewerb, nicht die Lehrverantstaltung!

Er gilt als der größte Data Mining Wettbewerb weltweit. Jedes Jahr ist ein praktisches Problem der intelligenten Datenanalyse im Wettstreit mit anderen Universitäten zu lösen.

Weitere Informationen zum Wettbewerb unter: http://www.data-mining-cup.de/

Durch eine erfolgreiche Teilnahme - dies umfasst das Schreiben eines Berichts und das Halten von Vorträgen - kann ein Fallstudien-II-Schein erworben werden.

Zeit & Ort

Di 14 - 16, CDI 121

Do 14 - 16, CDI 121

Organisatorisches

ANMELDUNG BEI INTERESSE

friedrichs@statistik.tu-dortmund.de

MÖGLICHST BALD, bis zum 25.1.

IN DER WOCHE vom 28.1. – 1.2. TREFFEN WIR UNS ZU EINER VORBESPRECHUNG 


Bei Fragen sind wir hier zu erreichen

 

Genereller Zeitblauf:

  • Wir müssen sehr pünktlich zu Beginn des Semester starten, vermutlich etwas früher.
  • Es wird einen Crash-Kurs zu Methoden geben, bei dem vornehmlich ihr Vorträge haltet.
  • Wir geben euch Starthilfe zum Wettbewerb im Allgemeinen und zu Software und Technik.
  • Die diesjährige Aufgabe wird am 3. April bekannt gegeben. Ihr bearbeitet sie gemeinsam im Team.
  • Bis zum 15. Mai gebt ihr eine gemeinsame Lösung ab. Die Zeit bis dahin wird anstrengend! Danach wird es etwas ruhiger.
  • Bis zum Ende der Vorlesungszeit verfasst jeder einen individuellen Bericht.

 

Scheinerwerb (Fallstudien-II-Schein)

  • Voraussetzungen: Wie bei Fallstudien II
  • 2 Vorträge (1 Theorie-Vortrag im Crash-Kurs, 1 weiterer Vortrag nach Abschluss des Wettbewerbs)
  • Engagement im Wettbewerb, Kurzvorträge zu Zwischenergebnissen
  • 1 individueller Bericht. Dies ist ein üblicher wissenschaftlicher Text. Prinzipiell nicht anders als ein Fallstudien-II-Bericht. Er wird nach Ende des Wettbewerbs verfasst. 

  

Hilfreiche Kenntnisse und Fähigkeiten

  • Wissensentdeckung in Datenbanken
  • Statistische Lernverfahren
  • Klassifikation
  • Wichtig: Programmieren in R
  • Eigenständiges Arbeiten und Teamwork
  • Bereitschaft zur Einarbeitung in neue Methoden!

Aufgaben der letzten Jahre

Aufgabe 2010

Aufgabe 2011

Unser Siegerteam von 2011:

Berichte

Abgabe der Berichte bis zum 19.07.2013

Zeitplan und Vortragsfolien

Die folgende Übersicht ist aus 2011 und dient nur dem Eindruck, was wir damals gemacht haben wir damals gemacht haben!

Nach der Vorbesprechung werden wir diese neu festlegen!

Mo, 4.4., 12-14 Uhr Vortrag Einführung Machine Learning und DMCJulia Schiffner[pdf]
Vortrag Exploration, Visualisierung und PreprocessingSermad Abbas[pdf]

Vortrag Entscheidungsbäume und Random ForestsSebastian Szugat[pdf]
Mi, 6.4., 16-18 UhrVortrag SVMsAdam Skubala[pdf]

Vortrag BoostingBernd Bischl[pdf]
Vortrag Gradient Boosting Machine[pdf]
Fr, 8.4., 14-16 UhrMachine Learning in R, subversion, wiki etc.
Mo, 11.4., 12-14 UhrVortrag Vergleich von Methoden, Resampling, TuningStefan Meinke[pdf]

Vortrag Variablenselektion

Gabi Totova[pdf]
Mi, 13.4., 16-18 Uhr
Vortrag Klassifikation/Regression mit Kosten bzw. unüblichen VerlustfunktionenJulia Schiffner[pdf]

Fr, 15.4., 14-16 Uhr

Start Data Mining Cup

kurze Besprechung der Aufgabe

Machine Learning in R, subversion, wiki etc.

Mo, 18.4., 12-14 UhrPräsentation der Exploration / erste Ergebnisse
danach

weiteres Bearbeiten der Aufgabe,

Präsentation der Zwischenergebnisse

Diskussion des Vorgehens im Plenum

Di, 31.5.Abgabe der Ergebnisse und Ende Data Mining Cup

Wiki

Wiki