Servicenavigation


Sie sind hier:

M.Sc. Hendrik van der Wurp

Statistical Methods for Big Data

Kontakt

Mathematik,
Raum 226
0231 755 - 7204
0231 755 - 5305
Fakultät Statistik
Technische Universität Dortmund
44221 Dortmund


Bundesliga Prognosen 2019/2020

    Um die besonderen Umständen der Geisterspiele während der COVID-19 Pandemie zu berücksichtigen, wird vorerst wie folgt verfahren:

    • Intercepts der beiden marginalen Regressionen werden gemittelt und überschrieben. Auf diese Weise wird der Heimvorteil entfernt und die übrigen Variablen gleichzeitig nicht verzerrt, indem man historische Spiele ohne Heimvorteil fitten müsste.
    • Nach 4 Spieltagen ohne Zuschauer wird "Geisterspiel" als Variable hinzugefügt. Diese Variable beeinflusst Heim- und Gastteam mit einem Faktor von 1, respektive -1, und wird ebenfalls mit der Penalty aus van der Wurp et al. (2019) belegt. Auf diese Weise kann der Regressionsansatz den Heimvorteil einbauen und für Geisterspiele abschwächen, falls die Daten das nahelegen. Gleichzeitig wird die medial beliebte Theorie, dass sich in Geisterspielen die reine Stärke eines Teams niederschlägt, aufgegriffen, indem eine Wechselwirkung zwischen Marktwert und Geisterspiel ergänzt wird.

     

    Die Grundsätzliche Methodik der Modellierung orientiert sich am Paper van der Wurp et al. (2019). Die verwendeten Kovariablen sind:

    • Tabellenplatzierung der Vorsaison (Aufsteiger entsprechen Platzierungen 16-18)
    • Aufsteiger (ja/nein)
    • Marktwert anteilig vom Marktwert der Bundesliga
    • Durchschnittliche Wettquoten verschiedener Wettanbieter, umgerechnet in Wahrscheinlichkeiten und bereinigt um Margen
    • (Ab Spieltag 4: Aktuelle Tabellenplatzierung)
    • (Ab Spieltag 4: Form, Punkte aus den letzten drei Spielen)

    Aus den geschätzten Wahrscheinlichkeiten könnten z.B. Wettstrategien abgeleitet werden. Um nur Wetten mit positivem Erwartungswert (nach unserem Modell) einzugehen, sollte das Produkt aus geschätzter Wahrscheinlichkeit und angebotener Wettquote stets größer als 1 sein.

     

     

     

    Sprechzeiten

    •  Termine auf Anfrage

     

    Kurzlebenslauf

    • Seit SoSe 2018: Wissenschaftlicher Mitarbeiter der FG Datenanalyse und Statistische Algorithmen (jetzt: Statistical Methods for Big Data)
    • WiSe 2017/18: Wissenschaftlicher Mitarbeiter im Rahmen der neurologischen Studien "DEMPARK / LANDSCAPE" an der Philipps-Universität Marburg
    • SoSe 2017: Masterarbeit: "Eine Analyse von Spielzügen im Fußball anhand räumlich-zeitlicher Methoden"
    • SoSe 2014: Bachelorarbeit: "Analyse der StuPa-Wahlen 2001 bis 2013"
    • 2010 bis 2017: Studium Statistik (M.Sc.) an der TU Dortmund

     Lehre

     

    Publikationen

    • Generalised Joint Regression for Count Data with a Focus on Modelling Football Matches (arXiv, 2019)
    • Generalised joint regression for count data: a penalty extension for competitive settings (Statistics and Computing, 2020)