Die zunehmende Verfügbarkeit von Daten hat einen positiven Einfluss auf die sportpraktischen und sportwissenschaftlichen Domänen (Morgulev, 2018). In den Teamsportarten rücken in den letzten Jahren besonders zwei Datenquellen immer mehr in den Fokus: Räumlich-zeitliche Positionsdaten und manuell annotierte Eventdaten (Memmert & Raabe, 2018). In der Regel werden Positionsdaten von automatischen globalen, lokalen oder videobasierten Trackingsystemen erhoben und beinhalten die Positionen der Spieler auf einem Spielfeld in Form von x/y-Koordinaten mit einer hohen zeitlichen und räumlichen Auflösung. Eventdaten werden dagegen manuell erhoben indem relevante Spielereignisse, wie Pässe, Schüsse oder Tore zeitlich markiert werden. Diese Daten werden in professionell organisierten Sportarten, wie Fußball, Handball oder Basketball erhoben und im Rahmen der Spielanalyse genutzt, um Belastungen zu charakterisieren und zu steuern oder Verhalten von (gegnerischen) Teams zu analysieren (Castellano et al., 2014; Rein & Memmert, 2016).
Unabhängig von der wachsenden Verfügbarkeit von Positions- und Eventdaten, bleiben die technischen Hürden diese Auszuwerten hoch. Dies liegt zum einen an der Komplexität der Daten, auf Grund derer spezielle Einlesealgorithmen benötigt werden. Zum anderen gibt es aktuell keinen technischen Standard für Datenformate oder zeitliche und räumliche Auflösung. Dies schränkt zusätzlich die Kompatibilität zwischen Datenanbietern ein. Zusätzlich werden selbst für grundlegende Routinen (z.B. Rotation des Spielfelds, Glätten von verrauschten Daten, Berechnung von Geschwindigkeiten) fortgeschrittene Programmierkenntnisse benötigt um diese mit wissenschaftlichem Standard durchzuführen. Solche Kenntnisse sind selten Teil eines sportwissenschaftlichen Curriculums, sodass dies eine unüberwindbare Hürde für Sportwissenschaftler und Praktiker darstellt, die mit Positions- und Eventdaten arbeiten wollen.
Die Python Bibliothek floodlight wurde spezifisch designet, um den Einstieg in die Analyse von Positions- und Eventdaten in den Sportspielen zu vereinfachen. floodlight automatisiert grundlegende Verarbeitungsroutinen und bietet eine Benutzeroberfläche für Anwender mit minimalen Programmierkenntnissen. floodlight enthält weiterhin eine ausführliche Dokumentation mit mehreren Tutorials, sowie ein Kompendium, das die technischen Aspekte der Datenanalyse, Routinen und Designentscheidungen diskutiert. So sind beispielsweise Parameter bestimmter Algorithmen frei wählbar, ein Standardwert ist jedoch jeweils gesetzt, der sich als „best practice“ aus der Literatur ergeben hat.
Damit ist floodlight Vorreiter für das Veröffentlichen von Code für die Datenanalyse in den Sportspielen. Die Bibliothek bietet eine nachhaltige Plattform für Sportwissenschaftler und Informatiker im wissenschaftlichen und angewandten Bereich und ermöglicht interdisziplinäre Zusammenarbeit mit dem Ziel Open Source Praktiken in den Sportwissenschaften zu etablieren.
· Bundesministeriums für Bildung und Forschung (BMBF), 011S20021A
MM4SPA
· Deutschen Forschungsgemeinschaft (DFG), ME 2678/43 1