Information systems in analytical applications in sports - A data modeling perspective

Titel in Übersetzung: Informationssysteme in analytischen Anwendungen im Sport - eine Datenmodellierungsperspektive

Publikation: Buch/BerichtDissertationsschrift

436 Downloads (Pure)

Abstract

In der heutigen datengesteuerten Welt kann der Wert von Daten gar nicht hoch genug eingeschätzt werden. Es hat sich jedoch gezeigt, dass es nicht ausreicht, einfach nur Daten zu besitzen. Die Verwaltung, Modellierung und komplexe Analyse von Daten haben sich in verschiedenen Bereichen als wichtige Triebkräfte für Innovationen erwiesen. Dies hat zum Aufstieg der Datenwissenschaft als multidisziplinäres Fachgebiet geführt, das Elemente aus der Informatik, der Statistik und dem bereichsspezifischen Wissen kombiniert. Wie in anderen wissenschaftlichen Disziplinen ist auch im Sportbereich eine umfangreiche Literatur entstanden, die Informatik, Statistik und Sportwissenschaft miteinander verbindet. Zwei Hauptbereiche haben große Aufmerksamkeit erregt: Sportprognosen und Sportanalysen. Bei der Sportprognose werden historische Daten und andere relevante Faktoren verwendet, um Modelle zu entwickeln, mit denen sich das Ergebnis von Sportereignissen genau vorhersagen lässt, d. h. der Ausgang des Ereignisses oder in einigen Fällen auch andere relevante Folgen wie die Position in der Liga oder das Ergebnis. Die Sportanalytik setzt fortschrittliche Analysemethoden ein, um die Leistung von Profisportler*innen und Mannschaften zu bewerten. Der aktuelle Stand der Technik stützt sich in hohem Maße auf Ereignisdaten und Tracking-Daten. Ereignisdaten erfassen qualitative Informationen über jede Aktion in einem Sportspiel, wie Pässe, Schüsse, Fouls und mehr. Verfolgungsdaten hingegen liefern hochfrequente Positionsdaten der Spieler und des Balls auf dem Spielfeld.

Trotz der Wurzeln und größten Herausforderungen von Big Data, die sich mit der Verwaltung, Integration und angemessenen Darstellung heterogener Datenquellen befassen, scheint der Bereich der Datenwissenschaft die Bedeutung der Ausrichtung auf Datenanforderungen und die Strukturierung der Datenverarbeitungspipeline zu übersehen. Obwohl die Sportanalyseforschung große Fortschritte gemacht hat, stützt sie sich häufig auf zu vereinfachte Pipelines, die Verwendung von Rohdatensätzen und das Fehlen einer standardisierten Datenmodellierung. Darüber hinaus gibt es bei der Sportvorhersage kritische Probleme bei der Bewertung der Vorhersagequalität ihrer Quellen, vor allem wegen der inhärenten Zufälligkeit von Sportereignissen und dem Mangel an Basisdaten für die Bewertung. Die vorliegende Dissertation zielt darauf ab, diese Herausforderungen anzugehen, indem sie die Datenlandschaft und die Anforderungen in den Bereichen Sportanalytik und Sportprognose untersucht.

Der erste Beitrag ist die Dokumentation einer umfassenden Abstraktion des Sportprognoseprozesses, dargestellt als einheitliches Informationssystem. Aus der vorhandenen Literatur werden vier Komponenten identifiziert und als Sportprognoseprozess im Detail modelliert. Dieser Prozess beginnt mit der Konfiguration eines Sportwettbewerbs, an V Zusammenfassung dem Mannschaften oder Einzelpersonen innerhalb eines vordefinierten Wettkampfplans teilnehmen, und folgt mit den analytischen Aufgaben der Schätzung des Teilnehmerwerts, der Modellierung von Vorhersagen und der Bewertung der Qualität der Vorhersagen. Darüber hinaus dient die Abstraktion des Sportprognoseprozesses als Grundlage für die Entwicklung eines vielseitigen Rahmens für die künstliche Datengenerierung, der eine gründliche Untersuchung aktueller Methoden mit Ground-Truth-Informationen und die Erstellung neuer, auf Genauigkeit basierender Metriken ermöglicht. Durch den Vergleich von Bewertungsverfahren und Prognosemodellen mit den tatsächlichen Wahrscheinlichkeiten ermöglicht der Rahmen strenge Beurteilungen, wodurch die Auswirkungen zufälliger Faktoren innerhalb des Systems wirksam abgeschwächt werden. Der Rahmen ermöglicht die Untersuchung von bisher unerforschten Aspekten der Sportprognose, wie z. B. den Einfluss von Wettkampfplänen auf aktuelle Bewertungsverfahren und Prognosemodelle. Diese Erforschung kann zu verbesserten Bewertungsverfahren und präziseren Prognosemodellen führen.

Im Rahmen der Datenwissenschaft für die Sportleistungsanalyse wird in dieser Arbeit die effiziente Nutzung von Ereignisdaten evaluiert. Wir führen ein kanonisches Modell zur Darstellung von Ereignisdaten ein, indem wir ihre kollaborative und sequenzielle Natur anerkennen. Im Gegensatz zu bestehenden Paradigmen, die sich ausschließlich auf eine erfolgsbasierte Analyse stützen, wird ein prozessorientierter Ansatz vorgeschlagen. Dieser Ansatz ermöglicht die systematische Untersuchung verschiedener Forschungsfragen, bietet ein umfassenderes Verständnis der kollaborativen Prozesse im Sport und erleichtert die Untersuchung von Entscheidungsfähigkeiten. Der neue Ansatz wird auf die Identifizierung von Strategien im Fußball angewendet. Durch den Einsatz von Prozessentdeckungstechniken werden Verhaltensmuster aus Ereignisdatenprotokollen extrahiert und auf domänenspezifische Visualisierungen für einen besseren Wissenstransfer abgebildet.

Diese Arbeit trägt zur Weiterentwicklung der Sportwissenschaft bei, indem sie das Fachwissen der Sportwissenschaft artikuliert und in die Datenwissenschaft einbettet. Wir adressieren die Kommunikationslücke zwischen Sportwissenschaftlern und Datenwissenschaftlern, indem wir konzeptionelle Artefakte bereitstellen, die die Wissensbasis mit Berechnungsmethoden abgleichen können. Die Relevanz und Nutzbarkeit der vorgestellten konzeptionellen Artefakte wird anhand praktischer Anwendungsfälle evaluiert, in denen neue Erkenntnisse als Ergebnis der vorgeschlagenen Datenmodellierungstechniken und Wissensentdeckungsmethoden vorgestellt werden. Dadurch werden die Bereiche Sportprognose und Sportanalytik erweitert. Insgesamt werden in dieser Arbeit innovative Datenmodelle und datengetriebene Ansätze vorgestellt, die die Grenzen der Sportinformationswissenschaft erweitern. Durch die Förderung einer tieferen Integration zwischen Datenwissenschaft und Sportwissenschaft legen wir den Grundstein für weitere Fortschritte in der auf den Sport Informatik.
Titel in ÜbersetzungInformationssysteme in analytischen Anwendungen im Sport - eine Datenmodellierungsperspektive
OriginalspracheEnglisch
ErscheinungsortKöln
VerlagDeutsche Sporthochschule Köln
Seitenumfang44
PublikationsstatusVeröffentlicht - 2023

Fingerprint

Untersuchen Sie die Forschungsthemen von „Informationssysteme in analytischen Anwendungen im Sport - eine Datenmodellierungsperspektive“. Zusammen bilden sie einen einzigartigen Fingerprint.

Zitation