Forschungsdatenmanagement in der Sportwissenschaft: Aktuelle Entwicklungen
Chair(s): Keller, Katja (Karlsruher Institut für Technologie), Krüger, Melanie (Leibniz Universität Hannover), Niessner, Claudia (Karlsruher Institut für Technologie)
RAHMENABSTRACT
Das Management, Teilen und die Nachnutzung von Forschungsdaten haben in den letzten Jahren einen erheblichen Aufschwung erfahren – sowohl national durch die Nationale Forschungsdateninfrastruktur (NFDI) und ihre Konsortien als auch international durch Initiativen wie die European Open Science Cloud (EOSC). Die DFG (2023) sieht einen „fachspezifisch adäquate[n] Umgang mit Forschungsdaten“ als einen „wesentliche[n] Bestandteil qualitätsorientierter und anschlussfähiger Forschung“.
Auch in der Sportwissenschaft zeigen sich viele Entwicklungen auf Forschenden-, Lehr-, Projekt-, und Gremienebene. Mit dem 2022 berufenen dvs ad hoc-Ausschuss zum Forschungsdatenmanagement konnten viele Kräfte gebündelt werden und Arbeitsgruppen zu den Themen Sensible Daten, Leitlinien und Best Practices eingesetzt werden. Eine Umfrage bei deutschsprachigen Sportwissenschaftler:innen aus dem Jahr 2023 (N = 122, Keller et al., 2025) ergab z. B., dass 52 % ihre Daten teilen und 60.7 % sich eine disziplinäre FDM-Kultur in der Sportwissenschaft wünschen.
Mit diesem Symposium möchten wir einen nächsten Schritt in Richtung dieser Kultur gehen und erste Ergebnisse der Arbeitsgruppen des dvs ad-hoc-Ausschusses sowie ausgewählte Projekte vorstellen. Das Symposium umfasst folgende fünf interdisziplinäre Beiträge:
• AI-Driven Platforms for Data & Video Analytics: floodlight and SportVid
• Persistente Identifikatoren (PID) für Sportstätten
• Aufbau einer Support-Struktur für das Forschungsdatenmanagement: Das Research Data Center Motor Performance
• Sensible Daten in der Sportwissenschaft
• Forschungsdatenmanagement in der Sportwissenschaft – Grundlagen und Best-Practice-Beispiele
LITERATUR
Deutsche Forschungsgemeinschaft. (2023). Umgang mit Forschungsdaten. https://www.dfg.de/de/grundlagen-themen/grundlagen-und-prinzipien-der-foerderung/forschungsdaten
Keller, K., Pleger, A., Niessner, C., Ueding, E., & Krüger, M. (2025). The status quo of research data management in the German-speaking sports sciences—Results of an online pilot survey. German Journal of Exercise and Sport Research. https://doi.org/10.1007/s12662-025-01033-0
Beiträge des Symposiums
AI-Driven Platforms for Data & Video Analytics: floodlight and SportVid
Paul, Yannik, Memmert, Daniel
Deutsche Sporthochschule Köln
EINLEITUNG
Die zunehmende Verfügbarkeit von Daten im Fußball ermöglicht detailliertere Analysen (Bassek et al., 2025; Memmert, 2025). Unterschiede in Datenformaten oder das ausschließliche Vorhandensein von Videoaufnahmen erschweren jedoch die Anwendung (Memmert, 2024). Zwei DFG-Projekte adressieren diese Herausforderungen durch die Entwicklung einer Software zur vereinfachten Nutzung von Ereignis- und Positionsdaten (ME 2678/43-1) sowie einer Plattform zur KI-gestützten Analyse von Sportvideos (ME 2678/49-1).
METHODE
Floodlight, ein Python-Package zur strukturierten Analyse von Sportdaten, standardisiert die Verarbeitung von Positions- und Ereignisdaten aus verschiedenen Quellen (Raabe et al., 2022). SportVid ist eine KI-basierte Plattform zur Videoanalyse und ermöglicht die KI-gestützte Extraktion von Positionsdaten und die Suche nach spezifischen Spielszenen.
ERGEBNISSE
Floodlight erlaubt das Laden, Integrieren und Verarbeiten von Positions- und Ereignisdaten aus verschiedenen Quellen. Es bietet eine standardisierte Struktur zur Datenverarbeitung und erleichtert die Kombination unterschiedlicher Formate. Zudem stellt es eine Schnittstelle für die automatisierte Berechnung von Leistungsindikatoren bereit, die zur taktischen Analyse genutzt werden können (Memmert & Raabe, 2023). SportVid ermöglicht die inhaltsbasierte Videosuche und die automatisierte Extraktion von Positionsdaten aus Videomaterial. Trainer:innen und Wissenschaftler:innen können damit gezielt Spielszenen analysieren, Bewegungsmuster erfassen und Vergleiche zwischen unterschiedlichen Spielsituationen ziehen. Die extrahierten Daten lassen sich mit Floodlight weiterverarbeiten, um umfassende Analysen zur Spielleistung durchzuführen.
DISKUSSION
Beide Tools tragen zur Digitalisierung der Sportwissenschaft bei, indem sie die Nutzung und Analyse von Sportdaten erleichtern. Dennoch fehlt es weiterhin an offenen und standardisierten Datenquellen, die eine breitere Anwendung, innovative Forschung und datenbasierte Entscheidungsprozesse fördern. Zukünftige Entwicklungen sollten sich auf die Integration weiterer offener Datenquellen und eine verbesserte Interoperabilität konzentrieren.
LITERATUR
Bassek, M., Rein, R., Weber, H., & Memmert, D. (2025). An integrated dataset of spatiotemporal and event data in elite soccer. Scientific Data, 12(1), 195.
Memmert, D. (Hrsg.). (2024). Computer Science in Sport: Modeling, Simulation, Data Analysis and Visualization of Sports-Related Data. Springer.
Memmert, D. (Hrsg.). (2025). Artificial Intelligence & Machine Learning in Sports Science. Springer.
Memmert, D., & Raabe, D. (2023). Data Analytics in Football. Positional Data Collection, Modelling and Analysis (3. Aufl.). Routledge.
Raabe, D., Biermann, H., Bassek, M., Wohlan, M., Komitova, R., Rein, R., Kuppens Groot, T., & Memmert, D. (2022). floodlight - A high-level, data-driven sports analytics framework. Journal of Open Source Software, 7(76), 4588.
Persistent Identifier (PID) für Sportstätten
Wallrodt, Sören1, Biniossek, Claudia2, Betz, Dirk2
1Hochschule Koblenz, 2TIB Hannover
EINLEITUNG
Persistente Identifikatoren (PID), wie z. B. DOI für Zeitschriftenbeiträge oder ORCID für Forschende, sind notwendig, um die FAIRifizierung wissenschaftlicher Artefakte voranzutreiben (Wilkinson et al., 2016). PIDs dienen neben der eindeutigen Identifikation eines digitalen Objektes u. a. auch dazu, Interoperabilität zwischen verschiedenen Systemen herzustellen oder die zu identifizierenden Objekte überhaupt auffindbar zu machen. Daten zu Sportstätten, wie z. B. bezüglich Ausstattung, Sanierungszustand, Energieeffizienz und verwendete Fördermittel, sind in unterschiedlichsten Datenbanken bzw. Repositorien vorhanden. Es bestehen allerdings bisher kaum Möglichkeiten, diese Datenbestände zu verknüpfen und die Daten zu „matchen“, weil bisher keine PID für Sportstätten existiert. Der Anwendungsfall PIDs für Sportstätten und die damit verbundene Vernetzung von Informationen und Wissen hat daher eine große Bedeutung für die Sportwissenschaft. Gleichzeitig sind PIDs für Sportstätten für alle Akteure mit Bezug zu Sportstätten von großer Relevanz.
METHODE
Das Vorgehen umfasst drei zentrale Schritte: (1) Sichtung und Analyse bestehender Sportstättendatenbanken und ihrer Datenmodelle; (2) Erhebung und Analyse des aktuellen Standes im Bereich wissenschaftlicher Dateninfrastrukturen, Metadatenstandards, PID-Provider und Governance-Modellen anhand folgender Methoden: Literaturrecherche, Experteninterviews; (3) Entwicklung eines Konzeptes, Entwurf eines Kern-Metadatenschemas und Tests anhand der Methode von Prototyping, Test, Evaluation & Adaptation.
ERGEBNIS
Im Rahmen eines BISp-geförderten Projekts wurde ein Konzept und ein Prototyp zur Umsetzung von PIDs für Sportstätten entwickelt und in konkreten Anwendungsfeldern bereits prototypisch in Nutzung gebracht. Dabei wurde u. a. ein Metadatenschema für Sportstätten entwickelt und verschiedene Use-Cases ausgearbeitet. Der Prozess der PID-Erstellung für Sportstätten wird anhand verschiedener Beispiele aufgezeigt, so werden verschiedene PID-Provider vorgestellt und deren Vor- und Nachteile mit Bezug zur Vergabe eine Sportstätten-PID abgewogen. Abschließend wird ein Ausblick auf die Möglichkeiten einer flächendeckenden Umsetzung des Konzepts gegeben.
DISKUSSION
PID stellen eine zentrale Notwendigkeit eines Sport(stätten)-Datenökosystems dar. Relevant ist eine Verknüpfung zu Institutionen und Konzepten außerhalb der Sportwissenschaft, wie z. B. dem Open Research Knowledge Graph und die Verbindung zum DOI-System.
LITERATUR
Wilkinson, M. D., Dumontier, M., Aalbersberg, I. J., Appleton, G., Axton, M., Baak, A., & Mons, B. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific data, 3(1), 1–9.
Aufbau einer Support-Struktur für das Forschungsdatenmanagement: Das Research Data Center Motor Performance
Rose, Christian, Keller, Katja, Zimmermann, Hannah, Eberhardt, Tanja, Schlenker, Lars, Woll, Alexander, Bös, Klaus, Niessner, Claudia
Karlsruher Institut für Technologie
EINLEITUNG
Das Research Data Center Motor Performance (RDC) ist das erste sportwissenschaftliche Forschungsdatenzentrum (FDZ), dass eine neue Zielgruppe anspricht, die bisher wenig Berührungspunkte mit Open Data und Open Science hatte. Diese Arbeit untersucht, welche Themen und Problemfelder in bestehenden FDZs regelmäßig auftreten, um effektive und nutzerorientierte Supportstrukturen zu entwickeln. Ziel ist es, zentrale Anforderungen und Herausforderungen zu identifizieren, die für die Entwicklung eines funktionalen Supportbereichs relevant sind, basierend auf bestehenden Supportdokumentationen und Expert:inneninterviews.
METHODE
Die Untersuchung im Frühjahr 2025 kombiniert zwei qualitative Verfahren: eine thematische Analyse zur systematischen Auswertung von FAQ- und Support-Seiten ausgewählter FDZs sowie eine anschließende qualitative Inhaltsanalyse von Interviews mit zwei FDZ-Vertretern. Die thematische Analyse dient der Identifikation übergeordneter Themenbereiche, die als Struktur für die Interviewleitfäden verwendet werden. Die Interviews werden inhaltsanalytisch ausgewertet, um die gewonnenen Themen durch praktische Perspektiven zu ergänzen.
ERGEBNIS
Die thematische Analyse führte zur Identifikation von fünf übergeordneten Themenfeldern: Datennutzung, Kosten, technische Basis, Sicherheit und Zitation. Erste Ergebnisse aus den Interviews bestätigen die Relevanz dieser Themenbereiche, zeigen jedoch zugleich die Grenzen einer rein schriftlichen FAQ- oder Supportstruktur auf. Eine mehrstufige Supportstruktur, bei der eine gut strukturierte FAQ grundlegende Fragen abdeckt und bei Bedarf schnell in persönliche Unterstützung übergeleitet werden kann, wird als besonders wirksam beschrieben. Entscheidend ist, dass das gesamte System konsequent an den Bedarfen und Vorkenntnissen der Nutzenden ausgerichtet ist. Die vollständigen Ergebnisse werden im Spätsommer 2025 vorliegen.
DISKUSSION
Die Kombination beider Methoden erweist sich als sinnvoll, da durch die thematische Analyse zentrale Fragestellungen klar strukturiert werden können, während die qualitative Inhaltsanalyse praxisnahe Einblicke und kontextbezogene Vertiefungen ermöglicht. Die bisherigen Ergebnisse bieten einen ersten Blick auf die Ausgestaltung der Supportstruktur, müssen jedoch nach Abschluss der Untersuchung bestätigt werden.
Sensible Daten in der Sportwissenschaft
Eckardt, Nils1, Zimmermann, Hannah2, Eberhardt, Tanja2, Keller, Katja2, Rose, Christian2, Bös, Klaus2, Schlenker, Lars2, Niessner, Claudia2
1Leibniz Universität Hannover, 2Karlsruher Institut für Technologie
EINLEITUNG
Der verantwortungsvolle Umgang mit sensiblen Daten stellt eine zentrale Herausforderung für die Sportwissenschaft dar, insbesondere im Kontext einer zunehmend datengetriebenen Forschung und dem Anspruch, den Prinzipien von Open Science zu folgen. Trotz der zentralen Bedeutung von Datenschutz und Datenmanagement zeigt sich ein erheblicher Forschungsbedarf hinsichtlich standardisierter und praktikabler Lösungen. Die Arbeitsgruppe „Sensible Daten“ des dvs ad-hoc-Ausschusses „Forschungsdatenmanagement“ widmet sich diesen Fragestellungen und untersucht praxisorientierte Ansätze für den Umgang mit sensiblen Daten. Ziel des Beitrags ist es, einen Überblick über zentrale Themen wie die Definition sensibler Daten, deren rechtssichere Verarbeitung und Best Practices zu geben.
METHODE
Der Beitrag basiert auf den Ergebnissen der Arbeitsgruppe „Sensible Daten“, welche systematisch aktuelle Herausforderungen und bestehende Unsicherheiten im Umgang mit sensiblen Daten analysiert hat. Hierfür wurden die rechtlichen Rahmenbedingungen gemäß DSGVO und BDSG evaluiert, Fachliteratur gesichtet und praktische Erfahrungen aus der Sportwissenschaft in Form einer Befragung (Keller et al., 2025) ausgewertet. Als Ergebnis entstanden mehrere Fact Sheets, die Forschende mit konkreten Handlungsempfehlungen und Beispielen für datenschutzkonformes Forschungsdatenmanagement unterstützen.
ERGEBNISSE
Die entwickelten Fact Sheets umfassen vier zentrale Themenfelder: (1) die präzise Definition und Identifikation sensibler Daten, (2) empfohlene Verfahren der Anonymisierung und Pseudonymisierung, (3) Best-Practice-Beispiele, die kollaboratives Arbeiten ermöglichen, und (4) die Berücksichtigung rechtlicher Anforderungen entlang des gesamten Forschungsprozesses.
DISKUSSION
Die entwickelten Fact Sheets bieten wertvolle Orientierungshilfen und tragen zur Klärung zentraler Fragen im Umgang mit sensiblen Daten bei. Dennoch bleiben Herausforderungen wie die interdisziplinäre Harmonisierung von Standards und die praktische Umsetzung der rechtlichen Rahmenbedingungen bestehen. Der Beitrag schließt mit der Erkenntnis, dass eine enge Zusammenarbeit zwischen Forschenden, Datenschutzbeauftragten und weiteren Stakeholdern notwendig ist, um nachhaltige und rechtssichere Lösungen zu etablieren. Perspektivisch sind weitere Forschungen notwendig, um bestehende Lücken zu schließen und die Qualitätssicherung im Umgang mit sensiblen Daten weiter zu verbessern.
LITERATUR
Keller, K., Pleger, A., Niessner, C., Ueding, E., & Krüger, M. (2025). The status quo of research data management in the German-speaking sports sciences—Results of an online pilot survey. German Journal of Exercise and Sport Research. https://doi.org/10.1007/s12662-025-01033-0
Forschungsdatenmanagement in der Sportwissenschaft - Grundlagen und Best-Practice-Beispiele
Krüger, Melanie1, Koopmann, Till2, Memmert, Daniel3, Wallrodt, Sören4
1Leibniz Universität Hannover, 2Carl von Ossietzky Universität Oldenburg, 3Deutsche Sporthochschule Köln, 4Hochschule Koblenz
EINLEITUNG
Forschungsdatenmanagement (FDM) ist ein zentraler Bestandteil wissenschaftlicher Arbeit und gewinnt zunehmend an Bedeutung. Es umfasst die Organisation, Speicherung, Bereitstellung und Nachnutzung von Forschungsdaten im Sinne der FAIR-Prinzipien (FORCE 11, 2014). Eine kürzlich publizierte Umfrage zum Status Quo im FDM in der deutschsprachigen Sportwissenschaft ergab, dass ein breites Wissen über FDM-Richtlinien sowie Plattformen für ein nachhaltiges FDM besteht (Keller, et al., 2025). Gleichzeitig gaben jedoch auch 70 % der teilnehmenden Forschenden an, sich mehr Wissen über Best-Practices im FDM in der Sportwissenschaft zu wünschen. Der Vortrag gibt einen Überblick über die erarbeiteten Best-Practices im Rahmen des dvs ad-hoc-Ausschusses „Forschungsdatenmanagement“.
METHODE
Zur Erarbeitung von Best Practices im FDM wurden bestehende Standards, Leitlinien und Repositorien analysiert. Hierzu wurden aktuelle Entwicklungen in den Bereichen Open Science, FAIR Data und Repositorien innerhalb einer Expertengruppe diskutiert. Im Fokus standen praxisnahe Anwendungen wie ReadMe-Dateien, einheitliche Ordnerstrukturen, Datenmanagementpläne sowie der Einsatz von GitHub und elektronischen Laborbüchern.
ERGEBNISSE
Das Ergebnis stellt ein 14-seitiges Dokument dar, das wesentliche Best Practices umfasst:
• ReadMe-Dateien: Klare Dokumentation zur Nachnutzbarkeit von Daten
• Ordnerstrukturen & Dateibenennung: Einheitliche Systeme zur Vermeidung von Datenverlust
• Repositorien & Persistente Identifikatoren: Sicherstellung langfristiger Auffindbarkeit
• Skripting & Workflows: Automatisierung von Analyseprozessen
DISKUSSION
Ein nachhaltiges und effizientes FDM trägt maßgeblich zur Qualitätssicherung und Transparenz wissenschaftlicher Arbeit bei und ist deshalb für (Nachwuchs-)Wissenschaftlicher:innen relevant. Insbesondere in der Sportwissenschaft stellt die Vielfalt an Datenquellen und -formaten eine Herausforderung für den wissenschaftlichen Nachwuchs dar, die durch standardisierte Verfahren und den Einsatz geeigneter Tools bewältigt werden kann. Die dokumentierten Best-Practices können dazu einen Beitrag leisten.
LITERATUR
FORCE 11. (2014). The FAIR data principles. FORCE11. Abgerufen von https://www.force11.org/group/fairgroup/fairprinciples
Keller, K., Pleger, A., Niessner, C., Ueding, E., & Krüger, M. (2025). The status quo of research data management in the German-speaking sports sciences—Results of an online pilot survey. German Journal of Exercise and Sport Research. https://doi.org/10.1007/s12662-025-01033-0