Sitzung | ||
Session 9: KI als Chance und Ärgernis
| ||
Präsentationen | ||
Vorträge
Stichworte: APC, Maschinelles Lernen Planung von APCs – Kann KI uns weiterhelfen? Universität Regensburg, Deutschland In jüngster Zeit ist es mittels KI möglich, Prognosen zu erstellen, beispielsweise für die Erstellung von Geschäftsanalysen oder um Entscheidungen auf der Basis von Daten zu treffen. Obwohl diese Technologie in der Privatwirtschaft bereits weit verbreitet ist, findet sie in Bibliotheken bisher nur wenig Anwendung. Während lizenzrechtliche Ausgaben gut planbar waren, gestaltet sich die Zukunft von publikationbasierten Ausgaben als weniger eindeutig. Dieser Anteil am Informationsbudget wächst kontinuierlich, wodurch eine zunehmende Relevanz für die Bibliothekslandschaft entsteht. Dies betrifft sowohl die Planung von Publikationsfonds als auch die Entscheidung über die Teilnahme an Transformationsverträgen und die interne Kommunikation in der Einrichtung. Die Abschätzung der zu erwartenden Ausgaben ist in all diesen Bereichen von entscheidender Bedeutung. Mit openAPC steht ein umfassender Datensatz zur Verfügung. Unter Zuhilfenahme maschinellen Lernens kann der Datenbestand analysiert werden, um einerseits konkrete Prognosen für die eigene Einrichtung und andererseits generelle Entwicklungstendenzen im Bereich der APCs zu erstellen. Der Vortrag wird sich kurz mit der verwendeten KI befassen und präsentiert erste konkrete Prognosen auf Basis des openAPC-Datensatzes. Im Fokus der Untersuchung stehen dabei die identifizierten Hindernisse, die Grenzen des Verfahrens, der optimale Einsatzbereich sowie die Anwendung des erworbenen Wissens in der Planung von publikationbasierten Ausgaben. biografische Angaben: Constantin Lehenmeier ist Fachreferent für Informatik & Data Science und Data Steward am UR Data Hub Vorträge
Stichworte: Zugriffsstatistiken, Nutzungsstatistiken, Open Access, COUNTER Code of Practice Mensch oder Maschine? Warum wir Open-Access-Zugriffe neu denken müssen. The Library Code GmbH “Auf eine auf Zugriffszahlen basierende Argumentation und auf eine Veröffentlichung von Nutzungsstatistiken sollte verzichtet werden.“ So lautet das Fazit eines Artikels von uns, der Anfang des Jahres in der Zeitschrift o-bib erschienen ist. Zur Anforderung verschiedener Standards, Zertifikate und Aggregatoren gehört, dass automatisierte Zugriffe gefiltert und nur Zugriffe in der Statistik erfasst werden sollen, die von einer Person initiiert wurden. Maschinelle und menschlich initiierte Zugriffe können jedoch nicht verlässlich differenziert werden. Und es gibt auch inhaltliche Gründe, die gegen eine Argumentation mit Zugriffsstatistiken sprechen. Der Verzicht auf Zugriffsstatistiken in der inhaltlichen Diskussion fällt vielen Institutionen schwer. Und dennoch müssen wir als Open-Access-Community uns hier ehrlich(er) machen. Zu oft sind Sätze gefallen wie „Wir wissen, dass die Zahlen nicht belastbar sind, brauchen sie aber dennoch“. Der Vortrag ist ein klares Plädoyer, sich ohne Ausreden mit der Thematik auseinander zu setzen und für die eigenen Systeme die entsprechenden Konsequenzen zu ziehen. Doch nicht nur bei Zugriffsstatistiken sorgen rein maschinelle Zugriffe für Probleme. Mit dem Aufkommen von AI-Crawlern kämpfen Publikationsinfrastrukturen immer wieder mit Ressourcen-, Performance- und Stabilitätsproblemen. Eine Umfrage von COAR im April 2025 mit 66 Repositorien ergab, dass die meisten Repositorien mehrmals pro Woche AI-Bots begegnen und dies auch bereits zu Servicestörungen geführt hat.1 Daher wollen wir den Bogen über den Artikel hinaus erweitern. Im zweiten Teil des Vortrags geben wir unsere inhaltliche Einschätzung dazu ab und versuchen erste Forderungen an Infrastrukturen aber auch an Crawler zu formulieren. Und in diesem Zusammenhang werden Zugriffsstatistiken auf einmal doch wieder interessant und hilfreich. 1 https://coar-repositories.org/news-updates/open-repositories-are-being-profoundly-impacted-by-ai-bots-and-other-crawlers-results-of-a-coar-survey/ biografische Angaben: Pascal Becker entwickelt seit fast 20 Jahren Open-Access-Repositorien. Er initiierte das DSpace-Konsortium Deutschland und engagiert sich in der DSpace Leadership, DSpace Steering und DataCite Services and Technologies Steering Group. Er ist Gründer und Geschäftsführer der The Library Code GmbH. Vorträge
Stichworte: Open-Access-Monitoring, Publikationskosten, Machine learning, PKM-NRW, openaccess.nrw Der Monitoringdienst PKM-NRW: Neue Erkenntnisse durch maschinelles Lernen aus Publikations- und Kostendaten Universitätsbibliothek Bielefeld, Deutschland Die Landesinitiative openaccess.nrw betreibt als Serviceeinrichtung für die 41 Hochschulen der Digitalen Hochschule NRW (DH.NRW) ein Publikations- und Kostenmonitoring. Der Vortrag präsentiert den neuen Monitoringdienst "Publikations- und Kostenmonitoring in Nordrhein-Westfalen" (PKM-NRW), welcher die offene und dynamische Verfügbarkeit der Ergebnisse sicherstellt. Neben methodischen und infrastrukturellen Aspekten fokussiert der Vortrag neue Erkenntnisse der Auswertung von Publikations- und Kostendaten mithilfe von maschinellem Lernen. Das auf multipler Imputation basierende Verfahren zur Approximierung von fehlenden Kostendaten erreicht, durch Beachtung verfügbarer Informationen wie Zeitschriftentitel, -listenpreis, und Publikationsjahr, eine bessere Granularität, als die bisher angewendete statische Mittelwertbildung. Dadurch ist eine verbesserte Schätzung von Kosten für Gold-Open-Access-Publikationen auf Einrichtungsebene und darüber hinaus möglich. Wichtige Dynamiken sind außerdem die überproportionale Steigerung der Kosten im Vergleich zum Publikationswachstum in NRW und die Verschiebung von Marktanteilen bei Verlagen. Die präsentierten Entwicklungen sind nicht nur für NRW von Interesse, denn die mittel- bis langfristigen Tendenzen entfalten sich bundesweit. biografische Angaben: Jan-Philip Tummes ist wissenschaftlicher Mitarbeiter im Projektbereich der Universitätsbibliothek Bielefeld. Mit sozialwissenschaftlichem Hintergrund war er im EU-Projekt PALOMERA beteiligt und ist seit 2023 in der Landesinitiative openaccess.nrw für das Publikations- und Kostenmonitoring zuständig. |