Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Repository Usage Statistics and the Open Research Analytics Service

109 views

Published on

Slides of the webinar "Repository Usage Statistics and the Open Research Analytics Service" (in German!)

Published in: Science
  • Be the first to comment

  • Be the first to like this

Repository Usage Statistics and the Open Research Analytics Service

  1. 1. Webinar: Repository Nutzungsstatistiken und der Open Research Analytics Service Paul Borchert, GBV Jochen Schirrwagen, UB-Bielefeld / OpenAIRE Max Mosterd, Knowledge Unlatched
  2. 2. Übersicht • Rückblende OA-Statistik • electronic Publication Statistics – neue Entwicklungen beim gbv • OpenAIRE Usage Statistics – Stand und Ausblick • Open Research Analytics Service – Community- Projekt initiiert von Knowledge Unlatched
  3. 3. Rückblende OA-Statistik (OAS) • Gestartet als DFG-Projekt mit zwei Förderphasen 2008 – 2013 • Unterstützt von DINI • Ziel: Infrastruktur für standardisierte, international vergleichbare Nutzungsstatistiken • Aufbauend auf OAI-PMH als Transferprotokoll und OpenURL ContextObjects als XML-Format • Generierung von COUNTER R4 Reports • Machbarkeitsstudie https://dini.de/fileadmin/oa-statistik/Machbarkeitsstudie/OAS- Machbarkeitsstudie.pdf
  4. 4. Rückblende OA-Statistik (OAS) • Ab 2015 Inbetriebnahme als Dienst bei der Verbundzentrale des GBV • Abgestuftes Gebührenmodell für Teilnehmer (Stand 2017) • Nach Anzahl der Records: 160 – 470 EUR / annum • Incl. OAS-Widget: 180 – 510 EUR / annum • Eingeschränkte Nachnutzbarkeit der Statistiken wegen CC-BY-NC-SA 3.0 Lizenz • Teilnehmer: KOBV & BSZ: OPUS-Hosting, sowie 7 weitere Einrichtungen
  5. 5. OAS-Userinterface
  6. 6. OAS-API und Einbettung mit OAS-Widget
  7. 7. Open-Access-Statistik (OAS) • Beendigung von OAS zum 31.12.2019 • extremer Speicherplatzbedarf • aufwändige Dienstbetreuung • Intransparenz der ermittelten Zugriffszahlen • Einnahmen- Aufwandverhältnis
  8. 8. OAS-Abwicklung • kein umfassender Support mehr • für ehemalige Nutzer • lokale Weiternutzung der OAS Software • Datenübernahme durch Dumps der Datenbanktabellen oder über die OAS-API
  9. 9. OAS Nachfolger • Eigenentwicklung für die Reposis – Repositoren • Open Source • neues Konzept zum Parsen der Logfiles • OAS kompatible API • neue REST-API (in der Entwicklung) • Zusammenarbeit mit KOBV und BSZ
  10. 10. ePuSta • electronic Publications Statistics • ehm. ReposAS • ePuSta-logfileparser • https://github.com/gbv/ePuSta-logfileparser/ • Skriptbibliothek zur Erzeugung von angereicherten Logfiles • ePuSta-Server • https://github.com/gbv/ePuSta-Server/ • Speicherung der Zugriffe SOLR • OAS kompatible API feel free to - watch - write issues - commit - fork
  11. 11. Roadmap 3.Q 2019 1 produktives Repository über OAS kompatible API (perspectivia.net) (MyCoRe) 4.Q 2019 KOBV/BSZ für OPUS, OAS kompatible API 4.Q 2019 Umzug aller Reposis- Repositorien - Verbesserung des logfileparser 2020 2020 neue REST-API und Oberfläche - Nachvollziehbarkeit
  12. 12. Architektur access.log access.epusta.log logfileparser SOLR OAS -API REST-API ePuSta-Server OpenAIRE- usage- statistics Sushi
  13. 13. Anreicherung der Logfiles • markieren jeder Logzeile durch eine UUID • Anreicherung mit statitikrelvanten Informationen • ID der Publikation, Art des Zugriffs, SessionID • Textdatei (.epusta.log)
  14. 14. Anreicherung der Logfiles access.log apache2epusta.sh access.epusta.log access.epusta.log createSessionID.sh annonymize.sh access.epusta.log *.sh - UUID - ePuSta Format - Entfernen von personenbezogenen Daten - Entfernen unwichtigen Loginformationen - Profilvermeidung - wiederholte Anreicherung Repository
  15. 15. Anreicherung der Logfiles cat test.log | ./log2epusta.php | ./addIdentifier.php | ./filter.php > test.epusta.log • einfacher • transparenter
  16. 16. Motivation Usage Statistics in OpenAIRE • Monitoring und Analyse über Nutzungsereignisse in OA- Repositorien • Mehrwertdienst als Teil eines paneuropäischen Forschungsinformationssystems • Akkumulation von Nutzungszahlen über Dokumente, die in mehreren Quellen vorliegen • Dank Metadaten-Deduplizierung • Generierung der Nutzungsstatistiken nach COUNTER CoP R4 bzw. R5 • Bereitstellung der Statistiken unter CC0 Lizenz • Beschreibung des Dienstes in den OpenAIRE Usage Statistics Guidelines, https://openaire.github.io/usage-statistics-guidelines/
  17. 17. Usage Statistics Service als Teil der OpenAIRE-Infrastruktur
  18. 18. Workflows zur Aggregation von Nutzungsereignissen in OpenAIRE Metadata-Index UsageStatistics-DB ● Repository ● CRIS ● eJournal ● National Statistics Node ● Publisher PULL COUNTER Report PUSH tracked event IP-Anonym. processing script processing script
  19. 19. In vier Schritten zum Nutzungsstatistik-Dienst • Voraussetzung: Registrierung des Repositories im Contentprovider-Dashboard 1. Download des generischen Matomo Usage Activity Tracker (https://github.com/openaire/Generic-Matomo-Tracker) 2. Konfiguration, z.B. Matomo-SiteID für die eigene Quelle 3. Installation 4. Test und Validierung durch OpenAIRE
  20. 20. User-Interface im Contentprovider-Dashboard
  21. 21. Unterstütze Reporttypen (COUNTER R4)
  22. 22. Abfrageinterface (SUSHI-Lite)
  23. 23. Mögliches Migrationsszenario OAS nach OpenAIRE Usage Statistics • Betrifft bestehende OAS-Kunden; historische Nutzungszahlen sollen nicht verloren gehen 1. Abruf via OAS-API bzw. Bereitstellung eines Dumps der in OAS generierten COUNTER Reports (als CSV, XML oder JSON) 2. Ggf. Transformation der OAS-COUNTER Reports in das SUSHI-Lite Schema 3. (semi)automatischer Import in OpenAIRE-Usage Statistics DB
  24. 24. Open Research Analytics Service • OAS Nachfolger, Knowledge Unlatched zusammen mit OpenAIRE (und OpenAPC)
  25. 25. Wieso ORAS? • Offene Infrastruktur zur Verbesserung der Interoperabilität von Nutzungsdaten und Analysemöglichkeiten von Repositorien • Zusammenführung mehrerer, unterschiedlicher Datenquellen (OpenAIRE metadata, OpenAPC, etc.) • Zunächst Fokus auf die Integration von Nutzungsdaten von OpenAIRE-Repositorien und die Entwicklung der ORAS Public API.
  26. 26. Wieso ORAS? Researcher • Wie viele Downloads hat mein Artikel auf dem Repository? Wie sieht das im Vergleich zu anderen Artikeln aus? Repository Manager • Wie kann ich die Einlagenrate meiner Forscher erhöhen? Wie hoch ist die Rate und Nutzung meiner IR-Einzahlung im Vergleich zu anderen IRs im Land? Bibliotheksleitung • Sind unsere Gold- und Hybridartikel auch im Repository hinterlegt? Werden teurere Gold Open Access auch vermehrt von unseren Kunden genutzt?
  27. 27. Reporting to researchers • Stellen Sie den Forschern mit wenigen Klicks Berichte zur Verfügung, die den Forschern Einblicke in die Verwendung ihrer hinterlegten Gegenstände geben
  28. 28. Benchmarking IR to IR managers • Wie kann ich die Einlagenrate meiner Forscher erhöhen? Wie hoch ist die Rate und Nutzung meiner IR-Einzahlung im Vergleich zu anderen IRs im Land? Total Usage 15th of 160 DE repositories No. of Items 50th of 160 DE repositories Deposit Rate 10th of 160 DE repositories Repository Benchmarking
  29. 29. OpenAPC and IR integration • Sind unsere Gold- und Hybridartikel auch im Repository hinterlegt? Werden teurere Gold Open Access auch vermehrt von unseren Kunden genutzt? OpenAPC Benchmarking Total APC paid in 2019 15th of 160 DE institutions No. of Items in 2019 4th of 160 DE institutions Deposit Rate APC Items 15th of 160 DE institutions
  30. 30. Wie funktioniert ORAS? • Nahtlose Integration mit OpenAIRE-konformen Repositories (via SUSHI lite) und OpenAPC • Anbindung anderer Nutzung Datenquellen (COUNTER reports, Google Analytics, etc.) • Beginnen Sie mit der Analyse und dem Reporting.
  31. 31. International Community Knowledge Unlatched InstitutionInstitutionInstitution Open Research Analytics (Membership Interface) Sustainable funding (Membership) OpenAIRE OpenAPC Open Analytics Advisory Board Other third-Party Integrations Public Roadmap Usage Data Trans. Data Interface Funding flows to all projects to maintain + expand scope and features (roadmap) Public Open Database (CC 0 licence)
  32. 32. Mitgliedschaftsmodell Deutschland • Freemium Model • Basic (OpenAIRE-only) = free • Membership (ORAS) = setup fee (1.500 EUR) + annual fee (1.250 EUR p.a.) • Vorteile einer Mitgliedschaft: • 2019Q1 Zugriff auf Repository Nutzungsdaten nach COUNTER, generiert durch OpenAIRE • Entwicklung neuer analytischer Anwendungsfälle auf Basis von Open Repositories als Teil einer internationalen Community. • Generierung von Nutzungsreports für die eigene Einrichtung / Fakultäten; Stimulierung einer verstärkten Nutzung des Repositories und Erhöhung der Zahl von (Open Access) Deposits. • Zugriff auf IR-Benchmarking-Berichte auf Basis unterschiedlicher Dimensionen
  33. 33. Roadmap • Bis zum 1. Dezember Interesse anmelden (pledge), um einen reibungslosen Zugang im ersten Quartal 2019 zu gewährleisten: • Umstellung von GBV auf Open Research Analytics (inklusive OpenAIRE usage data) • OpenAIRE Metadaten-Aggregationsdienst • Registrierung über OpenAIRE Content Provider- Dashboard • Registriere Interesse am Mitgliedschaftsmodell hier: • https://app.knowledgeunlatched.org/ku- partners/knowledge-unlatched/open-research-analytics
  34. 34. Q&A GBV, OpenAIRE und Knowledge Unlatched

×