Google Scholar: Neue Open-Access-Funktion

Im März hat Google Scholar die Funktion „Public access“ in Google-Scholar-Profilen integriert. Anliegen ist es, so Google, Forschende bei der Umsetzung von Open-Access-Policies („public access mandates“) zu unterstützen.

In Google Scholar sind nun die Open-Access-Policies von 182 Förderorganisationen und wissenschaftlichen Einrichtungen hinterlegt (Stand: 09.04.2021). Aus Deutschland u. a. die Open-Access-Policies der Deutschen Forschungsgemeinschaft (DFG), der Fraunhofer-Gesellschaft, der Helmholtz-Gemeinschaft und der Leibniz-Gemeinschaft.

Wie so oft bei Google Scholar ist das Verfahren eine Blackbox, d.h. wir können nur vermuten wie Google die „Public access“-Funktion im Detail umsetzt. Ein lesenswertes Interview hierzu mit Anurag Acharya, einem der Köpfe hinter Google Scholar, findet sich in Nature.

In diesem Interview wird der Ansatz der „Public access“-Funktion deutlich: Automatisiert werden die „Funding Acknowledgements“ in Papers mit den Policy-Informationen abgeglichen. Ist ein Artikel nicht frei im Web auffindbar, erscheint ein Hinweis in der „Public access“-Sektion in dem Google-Scholar einer/eines Autor*in. Die Auffindbarkeit bezieht sich dabei nicht nur auf Open-Access-Repositorien und Verlagsportale, sondern auf jegliche von Google indexierte Verzeichnisse im Web. 

Offenbar wurde die Funktion langsam ausgerollt. Seit einigen Tagen findet sich die Funktion auch in dem Back-End meines Google-Scholar-Profils. Folgender Screenshot zeigt die „Public access“-Funktion in meinem Profil:

Screenshot: Anzeige der „Public access“-Funktion im Google-Scholar-Profil

Per Klick auf die Funktion landet man auf einer Webseite, die Artikel listet, die laut Google Scholar durch eine Open-Access-Policy tangiert sind. In meinem Fall sind dies, so Google, 14 Veröffentlichungen. Zu jeder der Publikationen wird eine Leit- oder Richtlinie („Mandate“) angezeigt (siehe Screenshot).

Screenshot: Liste der Publikationen, die so Google Scholar, durch eine Open-Access-Policy tangiert sind

In meinem Fall waren bereits alle von Google identifizierten Publikationen frei zugänglich. Die Auswahl der 14 Paper und ihre Zuordnung zu den Open-Access-Policies überrascht jedoch und zeigt die Schwäche der neuen Funktion. Der automatisierte Abgleich der Angaben zu den Förderorganisationen und wissenschaftlichen Einrichtungen scheint wenig verlässlich. So erscheint in meiner Liste z. B. dreimal die National Institutes of Health (NIH) als Förderorganisation, obwohl ich bisher noch nie in einem von den NIH geförderten Projekt involviert war. Auch kann ich die Auswahl der 14 Paper nicht nachvollziehen. Somit scheint weder die Zuordnung noch die Auswahl verlässlich.

Zu hoffen ist, dass sich solche Fehler, die bei sprachbasierten Verfahren wenig überraschend sind, in Zukunft durch das Research Organization Registry (ROR) und dessen persistenten Identifikator für wissenschaftliche Einrichtungen und Förderorganisationen erledigen. (Siehe dazu unsere Arbeiten im ORCID-DE-Projekt.)

Auch irritiert es, das Google statt dem weltweit gebräuchlichen Term „Open Access“ den Begriff „Public access“ verwendet. Dieser ist zwar in den USA durch eine Verordnung der US-Regierung zu Open Access aus dem Jahr 2013 gängig, aber international kaum verbreitet.

Mehrere Kolleg*innen weisen kritisch darauf hin, dass Google Scholar, im Falle eines nicht frei zugänglichen Artikels, seine Dienst Google Drive als Alternative zu Open-Access-Repositorien bewirbt. Diesem Hinweis von Google sollte man besser nicht folgen und sich anstelle an seine lokale Bibliothek wenden. Die Bibliothekar*in wird sicher ein passendes Repositorium empfehlen können und eine/einen Autor*in im Idealfall auch gleich bei der Rechteprüfung unterstützen.

Die Google-Scholar-Funktion kann dazu beitragen wissenschaftliche Autor*innen für Open Access zu sensibilisieren, auch wenn die Angaben von Google Scholar nur bedingt belastbar scheinen. Auch zeigt die Funktion, dass die Relevanz der Compliance von Open-Access-Förderbedingungen steigt. Hierzu passt auch der Einstieg von Förderorganisationen in das Verlagswesen, wie es jüngst die Europäische Kommission mit ihrer Open-Access-Zeitschrift „Open Research Europe (ORE)“ tat. Die Europäische Kommission stellt mir ORE eine Plan-S-konforme Publikationsplattform bereit. Die Zeitschrift richtet sich an Forschende, die Ergebnisse aus EU-geförderten Projekten publizieren.

Organization Identifiers

Das Problem von unterschiedlicher Schreibweise von wissenschaftlichen Institutionen ist insbesondere aus der Bibliometrie bekannt. Wenn Forschende bei einer Publikation ihre institutionelle Zugehörigkeit angegeben, ergeben sich häufig unterschiedliche Schreibweisen. Viele Hochschulen haben deshalb Richtlinen erlassen, wie die Zugehörigkeit angegeben werden soll.

Beispiel TU Graz:

Zwei Varianten des Universitätsnamens stehen bei der Angabe der Affiliation bei Publikationen und Forschungsprojekten zur Auswahl – eine englische und eine deutsche:

  • Graz University of Technology
    bzw.
  • Technische Universität Graz.

Die englische Variante der Affiliation ist generell der deutschen vorzuziehen, besonders wenn es sich um Publikationen in internationalen Medien handelt.

Akronyme (TU Graz, TUG etc.) und Abkürzungen (Graz Univ. Techn., Techn. Univ. Graz etc.) sind bei der Angabe der Affiliation bei Publikationen und Forschungsprojekten grundsätzlich unzulässig.

Beispiel Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU)

FAU - Empfehlungen für die standardisierte Angabe der Affiliation bei deutschund englischsprachigen Publikationen

Auch beim Funding Acknowledgement führen unterschiedliche Schreibweisen zu einer erschwerten Auswertung von Publikationsdatenbanken:

Inzwischen haben sich verschiedene Initiativen etabliert, welche mit einem eindeutigen Identifier Klarheit schaffen wollen. Besonders erwähnenswert sind Ringgold, GRID und Funding Data von CrossRef.

Ringgold

Ringgold bietet aktuell mit Abstand die grösste globale Abdeckung an Identifiers für Organisationen im wissenschaftlichen Umfeld.

Ringgold - Universität Bern

Ringgold Inhalt: Beispiel Universität Bern

Ringgold ist 2003 als Dienstleister für Subskriptions-Verlage entstanden, um deren Kundendaten zu harmonisieren. Inzwischen verwenden auch die weit verbreiteten Manuskript-Einreiche-Systeme Editorial Manager (Aries) und ScholarOne (Clarivate) die Daten von Ringgold um die Affiliation zu standardisieren.

Ebenfalls greift ORCID auf die proprietären Ringgold Daten zurück, wenn es beispielsweise darum geht Anstellungen zu erfassen:

ORCID-Universität Bern - Steuerrecht

ORCID: Auswahl für die Anstellung wird mit Ringgold Daten gefüttert.

Ringgold hat die Grunddaten der Organisationen via ISNI öffentlich gemacht. Weitere Informationen z.B. zur Hierarchie oder Typ bleiben jedoch nur kostenpflichtig zugänglich.

Global Research Identifier Database – GRID

GRID wurde von Digital Science für die Verwendung bei den eigenen Systemen wie Symplectic Elements, UberResearch Dimensions, Figshare oder Altmetric geschaffen. Die Daten stehen aber unter einer CC-0 Lizenz zu Verfügung. Nach eigener Aussage wurden in den letzten Jahren mehr als £2 Mio in GRID investiert.

Funding Data (Crossref)

Um die Funding Acknowledgements zu harmonisieren wurde 2012 bei Crossref das  FundRef gestartet. Elsevier stellte eine initiale Liste von Förderorganisationen zu Verfügung, die nun monatlich von CrossRef aktualisiert wird. Inzwischen sind 15’900 Organisationen auf dieser Liste. Jeder Organisation wurde ein DOI zugewiesen unter dem zusätzliche Namen, Akronyme und Hierarchien der Organisation verfügbar sind:

Viele Verlage (hier sieht man welche) geben die bei den Funding Acknowledgements aufgeführten Organisationen strukturiert als Organisations-DOI bei Crossref aus:

Crossref Funding Data.jpg

Links: Acknowledgement auf Publikation / Rechts: Funding Angaben via Crossref REST-API

Organization Identifier Working Group

In verschiedenen internationalen Workshops artikulierte sich das Bedürfnis nach einer einheitlichen und offenen Lösung für Organization Identifiers. Daraus bildete sich 2017 unter dem Lead von ORCID, Crossref & Datacite eine Working Group, welche zunächst eine Übersicht mit Vor und Nachteilen der vorhandenen Systeme zusammenstellte. Ebenso wurden Empfehlungen hinsichtlich Governance und Scope einer neuen Lösung vorgeschlagen. Ein wichtiges Merkmal ist beispielsweise die Empfehlung, dass Organisationen ihre Daten selber pflegen können. Ende Oktober wurde  basierend auf diesen Empfehlungen ein „Request for Information“ (RFI) veröffentlicht.

Im Januar 2018 fand dann in Spanien ein Stakeholder Meeting zur Organization ID statt, wo die eingetroffenen Antworten aus dem RFI präsentiert und diskutiert wurden.

RFI Response

Zusammenfassung der erhaltenen Antworten aus dem Request for Information

Das 26-seitige Dokument mit den erhaltenen Antworten bezeugt ein grosses Interesse an einer einheitlichen Organization ID von unterschiedlichen Perspektiven.

Es fällt auf, dass Ringgold kein Interesse anmeldet, um bei der offenem Lösung einen zentralen Part zu übernehmen. Obwohl eine solche Lösung das aktuelle Geschäftsmodell von Ringgold massiv konkurrenziert.

Digital Science ist da einiges offener, verweist aber auf die bisherigen Investitionen, bei denen man bei einer Partizipation das eigene Kosten-Nutzen Verhältnis gut abwägen muss:

Due to the nature of the Digital Science products and services, Digital Science will need to continue a GRID-like undertaking even if an open alternative is developed and maintained externally. Most of the reasons are around speed to changes to policies, flexibility and ability to accommodate client use cases and needs. This means that Digital Science will have to continue to invest resources in this area, an open alternative is not eliminating this need. But we see the possibility to do this as an additional layer on an open identifier system.

Crossref gibt mit einer sehr detaillierten Antwort klar zu erkennen, den Lead übernehmen zu wollen:

  • Crossref is interested in being a host for the new registry.
  • Crossref supports creating a joint venture non-profit collaboration of representative stakeholders to launch a registry. Crossref does not support creating a new entity (e.g. 501c3) at the start although this is something that could happen later.
  • Crossref is interested in participating in the governance of the new registry
  • Crossref can make significant resources available to help launch an independent registry.
  • Crossref is well placed to undertake the above based on current experience running its own services and infrastructure including the Open Funder Registry.
  • Crossref has developed an estimated expense budget and rationale for an independent registry that it is willing to share with the group of organizations that create the new joint venture collaboration.

ORCID und DataCite beschränken ihr Mitwirken auf die Unterstützung der Governance und letztlich der Verwendung in den eigenen Systemen.

Grosses Interesse signalisierte Publisher Solutions International mit ihrer IP-Registry, wo aktuell über 60’000 Bibliotheken und ihre IP-Ranges erfasst sind.

Auch von Bibliotheksseite gab es positive Rückmeldungen. Das Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen (HBZ), die British Library, die California Digital Library und OCLC beschreiben ihre Erfahrungen mit der gemeinsamen Pflege von Normdaten und Identifers und interessieren sich diese Arbeit weiter auszubauen. Die BL und OCLC sind bereits stark bei ISNI involviert. ISNI selber hat sich auch noch explizit als Host anerboten.

Eine interessanten Input bezüglich Geschäftsmodell kommt von der Global Legal Entity Identifier Foundation (GLEIF), welche im Finanzbereich Identifier (z.B: 391200PHRPB1YWIPRE56) vergibt.

Ebenso bekunden weitere Stellen wie der Australian National Data Service (ANDS), die Foundation for Science and Technology, Portugal das Library and Information Centre, Hungarian Academy of Sciences, das European Directory of Marine Organisations EDMO, das Répertoire national des structures de recherche (RNSR) Interesse an einer internationalen Lösung und die Möglichkeit die aktuell lokal verwendeten Daten zu Verfügung zu stellen.

Die DFG verwies auf ihre Erfahrung bei der Erfassung und Verwaltung von 25’000 Organisationseinheiten von deutschen Hochschulen im Rahmen des Research Explorers. Da gibt es zurzeit etwa 6000 Änderungen und 1500 Neueinträge pro Jahr.

Nächste Schritte

Am Workshop wurde beschlossen, dass ORCID, DataCite und Crossref (als Interim Lead) im Austausch mit allen Interessierten ein Proposal vorbereiten, in dem die Partner, die Governance-Struktur, die juristischen Details sowie ein Memorandum of Understanding definiert werden.

Open Science Monitor der EU-Kommission online

Der „Open Science Monitor“ der EU-Kommission ist online. Auszug aus der Beschreibung des Tools zum Monitoring von Open Science in Europa:

„The Open Science Monitor supports open science initiatives in Europe. It provides a way to assess developments in open science and particularly trends in open science activities over time and comparatively between countries and scientific disciplines. […] The monitor was commissioned by the European Commission Directorate-General for Research and Innovation. It was developed by several partners, led by RAND Europe with the support of Digital Science, Altmetric, figshare and Deloitte.“

Für den Bereich „Open Research Data“ werden Daten  von re3data verwendet:

Open Science Monitor

Eine ausführliche Darstellung der Methodik findet sich auf der Website des Monitors (PDF). Der Monitor greift auf folgende Quellen zu: 101innovations, Altmetric, arXiv, bioRxiv, Clarivate Analytics, F1000Research, figshare, GenBank, Helmholtz-Centre for Environmental Research – UFZ and German Centre for Integrative Biodiversity Research (iDiv), Nature Publishing Group and Palgrave Macmillan, OpenAIRE, PeerJ preprints, Publons, re3data.org, RePEc, SHERPA/RoMEO, SHERPA/JULIET, Taylor & Francis und Wiley. In Zukunft sollen weitere Quellen, z. B. zur offenen Zugänglichmachung von wissenschaftlicher Software und Open Educational Resources integriert werden.

Next-generation metricsPassend zum Thema Metriken für Open Science hat heute die „Expert Group on Altmetrics“, die die Generaldirektion Forschung und Innovation der EU-Kommission berät, ihren Abschussbericht unter dem Titel „Next-generation metrics: Responsible metrics and evaluation for open science“ veröffentlicht.

Die fünf Kernaussagen des lesenswerten Reports lauten: „An open science system should be grounded in a mix of expert judgement, quantitative and qualitative measures“; „Transparency and accuracy are crucial“; „Make better use of existing metrics for open science“;“Next generation metrics should be underpinned by an open, transparent and linked data infrastructure;“ sowie „Measure what matters“.  Damit wird ein deutlicher Kurswechsel bei der Evaluierung von Forschungsleistung vorgeschlagen.

Die Expertinnen und Experten der Arbeitsgruppe empfehlen auch den Standard ORCID zur Identifikation von Autorinnen und Autoren und weiteren Beteiligten im Forschungsprozess verpflichtend im kommenden Rahmenprogramm für Forschung und Innovation (FP9) zu verankern.

Disclosure: Ich bin in zwei der genannten Initiativen involviert: re3data und ORCID DE.

Wie zitiere ich ein DOI korrekt?

Im nächsten Jahr feiert der Digital Object Identifier (DOI) seinen 20. Geburtstag. Die „Fachartikelnummer„, wie die FAZ den DOI nennt, hat sich fest im Bereich des digitalen Publizierens in den MINT-Fächer etabliert. Jetzt hat CrossRef, die Registrierungsagentur für DOIs im Feld der wissenschaftlichen Textpublikationen, ihre „DOI display guidelines“ aktualisiert. DOIs sollen nun als operable URIs dargestellt werden.
Statt
doi:10.NNNN/doisuffix

soll nun eine „klickbare“ Darstellung der DOI angegeben werden:

http://dx.doi.org/10.NNNN/doisuffix

In der Begründung schreibt CrossRef:

„Previously, Crossref recommended that DOIs be displayed in the format doi:10.NNNN/doisuffix At the time that the DOI system was first envisioned, it was thought that doi: would become native to browsers and automatically resolve DOIs. It appears unlikely that that will happen.“

Auch DataCite, die Registrierungsagentur für DOIs für Forschungsdaten, empfiehlt diese Darstellung in der jüngst veröffentlichten Version 4.0 ihres Metadatenschemas. Dort heißt es:
„For citation purposes, DataCite prefers that DOI names are displayed as linkable, permanent URLs.“

 

Ähnlich ist es übrigens auch bei ORCID, der eindeutigen Kennung für Forschende. Auch hier wird die Darstellung der ORCID iD als operabler URI empfohlen.

 

Wäre toll, wenn die Wissenschaftsverlage sich an diese Empfehlungen halten würden. Leider setzten aktuell weder De Gruyter (Beispiel), Springer (Beispiel) oder Thieme (Beispiel) diese Empfehlungen um.

 

Btw: Sehr geehrte Wissenschaftsjournalistinnen und Wissenschaftsjournalisten, es wäre ganz toll, wenn Sie in Ihren Artikel die DOIs der Studien über die Sie berichten mit Hilfe der DOI zitieren könnten. Dank des „shortDOI Service“ geht dies recht einfach und nimmt kaum Zeichen weg.

Workshop zum Thema Autorenidentifikation

In eigener Sache: Im Rahmen meiner Tätigkeit für das Open Access Koordinationsbüro der Helmholtz-Gemeinschaft bin ich Mitorganisator eines Workshops zum Thema Autorenidentifikation. Die Veranstaltung findet am 15. Oktober 2012 im Jacob-und-Wilhelm-Grimm-Zentrum der Humboldt-Universität zu Berlin statt. Auszug aus der Ankündigung:

„Die Herkunft wissenschaftlicher Erkenntnis eindeutig nachzuvollziehen ist in Zeiten einer immer komplexer und schneller werdenden Wissenschaftskommunikation notwendiger denn je. Herausforderungen, die beim Versuch auftreten, Publikationen eindeutig auf Wissenschaftlerinnen und Wissenschaftler sowie auf ihre institutionellen Zugehörigkeiten zu beziehen, sind seit langem bekannt und werden auch im Umfeld des elektronischen Publizierens diskutiert. Mit der Open Researcher Contributor Identification Initiative (ORCID) hat sich 2009 ein Zusammenschluss vielfältiger Akteure aus der Wissenschaft, aus Verlagen und weiteren Institutionen gebildet.“

ORCID verfolgt das Ziel einen unabhängigen und offenen Standard zur Identifikation von wissenschaftlichen Autorinnen und Autoren zu etablieren, der bestehenden Initiativen und Identifikationssysteme bündelt. Der Dienst soll im Oktober online gehen.

Anliegen des Workshops ist es Stand und zukünftigen Entwicklungen der Autorenidentifikation zusammenfassen und gemeinsame Perspektiven zu diskutieren. Programm und Anmeldeformular des Workshops finden sich auf der Website der Deutschen Initiative für Netzwerkinformation (DINI).