Quo vadis, Crossref?

Crossref wurde im Januar 2000 von einer Gruppe der grossen Verlage (AAAS, AIP, ACM, Elsevier, IEEE, Springer, Kluwer, NPG, OUP, Wiley) mit folgenden Ziel gegründet:

To promote the development and cooperative use of new and innovative technologies to speed and facilitate scientific and other scholarly research.

Was als Initiative eines kleinen Club der „Reichen und Grossen“ angefangen hat, ist nun 20 Jahren danach eine international relevante Infrastruktur mit mittlerweile über 12’000 Mitglieder. Insbesondere durch das Sponsoring, bei dem eine (meist nationale) Institution die Mitgliedschaft für kleine Verlage sponsert, erfährt Crossref einen ungebrochenen Zuwachs von über 150 Mitgliedern monatlich.

“Crossref Annual Report & Fact File 2018-19”, retrieved 14.11.2019, https://doi.org/10.13003/y8ygwm5

Finanzierung

Die Finanzierung von Crossref besteht hauptsächlich aus zwei Komponenten:

a) 40% aus einem Mitgliederbeitrag der gemäss Umsatz eines Mitglieds festgesetzt wird.

b) 60% aus einer Gebühr die für jede Registration eines DOI fällig wird:

Die Mitgliederbeiträge der 11’799 kleinen Mitglieder (Umsatz kleiner als USD 1m) übertreffen inzwischen die Mitgliederbeiträge der 353 grösseren Mitglieder (Umsatz grösser als USD 1m). Letztere registrieren jedoch 3 mal mehr DOIs als a kleinen Verlage zusammen, und zahlen insgesamt dann doch mehr an Crossref ein.

Governance

Das Board von Crossref besteht aus 16 Personen. Die Statuten sehen vor, dass jeweils die Hälfte des Boards durch Mitglieder aus den Tiers besetzt werden, die 50% des Budgets von Crossref beisteuern. Durch den starken Zuwachs bei kleinen Verlagen in den letzten 8 Jahren hat sich somit auch das Stärkeverhältnis im Board zugunsten der kleineren Verlage verschoben.

Unzufriedenheit bei einigen Grossen

2014 wurde die Mission überarbeitet und lautet seither:

Crossref makes research outputs easy to find, cite, link, assess, and reuse.

We’re a not-for-profit membership organization that exists to make scholarly communications better. We rally the community; tag and share metadata; run an open infrastructure; play with technology; and make tools and services—all to help put scholarly content in context.

It’s as simple—and as complicated—as that.

Eine zum 20-jährigen Bestehen von Crossref durchgeführte Umfrage zeigt nun, dass insbesondere ein paar grosse Verlage mit der aktuellen Ausrichtung von Crossref auf eine breitere Community ihre Mühe haben, und sich eine Rückbesinnung das Ursprüngliche wünschen. Zwei grosse Verlage haben gar erwähnt Crossref womöglich zu verlassen und andere persistente IDs zu verwenden.

Crossref Meeting: Have your say

Beim jährlichen Meeting von Crossref LIVE19 in Amsterdam stand denn auch die aktuelle Ausrichtung von Crossref auf dem Prüfstand durch die Mitglieder und der Community. Am ersten Tag wurden die Umfrageergebnisse präsentiert und es gab kurze Präsentation wie die Community (Grosser, mittlerer, kleiner Verlag, Förderorganisation, Universität) Crossref sieht. Am zweiten Tag wurde anhand des ausgeteilten Annual Report & Fact File an mehreren zugewiesenen Tischen die Fakten und Strategie vergegenwärtig und Input für die Zukunft gesucht.

Im Factsheet (p.11) zeigte Crossref beispielsweise auf, in welchen Bereichen aktuell Zeit aufgewendet wird, verbunden mit der Frage ob diese Verteilung angemessen sei?

Oder es wurde anhand der strategischen Roadmap darüber diskutiert, ob nun den Ausbau von Event Data, der Abbau von technischen Schulden oder eine gemeinsame Suche mit DataCite wichtiger wäre.

Planung Stossrichtung „Simplify and enrich existing services

Auch wenn die Resultate dieser Diskussionen natürlich nicht repräsentativ als Handlungsanweisung für Crossref gelten können, hat es den Anwesenden doch geholfen, zu sehen wo Crossref aktuell überall engagiert ist und inzwischen eben weit mehr ist als nur eine DOI-Registrationsagentur.

Wie offen soll Crossref sein?

Crossref ist hinsichtlich dem Geschäftsmodell (Closed- oder Open Access) seiner Mitglieder agnostisch und hat bisher eigentlich sehr gut als neutrales Bindungsglied funktioniert. Es stellt sich die Frage, ob das wirklich so bleiben kann. Gerade wenn es um Vollständigkeit von Metadaten (z.B. Abstracts, Referenzen (I4OC)) oder um TextMining geht, verhindert das alte Geschäftsmodell von einigen traditionellen Verlagen die Innovation bei Crossref und den Nutzen für die breitere Community.

Offene und vollständige Metadaten bei Crossref ermöglicht Dritten mit geringen Hürden neue Dienste darauf aufzubauen und ggf. auch kommerziell zu vermarkten. Siehe beispielsweise die Vision von Jason Priem (Gründer von unpaywall):

Jason Priem, ourresearch.org, Stronger together: a single open dataset to map every facet of global research, Presented at FORCE2019

Dies birgt natürlich Interessenskonflikte mit denjenigen Crossref Mitgliedern, welche im Analytics-Bereich bereits Produkte haben, oder sich dorthin bewegen wollen. Siehe dazu auch die SPARC Landscape Analysis, welche anhand von Elsevier, Wiley und SpringerNature diesen Wechsel aufzeigen.

Bei Meeting in Amsterdam, verwies Ed Pentz, langjähriger Direktor von Crossref völlig zurecht auf das folgende Zitat von Amy Brand (Direktorin MIT Press) aus dem Blog Post: Crossref at a Crossroad:

The Crossref of 2040 could be an even more robust, inclusive, and innovative consortium to create and sustain core infrastructures for sharing, preserving, and evaluating research information. [But only if Crossref is not] held back, and its remit circumscribed, by legacy priorities and forces within the industry that may perceive open data and infrastructure as a threat to their own evolving business interests.

Ich kann mich dem vollständig anschliessen. Gerade wenn nun Förderorganisationen anfangen für Grants bei Crossref DOIs zu registrieren, muss die Priorität weiter auf „Open“ gesetzt werden. Am besten aber so, dass das verbindende Element von Crossref weiterhin zum Tragen kommt.

DOIs und umfangreiche Metadaten bei Crossref

Ein DOI ist ein eindeutiger Identifier und eine URL, die zum wissenschaftlichen Beitrag führt.

Was viele jedoch nicht wissen, dass hinter einem DOI auch extrem umfangreiche und frei verfügbare Metadaten über den Beitrag stecken (können). Zu diesen Metadaten im JSON-Format gelangt man, wenn man den DOI mit einer anderen URL aufruft:

http://api.crossref.org/works/10.1128/JVI.03123-13

Bibliografische Grunddaten

Hinsichtlich den Metadaten von Artikel, Buchbeiträgen oder Bücher umfasst das Schema die klassischen Angaben, wie Titel, Publikationsdatum, Volume, Issue, Seitenzahlen, Journal, Serientitel, Journal, ISSN, Buchtitel, AutorInnen und Herausgebern.

Bezüglich AutorInnen ermöglich das Schema die Erfassung einer ORCID und einer Affiliation. Anstelle bzw. zusätzlich zur Erfassung der Affiliation als Text dürfte demnächst die ROR ID hinzukommen.

Lizenzangaben

Unter welcher Lizenz ein wissenschaftlicher Beitrag zugänglich ist, kann ebenfalls im Schema ausgegeben werden:

Hinsichtlich Open Access wird überwiegend eine Creative Commons Lizenz ausgegeben. Wie ein Blick auf alle verfügbaren Lizenz-Informationen bei Crossref zeigt, gibt es allerdings auch Verlage die wohl aus Versehen, aber auch aus voller Absicht eine eigene Lizenz vergeben. Unpaywall greift beispielsweise auf diese Information zurück.

Text-Mining

Die meisten DOIs führen zunächst auf eine Landing-Page und erst von dort dann zum eigentlichen Volltext. Für das Text-Mining oder die Archivierung möchte man aber direkt zum Volltext kommen und auch eine Präferenz mitgeben, in welchem Format (HTML, PDF, XML, EPUB) man den Volltext erhalten möchte. Das Crossref-Schema erlaubt dies via dem Element link, wo Verlage die direkte URL zum Volltext und dem entsprechenden Format deklarieren können.

Funding-Information

Die Typischen Informationen des „Funding Acknowledgments“ können strukturiert bei Crossref ausgegeben werden:

Einige Verlage wie z.B. MDPI lassen die AutorInnen diese Information strukturiert erfassen, andere extrahieren diese Informationen vom Paper mittels Text-Mining. Für die Identifikation der Förderorganisationen, wird eine von Crossref gepflegte Liste von 21k Organisationen verwendet. Es gibt zurzeit Bestrebungen, dass Förderorganisationen für Grants ebenfalls einen DOI bei Crossref registrieren, und somit eine solidere Verknüpfung von Publikationen zu Grants möglich ist.

Zitationen / Referenzen

Die verwendete Literatur bzw. die verwendeten bibliografischen Quellen können bei Crossref registriert werden. Im Idealfall passiert das strukturiert mittels Verweis auf einen anderen DOI:

Aber auch wenn kein DOI existiert kann die Referenz ausgegeben werden:

Crossref berechnet dann für Angabe die Anzahl Zitationen innerhalb des Crossref-Korpus.

Welche Publikationen sich hinter dieser Anzahl verstecken ist (bislang) via Crossref direkt nur für den Verlag einsehbar, welcher den DOI registriert hat. Dennoch können Dritte, wie OpenCitations die Metadaten aller DOIs nutzen um einen offenen Index mit Zitation zu erstellen. Die „Initiative for Open Citations“ (I4OC) versucht Verlage zu überzeugen ihre Zitationsdaten bei Crossref verfügbar zu machen.

DOIs für Peer Reviews

Seit 2017 ermöglicht Crossref auch die separate Vergabe von DOIs für Artefakte des Peer Reviews (z.B. referee reports, decision letters, and author responses). In den Metadaten der Publikation wird dann auf diese Artifakte verwiesen.

Weitere DOI Agenturen: DataCite, mEDRA

Nun ist Crossref nicht die einzige Organisation die DOIs vergibt. Aktuell gibt es noch 7 weitere Agenturen, welche beispielsweise auch DOIs für Filme vergeben (z.B. Harry Potter). Um zu sehen, bei welcher Agentur ein DOI registriert ist, kann man auch die API von Crossref nutzen:

https://api.crossref.org/works/10.19218/3906897011/agency

Aus meiner persönlichen Erfahrung haben ca. 80% aller aktuellen wissenschaftlichen Publikationen einen DOI. 98% dieser DOIs werden bei Crossref registriert. Die restlichen 2% verteilen sich auf die beiden Agenturen DataCite und mEDRA.

DataCite

Auch wenn der Fokus von DataCite bei Forschungsdaten liegt, haben einige Mitglieder von DataCite angefangen auch DOIs für primäre wissenschaftliche Publikationen wie Journals zu vergeben. Dies ist zwar nicht falsch, allerdings können mit dem auf Daten ausgerichteten Metadatenschema von DataCite einige Eigenheiten (z.B. Bibliografische Angaben oder auch Referenzen) nicht oder nur mit dem Verlust von Semantik ausgedrückt werden. Die Metadaten sind auch über eine eigene API ähnlich zu der von Crossref verfügbar:

Inzwischen empfehlen Crossref und DataCite gemeinsam, dass Zeitschriftenartikel, Konferenz papers oder Preprints besser bei Crossref registriert werden sollten.

mEDRA

Einige wenige Verlage die vom traditionellen Buchhandel herkommen, registrieren ihre DOIs via mEDRA. Die Metadaten können unter folgender REST API als XML aufgerufen werden.

http://www.medra.org/servlet/rest/metadata/10.2376/0300-4112-79-16

mEDRA bietet inzwischen auch eine Weiterleitung an Crossref an, so dass die Metadaten auch via Crossref-API erhältlich sind (z.B. 10.3238/ARZTEBL.2018.0008A)

Crosscite

Um die spezifischen Metadaten der verschiedenen DOI Agenturen zu erhalten, ist es unumgänglich über das jeweils spezifische Metadatenschema zu gehen.

Für einfachere Anwendungen, wie beispielsweise ein Zitat in einem bestimmten Zitierstil oder BibTeX zu erhalten, haben Crossref, DataCite und mEDRA zusammengespannt und bieten unter crosscite.org eine gemeinsame Abfrage und Ausgabe an.

De facto Standard

Für primäre wissenschaftliche Publikationen (insbesondere Zeitschriftenartikel, Bücher und Buchkapitel) ist die Registrierung und das Abliefern von Metadaten bei Crossref inzwischen ein de facto Standard geworden. Die Vollständigkeit der Metadaten unterscheidet sich jedoch noch stark nach Verlag bzw. Herausgeber.

Vor kurzem hat Crossref ein Dashboard geschaffen, wo man für die über 12’000 Mitglieder sehen kann, wer welche Metadaten liefert.

Participation Report für ACS: https://www.crossref.org/members/prep/316