arXiv & Open Access Text Mining

Nature berichtete gestern von einem Vorhaben, das exemplarisch Vorteile des offenen Zugangs zu Informationen beschreibt: Ein Team der Harvard University wird die ca. 740.000 Volltexte des Open Access Repositorys arXiv mittels Text Mining Methoden analysieren. Ziel ist es die Halbwertszeit wissenschaftlicher Begriffe und Konzepte, ihre Dissemination oder gar ihren Mem-Charakter zu erfassen, kurzum: Wissenschaftstrends zu kartographieren. Neben dieser eher szientometrischen Perspektive gibt es allerdings  die angewandte Perspektive des Retrievals: Die Auswertungen erlauben es auch, die relevantesten Publikationen zu einer spezifischen Thematik zu bestimmen. Das sogenannte Cultural Observatory Team der Harvard University hat bereits Erfahrungen mit Analysen dieser Art gesammelt als es mit ähnlichen Verfahren 5 Millionen Texte, die in Google Books indiziert waren, auswertete. Die arXiv-Implementierung verspricht allerdings bessere Usability: Dokumentempfehlungen innerhalb des Google Book Index sind von begrenztem Nutzen, schließlich ist ein Großteil des Materials nicht offen zugänglich. Davon abgesehen illustriert das Projekt den Vorteil der Zugänglichmachung von Informationen unter offenen Lizenzen: restriktive Nutzungsbedingungen, wie sie v.a. im Closed Access üblich sind, untersagen Text Mining.

Werbeanzeigen

infocamp: Barcamp zu Bibliotheks- und Informationswissenschaft 2012 in Chur (CH)

Liebe Kolleginnen und Kollegen,

Weiterbildungen, Konferenzen, Tagungen, Arbeitsgruppen, Workshops, Meetings ­– Ziel der meisten dieser Veranstaltungen ist die Wissensvermittlung und der Austausch mit FachkollegInnen. Aber bieten diese Veranstaltungen immer genügend Zeit für Gespräche und Diskussionen und werden die für Sie relevanten Themen behandelt?

Beim Infocamp in Chur werden Sie genau die richtige Mischung bekommen! Die als „Unkonferenz“ organisierte Veranstaltung lebt von Ihnen und mit Ihnen. Es gibt keine BesucherInnen, nur TeilnehmerInnen! Sie gestalten das Programm aktiv mit und entscheiden selbst, wie Sie sich einbringen. Ziel ist es, eine Kommunikationsplattform für den Erfahrungsaustausch und die Diskussion zu bieten.

Das Infocamp findet statt vom 7.-8. September 2012 an der Hochschule für Technik und Wirtschaft in Chur. Die Veranstaltung ist als Barcamp konzipiert, das durch einige Keynotes umrahmt wird. Diskutiert werden aktuelle Themen wie beispielsweise:

  • Methoden der Informationswissenschaft -­ Stand und Perspektive
  • Open Access -­ Paradigma der digitalen Wissenschaft
  • Social Media – Kollaboration und der Beitrag der Bibliothek
  • Mobile Media ­- Das Verschwinden des „Ortes“ Bibliothek
  • Open Knowledge -­ Offenheit als Grundlage der Informationswissenschaft und ihrer Praxis?

Eingeladen sind Personen aus der bibliothekarischen und informationswissenschaftlichen Praxis und Forschung. Darüber hinaus freuen wir uns über TeilnehmerInnen aus verwandten Bereichen wie Archiv, Museum, Verlag, E-Learning und IT-Entwicklung.

Die Teilnahme ist kostenlos! Ein Anmeldeformular wird Anfang 2012 auf der Website http://www.infocamp.ch zur Verfügung gestellt.

Weitere Informationen zur Organisation des Infocamps: http://www.infocamp.ch und Facebook https://www.facebook.com/pages/Infocamp-Chur-2012/320380234658735, hashtag #icamp12

Viele Grüße, für das Infocamp-Organisationsteam

Ulrich Herb

Gesamtkonzept für die Informationsinfrastruktur online

Das „Gesamtkonzept für die Informationsinfrastruktur in Deutschland“ ist online. Erstellt wurde das Gesamtkonzept von der Kommission Zukunft der Informationsinfrastruktur (KII), die im Auftrag der Gemeinsamen Wissenschaftskonferenz (GWK) arbeitete. Auszug aus der Pressemitteilung der Leibniz-Gemeinschaft:

Die Zusammensetzung der Kommission stellt ein Novum dar. Sie repräsentiert die maßgeblichen Akteure der Informationsinfrastruktur in Deutschland, und zwar sowohl die Dienstleister selbst als auch die Förderorganisationen ebenso wie die wissenschaftlichen Nutzer.

Die Kommission definiert „Informationsinfrastruktur“ als nationales, disziplinübergreifendes „Netz“ von Einrichtungen. Diese nehmen dezidiert in öffentlichem bzw. institutionellem Auftrag die Versorgung im weitesten Sinne von Wissenschaft und Forschung mit Information und damit zusammenhängenden Dienstleistungen wahr. Vor diesem Hintergrund wird dem Konzept ein ganzheitlicher, strukturorientierter Ansatz zugrundegelegt. Disziplin-, sparten- und institutionenübergreifend werden acht Handlungsfelder beleuchtet, die aus heutiger Sicht für die Informationsinfrastruktur von zentraler Bedeutung sind:

  1. Lizenzierung
  2. Hosting / Langzeitarchivierung
  3. Nichttextuelle Materialien
  4. Retrodigitalisierung / kulturelles Erbe
  5. Virtuelle Forschungsumgebungen
  6. Open Access
  7. Forschungsdaten
  8. Informationskompetenz / Ausbildung.

Alle Handlungsfelder stehen miteinander in Zusammenhang. Darüber hinaus wurden 5 der 8 Themen parallel und in Kooperation zwischen der Kommission und der Allianz-Schwerpunktinitiative Digitale Information behandelt.

(Disclosure: Ich war an zwei KII-AGs beteiligt.)

Forschungsdatenmanagement: Welche Anforderungen haben Wissenschaftler?

„Welche Anforderungen haben Wissenschaftler bei der dauerhaften Zugänglichkeit wissenschaftlicher Daten?“ Dieser Frage geht eine Studie der niederländischen SURFfoundation nach. In der Metadstudie werden fünfzehn Publikationen zu dem Themenkomplex betrachtet.

Der Autor Martin Feijen benennt folgende Faktoren, die für Wissenschaftsmanagement und Infrastruktureinrichtungen von zentraler Bedeutung bei der Entwicklung von Massnahmen des Forschungsdatenmanagements sind (S. 4):

  • Tools and services must be in tune with researchers’ workflows, which are often discipline-specific (and sometimes even project-specific).
  • Researchers resist top-down and/or mandatory schemes.
  • Researchers favour a “cafeteria” model in which they can pick and choose from a set of services.
  • Tools and services must be easy to use.
  • Researchers must be in control of what happens to their data, who has access to it, and under what conditions. Consequently, they want to be sure that whoever is dealing with their data (data centre, library, etc.) will respect their interests.
  • Researchers expect tools and services to support their day-to-day work within the research project; long-term/public requirements must be subordinate to that interest.
  • The benefits of the support must clearly visible – not in three years’ time, but now.
  • Support must be local, hands-on, and available when needed.

Die Studie „What researchers want“ (PDF) ist frei zugänglich.

PS: Die duz hat sich in ihrer März-Ausgabe unter dem Titel „Der Kampf um den Rohstoff des Wissens“ dem Thema  angenommen. Leider sind die Beiträge mehrheitlich nicht Open Access.

Reform der bibliothekarischen Verbünde gefordert

Wie angekündigt hat der Wissenschaftsrat heute „Empfehlungen zur Zukunft des bibliothekarischen Verbundsystems in Deutschland“ (PDF) veröffentlicht. Auszug aus der Pressemitteilung:

Die bisherigen Serviceleistungen der bibliothekarischen Verbünde für ihre Mitgliedsbibliotheken sind in Teilen positiv zu bewerten. Gleichwohl lässt das gegenwärtige Verbundsystem nach Auffassung des Wissenschaftsrates zugleich deutliche Schwächen erkennen. „Eine wirkungsvolle Koordination und Arbeitsteilung bei der Entwicklung moderner Dienstleistungen findet zwischen den regional ausgerichteten Verbünden nicht statt. Einige Dienstleistungen werden mehrfach angeboten, andere stehen gar nicht zur Verfügung. Sollen die wissenschaftlichen Bibliotheken in Deutschland den aktuellen und künftigen Herausforderungen gewachsen sein, ist eine grundlegende Reform des Verbundsystems unumgänglich. Dazu gehört auch eine deutliche Reduzierung der Zahl der derzeit sechs Verbünde“, so Peter Strohschneider, scheidender Vorsitzender des Wissenschaftsrates.

Weiter haben Wissenschaftsrat und Deutsche Forschungsgemeinschaft (DFG) eine gemeinsame Erklärung zur Zukunft der sechs Bibliotheksverbünde veröffentlicht. Unter dem Titel „Zur Zukunft der Bibliotheksverbünde als Teil einer überregionalen Informationsinfrastruktur in Deutschland“ (PDF) wird in neun Punkten Handlungsbedarf festgestellt.

Schon im Januar hat der Ausschuss für wissenschaftliche Bibliotheken und Informationssysteme der DFG ein „Positionspapier zur Weiterentwicklung der Bibliotheksverbünde als Teil einer überregionalen Informationsinfrastruktur“ (PDF) veröffentlicht. Auch dieses wurde heute veröffentlicht. Auszug aus der Pressemitteilung:

Das vom DFG-Ausschuss für wissenschaftliche Bibliotheken und Informationssysteme erarbeitete Positionspapier analysiert Struktur, Arbeitsweise und Finanzierung des Verbundsystems. Aus gesamtstaatlicher Sicht erkennt es „eine Überversorgung“ im Hinblick auf die Basisdienste, der – an gewandelten Nutzerinteressen und modernen Technologien gemessen – „Versorgungs- und Dienstleistungslücken“ gegenüberstehen. Vor diesem Hintergrund spricht sich der Ausschuss dafür aus, Basisdienste künftig arbeitsteilig zu organisieren und Zusatzdienste verbundübergreifend anzubieten.

Der Wissenschaftsrat hat bereits am 31. Januar 2011 hatte drei Empfehlungen zur Zukunft der Informationsinfrastrukturen veröffentlicht.

Wissenschaftsrat zu Informationsinfrastrukturen

Der Wissenschaftsrat, das zentrale wissenschaftspolitische Beratungsgremium Deutschlands, hat heute drei Empfehlungen veröffentlicht, die je nach Arbeitsgebiet und Disziplin, gut und gerne als Pflichtlektüren bezeichnet werden können:

Übergreifende Empfehlungen zu Informationsinfrastrukturen

Wissenschaftlichen Sammlungen, Bibliotheken, Archiven und Datensammlungen, die unter dem Begriff Informationsinfrastrukturen zusammengefasst werden, kommt nach Auffassung des Wissenschaftsrates eine grundlegende Bedeutung für Forschung, Lehre und Nachwuchsförderung in allen wissenschaftlichen Fächern zu. „Informationsinfra­strukturen sind ein konstitutiver Teil des Wissenschaftssystems. Die Gewinnung neuer wissenschaftlicher Erkenntnisse wäre ohne sie nicht möglich. Es ist daher eine öffentli­che Aufgabe, ihre Verfügbarkeit für die Wissenschaft zu gewährleisten“, so der Vorsitzende des Wissenschaftsrates, Peter Strohschneider.

Empfehlungen zu Forschungsinfrastrukturen in den Geistes- und Sozialwissenschaften

Hinsichtlich der internationalen Wettbewerbsfähigkeit des deutschen Wissenschaftssystems ist es aus Sicht des Wissenschaftsrates notwendig, der an wissenschaftspolitischer Bedeutung zunehmenden Infrastrukturent­wicklung für die Geistes- und Sozialwissenschaften in Deutschland mehr Aufmerksam­keit zu widmen. Positiv bewertet er bereits jetzt die Entwicklung der Forschungsinfra­strukturen der quantitativen Sozial- und Wirtschaftswissenschaften. Vor allem im Be­reich großer Umfragestudien konnte hier in den vergangenen Jahren eine internationale Spitzenstellung erreicht werden. Eine vergleichbare Position gilt es auch für die qualita­tiven Sozialwissenschaften und die Geisteswissenschaften anzustreben. In diesem Sinne hat der Wissenschaftsrat Empfehlungen zur Stärkung der internationalen Konkur­renzfähigkeit von Informations- und sozialen Infrastrukturen sowie zur Ausstattung mit Großgeräten in einzelnen Feldern der Geistes- und Sozialwissenschaften in Deutsch­land ausgesprochen. Dabei äußert er sich auch zu Fragen der Archivierung von For­schungsdaten.

Empfehlungen zu wissenschaftlichen Sammlungen als Forschungsinfrastrukturen

Deutschland verfügt über eine reiche und sehr vielfältige Sammlungslandschaft, die Grundlage bedeutender und herausragender Forschung ist. Eine Systematisierung von Arten, die Erkundung evolutionären oder klimatischen Wandels sind ohne solche Sammlungen ebenso undenkbar wie die Erforschung schriftloser oder längst vergange­ner Kulturen oder die Erforschung der Entwicklung von Technik, Wissenschaften und Künsten. Der Wissenschaftsrat hat jedoch feststellen müssen, dass das Potenzial dieser Sammlungen – vor allem im universitären Bereich – noch nicht hinreichend er­kannt und genutzt wird. Der Vorsitzende des Wissenschaftsrates, Professor Peter Strohschneider: „Viele Sammlungen lagern unbekannt und ungenutzt in Abstellräumen der Universitäten, wo weder ihr dauerhafter Erhalt noch ihre wissenschaftliche Bearbei­tung möglich sind. Womöglich liegen hier noch ungeahnte Schätze für die Forschung.“

Für den 3. Februar 2011 wurden die  Empfehlungen zur Zukunft des bibliothekarischen Verbundsystems in Deutschland angekündigt.

Förderorganisationen fordern „data sharing“ in der Medizin

Siebzehn lebenswissenschaftliche Förderorganisationen haben heute ein Statement zur Zugänglichkeit von Forschungsdaten veröffentlicht. Unter dem Titel „Sharing research data to improve public health“ fordern die Organisationen, darunter der Wellcome Trust, der National Institutes of Health (NIH) und die Deutsche Forschungsgemeinschaft (DFG), die Nachnutzung von Forschungsdaten zu verbessern. Um diese Mission erfolgreich zu gestalten, kündigen die Organisationen eine verstärkte Kooperation in diesem Handlungsfeld an.

Dem Statement liegt folgende Vision zugrunde:

We, as funders of health research, intend to work together to increase the availability to the scientific community of the research data we fund that is collected from populations for the purpose of health research, and to promote the efficient use of those data to accelerate improvements in public health.

Der Rahmen der Forderung nach einem weitgehenden Zugang zu medizinischen Daten wird durch die Prinzipien „Equitable“, „Ethical“ und „Efficient“ definiert.

Um die Nachnutzung und die Nachprüfbarkeit der Forschungsdaten in der Medizin zu verbessern werden verschieden Maßnahmen, wie z.B. Aktivitäten des Forschungsdatenmanagements, benannt. Zur Umsetzung des Statements wurde eine Arbeitsgruppe installiert.

In einem Beitrag in The Lancet beschreiben Mark Walport, Direktor des Wellcome Trust und Paul Brest, Präsident der Hewlett Foundation ihre Motivation.

Weitere Informationen: