Offene EHEC-Forschung

Das Potenzial des Webs für die Wissenschaft lässt sich dieser Tage am Beispiel der EHEC-Forschung dokumentieren. Kai Kupferschmidt schildert die Entwicklungen rund um die Sequenzierung des EHEC-Erregers vor Tagen in der Science wie folgt: „scientists around the world […] are analyzing available genomic data on the fly and, via tweets, wikis, and blogs, disseminating results online“.

Die Bedeutung von Blogs und Wikis bei der EHEC-Forschung wird in einem äußerst lesenswerten Interview mit der Bioinformatikerin Marina Manrique, das Tobias Maier in seinem Blog WeiterGen veröffentlicht hat, deutlich. Manrique arbeitet für die spanische Biotech-Firma Era7 und ist mit der Auswertung der EHEC-Sequenzen beschäftigt. Auszug aus dem Interview:

„Es ist fantastisch zu sehen, wie weltweit Wissenschaftler angefangen haben, zusammen diese Daten zu analysieren. […] Die Freigabe der Rohdaten durch BGI, Lifetech und der Health Protection Agency Großbritannien war entscheidend für dieses Crowdsourcing-Bewegung, genauso wie die Nutzung von Twitter, GitHub und die privaten Blogs. […]  Am wichtigsten ist, dass dadurch dass wir unsere Ergebnisse Open-Access publizieren, vor allem unter CC0 Lizenz, wir allen Menschen die Möglichkeit geben kostenlos auf die komplett öffentlich zugänglichen Daten zu zu greifen.

Wie schnell und unbürokratisch die Forschung des Teams um  Manrique ablief erklärt sie in ihrem Blog:

During the morning sessions of the second day (2nd of June) BGI announced the release of the sequencing data of 5 IonTorrent chips […]. Just some hours later Nick Loman […] published a de novo assembly of the reads with MIRA in his blog […] . And then, some hours later (in the morning of the 3rd of June) we published the annotation of the Nick’s assembly in our website. We annotated it with the pipeline (BG7 pipeline) we were presenting at the conference […].

Die Bedeutung von Blogs, die eine schnelle und niedrigschwellige Kommunikation fördern, lässt sich z.B. an Blogposts von Nick Loman (Pathogens: Genes and Genomes) und Kat Holt (bacpathgenomics) und den dort erwähnten Referenzen zeigen.

Verschiedene kommerzielle und öffentliche Forschungseinrichtungen haben EHEC-Daten, zum Teil unter Creative-Commons-Lizenzen, zur Nachnutzung veröffentlicht. So z.B. die Health Protection Agency in Großbritannien oder das chinesische Beijing Genomics Institute (BGI) und das Universitätsklinikum Hamburg-Eppendorf. Die Daten der beiden letztgenannten Organisationen wurden unter CC0 veröffentlicht und sind darüber hinaus über einen Digital Object Identifier (DOI) eindeutig adressierbar.

Eine kollaborative Analyse der EHEC-Daten wird auf GitHub betrieben. Interessant ist, dass mit GitHub eine Plattform genutzt wird, die nicht von einer wissenschaftlichen Infrastruktureinrichtung geschaffen wurde, sondern von einem kommerziellen Hostingservice zur Software-Entwicklung.

2 Gedanken zu “Offene EHEC-Forschung

  1. „Eine kollaborative Analyse der EHEC-Daten wird auf GitHub betrieben. Interessant ist, dass mit GitHub eine Plattform genutzt wird, die nicht von einer wissenschaftlichen Infrastruktureinrichtung geschaffen wurde, sondern von einem kommerziellen Hostingservice zur Software-Entwicklung.“

    Der Einwurf kommt etwas spät, aber: brauchen wir von wissenschaftlichen Infrastruktureinrichtungen geschaffene Plattformen überhaupt? Sollten wir vielleicht lieber Kurse zu Amazon Web Services, Mechanical Turk, Github, WordPress, MediaWiki etc anbieten?

Hinterlasse einen Kommentar