Eine kurze Auswertung der BibCamp³-Aktivität auf Twitter (#bib3)

In der letzten Monaten habe ich damit begonnen, mich an mein nächstes Forschungsvorhaben heranzupirschen: eine Untersuchung der Nutzung von Social Web-Tools (mit besonderem Fokus auf Blogs und Mikroblogs) durch Wissenschaftler. Das Projekt befindet sich noch in einer frühen Phase — vor allem sammle ich Daten und erarbeite die Methodik — aber einen sehr kleinen Ausblick kann ich jetzt schon bieten.

Ich habe für das BibCamp³ in Hannover (7.-8. Mai) einmal die Gelegenheit ergriffen, einige von mir entwickelte Twitter-Scripte für Konferenzen auszuprobieren. Eine sehr ähnliche (und noch etwas hübscher aufbereitete) Auswertung gibt es hier. Die „Ergebnisse“ sind bislang noch nicht besonders aufregend, aber ich wollte sie für die Teilnehmer und andere Interessenten trotzdem hier posten.

Datenbasis sind 1003 Tweets (beginnend mehrere Wochen vor dem Camp bis gestern) von 114 verschiedenen Personen, von denen vermutlich nicht alle körperlich anwesend waren (identifiziert über das Hashtag #bib3). Insgesamt gab es circa 120 physische Teilnehmer, soweit ich weiß. Twapperkeeper hat etwas mehr Datensätze (1067 Tweets) allerdings sehen die Ergebnisse relativ ähnlich aus. Die unten aufgeführten Charts geben weniger Themen und Diskussionslinien wider, als vielmehr eine Serie von Statistiken, aber ich hoffe sie sind trotzdem interessant.

Tweets über den Untersuchungszeitrum

Die X-Achse zeigt den Zeitpunkt im Stundenintervall, die Y-Achse die Anzahl der Tweets. Vor Beginn des Camps ist der Graph insofern lückenhaft, als dass er nicht alle Zeiträume der Inaktivität anzeigt.

Die Konferenztage sind klar zu erkennen. „Höhepunkt“ ist die Mittagszeit des ersten Tages (7.5.) mit 104 Tweets in einer Stunde. Beim Abfall in der Mitte beider Tage dürfte es sich um die Mittagspause handeln. 🙂

Ich bin leider nicht hundertprozentig sicher, ob die angebenen Zeiten CET +/- 0 oder möglicherweise CET – 1 sind, d.h. möglichweise ist 12:00 tatsächlich 13:00 Uhr Ortszeit. Auch sind alle Zeit abgerundet, d.h. 13:01 und 13:58 = 13:00 Uhr.

Aktivste Twitterer

Die X-Achse zeigt in dieser Darstellung die Namen der User sofern angegeben (nicht den @-Usernamen), die Y-Achse wieder die Anzahl der Tweets (Maxium: 63). Da der Graph nur die Top 50 von 114 darstellt, ergibt sich eine ziemlich eindeutige „Long Tail“-Distribution, wenn man sich den Verlauf nach rechts weiterdenkt (auch schön zu sehen bei Summarizr). Eine relativ kleine Spitzengruppe (@bsu_news, @NGC6544 und @MedioMartin) vereint eine hohe Zahl von Tweets auf sich, dann fällt es deutlich ab. Der Mittelwert liegt bei 8,8 Tweets.

Beliebte Begriffe

Auf der X-Achse sieht man die frequentesten Begriffe, auf der Y-Achse deren Frequenz (Maximum: 62). Hier sieht man ein wenig mehr als bei Summarizr, weil ich bis auf wenige Ausnahmen nur Nomen gezählt, wenig aussagekräftige Wörter wie „der“, „die“, „jetzt“, usw also weggelassen habe. Überrascht hat mich hier eigentlich nur die Frequenz des Begriffs „Scheitern“ (und Varianten davon) mit ingesamt 15 Nennungen. Sind Bibliothekare vielleicht doch ein etwas skeptisches Völkchen? Die Statistik sagt natürlich nichts zum größeren Zusammenhang…

Empfänger von @-Messages

Hier misst Summarizr „Gespräche“ zwischen bestimmten Benutzern, mein Chart listet hingegen einfach die Anzahl der @-Nachrichten an die Benutzer (X-Achse: Username, Y-Achse: @-Messages, bei einem Maximum von 59). Das Ergebniss ist interessant (sofern sich da kein Fehler eingeschlichen hat): auf Anne Christensen (@xenzen) entfallen fast doppelt so viele @-Messages, wie auf Platz 2 (@bibcamp mit 31 @s; der Mittelwert liegt bei 5 @s). Man muss berücksichtigen, dass bei manchen @-Nachrichten möglicherweise das #bib3-Hashtag nicht benutzt wurde, wodurch sie aus dem Datensatz herausfallen, aber andere Fehlerquellen fallen mir eigentlich nicht ein.

Ganz allgemein sollte man im Kopf behalten, dass nicht alle @s auch etwas mit „Konversation“ zu tun haben, sondern auch RTs und andere Verweise einschließen. Trotzdem ist es zumindest auf den ersten Blick spannend, wie wenig die Anzahl der Tweets mit der Anzahl der Erwähnungen korreliert. Auch hier wieder ein (very) Long Tail: 94 Benutzer werden mindestens einmal erwähnt, also fast alle Twitter-Teilnehmer.

Empfänger von RTs

Wieder zeigt die X-Achse die Benutzernamen, die Y-Achse die Anzahl der RTs. Wieder liegt Anne Christense vorne, wobei man bedenken muss, dass die oben gezeigten @-Messages bereits die RTs enthalten (ein Chart mit beiden Frequenzen wäre sinnvoll gewesen, aber mir fehlte die Zeit). Das Maximum liegt bei 17, der Mittelwert bei 3,1 (152 RTs an 49 Nutzer).

So, die Zahlenschlacht war hoffentlich nicht allzu ermüdend. Wie gesagt, ich werde in der Zukunft noch wesentlich mehr mit solchen Daten anfangen und natürlich auch eine qualitative Untersuchung anschließen.

Den BibCamp-Twitterern sei gesagt: ihr wart sehr fleißig, weiter so — und beim nächsten Mal bin ich hoffentlich dabei!

5 Gedanken zu “Eine kurze Auswertung der BibCamp³-Aktivität auf Twitter (#bib3)

  1. Pingback: Bibliothekarisch.de » Blog Archive » Beiträge zum Bibcamp3 in Hannover [Update 11.05.10, 23:27 Uhr]

  2. Besten Dank für die Auswertung! Kleine inhaltliche Anmerkung am Rande: Beim „Scheitern“ ging es darum, eben jenes zuzulassen. Scheitern als Chance, sozusagen. Wer scheitert, erhält die Möglichkeit, aus seinen Fehlern zu lernen. Wer scheitern ausschließen möchte, verhindert Innovation.

  3. Eine schöne Untersuchung. Ein kleiner Hinweis, wie du die Plots aus R direkt in eine Datei schreiben kannst und nicht mehr auf Snapshots angewiesen bist (Bsp.png):

    png(„dateiname.png“)

    plot(…)#deine plotbefehle

    dev.off()#nun wir dein fertiger plot in die angegebene Datei gespeichert.

    Viel Spaß und freue mich auf mehr!

    By the way: Nutzt du das twitteR package bzw. könnte es dir weiterhelfen?

    Klicke, um auf twitteR.pdf zuzugreifen

  4. Pingback: #OR10 is here to come « LIBREAS.Library Ideas

Hinterlasse einen Kommentar