Online-ID

DandyID Friendfeed Facebook Twitter Xing Technorati Bloglines Blip.fm YouTube Google Profiles My Mashable Posterous Mister Wong Delicious

Tweets archivieren und durchsuchen

Es gibt verschiedene Gründe, seine Tweets auf Twitter archivieren zu wollen. Zum Beispiel, man ist ein “Trüffelschwein” (@sms2sms über @PBBMarx) wie ich (rund 70 Prozent meiner Tweets enthalten Links). Ma.gnolia vor einem Jahr aber hat gezeigt: Datenverlust droht im Social-Media-Universum jederzeit (dazu auch ein lesenswerter Beitrag vom PR-Doktor: “Dein Twitter gehört dir nicht“).

Gegen Datenverlust auf Twitter helfen verschiedene Backup-Tools. Das Schönste ist sicherlich Tweetbook, das die letzten 3.200 Tweets als rund 130 Seiten starkes PDF-Buch, inklusive Titelblatt und Rückseite, ausgibt. Zusätzlich liefert Tweetbook auf Wunsch auch eine XML-Datei. Es gibt noch eine Reihe anderer Tools:

Der Haken an diesen Tools ist, dass sie zwar ein Backup liefern (wobei Twitter bisher keine Importfunktion hat), aber eben kein Archiv, in dem ich gesuchte Tweets schnell wiederfinden kann (eine PDF zu durchsuchen, ist etwas umständlich). Mit WordPress lässt sich jedoch recht einfach und schnell eine Tweet-Datenbank (wie meine hier) basteln. Eine Bastelanleitung dazu hatte ich bei stopdesign gefunden. Aber es geht sogar noch einen Tick einfacher.

In 10 Schritten zum eigenen Tweet-Archiv

  • Im ersten Schritt müssen die Tweets an einem Ort gesammelt werden. TweetBackup.com ist dazu der einfachste Weg. Das Tool meldet sich via OAuth direkt bei twitter.com an, so dass man sich nicht erst langwierig registrieren muss (man muss TweetBackup allerdings auf Twitter folgen). Wegen der möglichen Limitierung auf 3.200 Tweets siehe in den FAQ. In meinem Fall konnte TweetBackup auf 6.400 Tweets (von 8.200) zurückgreifen.
  • Der Backup-Vorgang dauert nicht länger als zwei Minuten. Von der Hauptseite wechselt man nun zu “Export” und speichert die Tweets als XML-Datei auf seiner Festplatte.

TweetBackup: Export

  • Damit die Umlaute korrekt eingelesen werden, muss man die XML-Datei danach im Editor (WordPad reicht aus) öffnen und das UTF-8-Coding in der ersten Zeile durch die Zeile “<?xml version=’1.0′ encoding=’ISO-8859-1′?>” ersetzen.
  • Hat man die Datei mit WordPad schon mal geöffnet, lässt sich über die Ersetzen-Funktion gleich ein Schönheitsfehler von TweetBackup entfernen: TweetBackup stellt nämlich allen Tweets den eigenen Twitternamen mit Doppelpunkt und Leerzeichen voraus. Man kann dieses Präfix später auch noch über das Search Regex Plugin in WordPress löschen.
  • Auf dem Server legt man nun ein Unterverzeichnis mit einer neuen WordPress-Installation an. Bei mir verweist nun die zusätzlich neu angelegte Subdomain http://twitter.marx-blog.de auf das neue Unterverzeichnis.
  • Die neueren Versionen von WordPress, insbesondere in Verbindung mit einem Theme wie Atahualpa,  klemmen häufig, etwa bei der Installation von Plugins. Deshalb erhöhe ich bei WordPress das Memory Limit: In der Datei wp-settings.php in der Zeile “define(‘WP_MEMORY_LIMIT’, ‘32M’);” die 32 einfach durch 64 ersetzen: “define(‘WP_MEMORY_LIMIT’, ‘64M’);”.
  • WordPress kennt bereits verschiedene “Werkzeuge”, Daten zu importieren. Ohne weiteres Plugin lässt sich die XML-Datei als RSS-Feed importieren, vorausgesetzt die Datei ist nicht größer als 8 MB – so die offizielle Version. Bei mir war die Datei noch nicht einmal halb so groß, ließ sich aber trotzdem nicht hochladen. Mit dem WXR File Splitter machte ich deshalb aus einer XML-Datei vier Dateien. Danach klappte der Import ohne Probleme.

WordPress WXR File Splitter (RSS XML)

  • Um in Zukunft nun jedes Tweet automatisch der Datenbank hinzuzufügen, habe ich danach das Twitter Tools Plugin installiert. Man muss lediglich seine Anmeldedaten für Twitter eingeben, bestätigen, dass für jedes Tweet ein Blogpost erstellt werden soll – und natürlich die Option ausschalten , dass jedes Blogpost automatisch getwittert wird.
  • Im Grunde war es das auch schon. Twitter Tools bringt in Zukunft alle Tweets in korrekter Form auf das Blog. Bei den importierten Tweets muss man mit zwei Plugins nachhelfen:  Das Autolink URI Plugin bringt alle von TwitterBackup totgestellten Links wieder zum Funktionieren. Einfach hochladen – das war’s. Das Tweet Plugin macht Gleiches für  @Usernames und #Hashtags.
  • Um die Suchfunktion von WordPress zu optimieren, habe ich zudem das Search Everything Plugin installiert. Das Yet Another Related Posts Plugin zeigt auf der Single Page jeweils ähnliche Tweets an. Je nach PHP- und WordPress-Template-Kenntnissen kann man schließlich noch am Design des Tweet-Archivs herumbasteln. Wenn es daran hapert: Das Atahualpa Theme bietet an die 200 Konfigurationsmöglichkeiten, ohne dass man sich mit PHP und Templates groß auskennen muss.

Verwandte Einträge

  1. 10.000.000.000 Tweets
  2. Der Tweet der Tweets
  3. 140 Zeichen Weltgeschichte
  4. Der Pentagigatweet
  5. Twitter Diskografien

3 comments to Tweets archivieren und durchsuchen

  • In meinen Augen ist es nicht erforderlich Tweets bei Twitter zu backuppen, wenn die Tweets aus einem Wordpressblog erfolgen. Für Wordpress gibt es hervorragendes Plugins, die es der Blogsoftware gestatten einen Backlink auf das Blogposting in Twitter zu posten. Somit wird bereits auf den Beitrag verwiesen. Hier würde es lediglich erforderlich sein eine Möglichkeit zur Kennzeichnung zu haben, dass dieser Beitrag getwittert wurde und damit reicht es dann auch. Da müsste allenfalls noch ein weiteres Feld in der Datenbank von Wordpress angelegt werden.

  • Sehr interessanter Artikel. Mich nervt das herum Scrollen bis ich ein Tweet wieder finde. Aber ich hoffe trotzdem, dass Twitter selber eine Archive-Funktion entwickelt, weil alle die Vorgänge der Archivierungen, mit der hier vorgestellten Methode wieder Zeitraubend ist.

  • Ich denke es wird nicht mehr lange dauern bis die von Twitter sich da etwas einfallen lassen. die sind sich ja der Sytuation auch bewust.