Archivgeil

Ich habe seit einiger Zeit tweetnest im Einsatz (hier).

Ein kleines aber feines PHP-Script, dass nichts anderes tut, als meine Tweets zu archivieren. Einmal in der Nacht holt es sich die neusten Tweets aus meinem Twitteraccount und schreibt sie in eine extra Datenbanktabelle. (Blöder weise importiert es nur etwa die letzten 3000 Tweets, was aber daran liegt, dass Twitter einen nicht an die früheren ran lässt, was ich für eine mittelgroße Schweinerei halte)

Twitter, als das convenient Kommunikationstool meiner Wahl wird täglich mit 20 bis 40 Nachrichten bestückt. Mit Links, Kommentaren und Unterhaltungen, Erlebnissen und Gedanken. Ein Großteil meines gesamten Bewusstseinsstroms, also. All das verschwand aber immer recht bald in den undurchsuchbaren Untiefen der Twitterserver und hat somit nur Echtzeitwert.

Durch tweetnest habe ich meine Twitterbekundungen bis zurück des März diesen Jahres archiviert und ich bin schon drei bis vier mal darauf zurückgekommen. Also auf mich. Auf auf Tweets von mir. Ich erinnerte Situationen, Gesprächpartner oder Stichworte, in deren Kontext sich ein gesuchter Link verbarg. Und jedes Mal wurde ich sofort fündig. Großartig!

Mit Twitter hat man eigentlich eine wunderbare Gehirnauslagerung. Ein Gedächtnis, das einerseits – wie jedes Gedächtnis – ausgestattet ist mit kontextuellen Enterhaken aber darüber hinaus noch volltextdurchsuchbar. Wie schade es ist, dass Twitter so unfassbar vergesslich ist, zeigt tweetnest also sehr eindrucksvoll.

Apropos vergesslich. Ich backuppe jetzt auch immer schön meine Blogs. Und zwar mit wpTimeMashine, dass mir die Datenbanktabelle meiner Blogs direkt in die Dropbox speichert. Diese wird mit allen anderen Daten meines Rechners – leider nicht regelmäßig genug – auf meine externe Festplatte gespeichert. Mit Timemashine von Apple.

Es gibt Leute, die meinen, Daten sollten ebenso dem Vergessen anheim gegeben werden, wie Erinnerungen. Ich glaube aber, solche Menschen haben nur eine tiefe Sehnsucht nach dem Tod.

12 Gedanken zu „Archivgeil

  1. Ich muss manchmal schon echt aufpassen was ich poste. Wird manchmal ziemlich privat. Da denke ich dann lieber dreimal nach bevor ich das dann wirklich poste. Dieser „Achtung lieber nicht Gedanke“ kommt mir jedoch vlt sogar leider 😉 nur selten.

  2. Als Alternative für tweetnest für Leute ohne eigenen Webspace/Server mit PHP: http://www.tweetbook.in gibt alle Tweet als PDF aus, mit jedem PDF-Reader auch durchsuchbar. Leider werden dabei nicht die nativen Retweets mit erfasst. Aber ansonsten, regelmäßig durchgeführt echt ganz nützlich. (Dort können auch alle gefavten Tweets als PDF ausgegeben werden, auch sehr praktisch!)

    PS: Manchmal ist die Seite etwas lahm in der PDF-Erstellung. Dann den kleinen Tipp links auf der Seite befolgen. Das klappt mit dem Aus- & neu Einloggen nach 10min.

  3. Ähnlich wie bei mir, nur dass ich meine Blogtexte nicht backuppe. Aber die backuppt Hosteurope für mich mit.
    Achja, und TimeMaCHine.

  4. Pingback: engl @ absurdum » Blog-Archiv » selbstentlarvung

  5. Cooler Tipp, danke! Hab dich gleich mal flattered und mir das Tool installiert.
    Gibt es echt keinen Weg, an die älteren Tweets zu kommen?

  6. @mspro: äh, jo. wird das per DB sql statement gemacht oder suche mit invertierten index etc?

    ich frage nur so gehässig, da jetwick.com ähnliches macht. Beispiel: http://jetwick.com?u=timetabling&q=java

    d.h. nicht nur meine tweets sondern prinzipiell von jedem sind durchsuchbar (wenn man nach neuem user sucht muss man ca 10 min warten und dann sind die letzten status meldungen dieses users durchsuchbar)

    echte volltextsuche via solr. wir sind auch gerade am überlegen das ganze open source zu machen. da es eh schon auf apache solr beruht und so viele features zu implementieren gäbe die wir allein (in der freizeit) nicht stemmen könnten … hat jmd interesse?

    html + csv export wenn man mag (unter den tweets)

  7. Peter – ich versteh grade nicht, was du meinst. wie das SQL-Statement zum suchen aussieht, schaust du am besten selber mal nach. der Code ist offen, ich habe ihn aber nicht geschrieben.

    Und jetzt weiß ich eigentlich nicht so recht, was jetwick jetzt will. Die letzten Statusmeldungen kann ich auch in der normalen Twitterseach suchen. Ich sprach davon, dass ich die Letzten 7 Monate durchsuchen kann und ab dort alles. für immer.

    Wie weit zurück reicht denn euer index?

  8. @ff: > „Gibt es echt keinen Weg, an die älteren Tweets zu kommen?“

    nein. twitter api limitierung. wenn du glück hast hat google die aber indiziert.

  9. Hi mspro,

    > Wie weit zurück reicht denn euer index?

    eine woche. wenn man seinen account aber explizit durchsucht (s.u.) dann eigentlich forever.

    > ich versteh grade nicht, was du meinst.

    sorry. also für deine tweets mag der ansatz einer DB suche performance mäßig noch ausreichend sein. für sehr viele daten. ist er es nicht. da muss man nen invertierten index aufbauen: http://en.wikipedia.org/wiki/Inverted_index bzw. software nutzen die das von hause aus macht (apache solr).

    > Ich sprach davon, dass ich die Letzten 7 Monate
    > durchsuchen kann und ab dort alles. für immer.

    in ner späteren version wird jetwick das sehr komfortabel können (einfach anmelden + nutzen).

    momentan kann man das aber wie folgt erreichen: man durchsucht jetwick jede woche z.B. nach jetwick.com?u=mspro und jetwick wird dann automatisch die letzten tweets (maximal momentan aber 50) archivieren.

    andere tolle features sind trending links (suchabhängig), translate butten, sprach filter etc (siehe das intro video)

  10. Nur kurze info: man kann sich nun einloggen und sein tweets (max 3200) innerhalb 3 click durchsuchbar machen. am montag wirds dann noch interessanter

Kommentare sind geschlossen.