Sonntag, 5. Februar 2012


Topthema

Montag, 12. Juli 2010 | Topthema

Cassandra spendiert Twitter neue Echtzeit-Services

(Link zum Artikel: http://www.entwickler-magazin.de/php/kolumnen/056258)
  • Teilen
  • kommentieren
  • empfehlen
  • Bookmark and Share

Über den Sinn und Unsinn von Twitter zu streiten, dürfte sich mittlerweile erübrigen - der Messaging Service ist die Referenz, wenn es um das bereitstellen von 140-Zeichen-Kurznachrichten im Web geht, noch vor Google Buzz und anderen. Spätestens jedoch, wenn man auf das Geschäftsmodell von Twitter zu sprechen kommt, können sich nur die wenigsten eine Spur Ironie nicht verkneifen – denn ein echtes Geschäftsmodell lag bisher nur im Bereich der Spekulation.

Techtelmechtel

Genau das hat sich jetzt mit einer kleinen Indiskretion auf dem Twitter-Development-Blog geändert.

Our analytics, operations and infrastructure teams are working on a system that uses cassandra for large-scale real time analytics for use both internally and externally. Ryan King, 2010

Ein neuer Analytics-Service für Twitter-User? Zumindest die kleine, ausgewählte Gruppe an Beta-Testern für Twitters (noch) geheime Business-Dienstleistungen dürfte sich demnächst über zusätzliche Services à la Google Analytics für ihre Twitter-Accounts freuen – die Gerüchteküche brodelt bereits vor sich hin.

Ménage à trois

Abseits der Spekulationen gibt es mit der Ankündigung aus dem Development Blog jedoch auch ganz handfeste Neuigkeiten zu vermelden. Zunächt einmal bleibt festzuhalten, dass Twitter auch weiterhin an der MySQL für die Speicherung unserer Tweets festhalten wird. Ob das wirklich als Lob für die MySQL zu verstehen ist, oder nicht vielmehr einem nicht zu unterschätzendem Aufwand für die sonst erforderliche Migration zu danken, steht natürlich auf einem ganz anderen Blatt. Zuletzt hatten der #worldcup, gepaart mit anhaltend starken Anstieg der Nutzerzahlen das System doch arg in die Knie gezwungen, Twitter sah sich zeitweise sogar genötigt, den Zugriff auf seine APIs zu beschränken.

Abhilfe - zumindest in Teilen - soll der Einsatz von Cassandra bringen. Cassandra ist ein skalierbares, nichtrelationales und verteiltes Datenbank-Management-System, dass zunächst bei Facebook entwickelt und dort für die Inbox-Suche verwendet wurde, ehe man das System 2008 als Open-Source-Software der Allgemeinheit zur Verfügung stellte. Im vergangenen Jahr war Cassandra bei Facebook auf über 600 Cores für über 120 TB Daten verantwortlich.

Bei Twitter soll die NoSQL-Datenbank u.a. für die Analyse von Geodaten sowie für die Speicherung und Abfrage von Informationen aus dem laufenden DataMining herangezogen werden - welches ganz nebenbei über die gesamte Userbase läuft. Und auch in kommenden Projekten, bei denen eine groß angelegte Datenspeicherung erforderlich ist, will Twitter die Cassandra zum Einsatz bringen.

(rl)

Kommentare

Gravatar ChrisCOLOR 12.07.2010
um 17:41 Uhr
Das Impulse wie Cassandra (oder Googles BigTable, an dem es sich mit orientiert) in letzter Zeit von solchen Evil Companies kommen, gibt einem schon zu denken... Fehlt nur noch, dass Microsoft sich eine Cloud-Technologie ausdenkt und... ups, zu spät;-) Aber vielleicht täuscht das ja alles und in Wahrheit setzt sich nur die Technik mit dem größten Marketingbudget im Rücken durch. Obwohl... wäre das besser? Ich finde es aber gut, dass wir hier mal einen handfesten Anwendungsfall für eine NoSQL bekommen, frage mich aber auch, ob Twitter sich nicht einfach auch was von Oracle hätte kaufen können um sich den ganzen Aufwand zu sparen. #zitieren

Folgende Links könnten Sie auch interessieren