Twitter が検索用バックエンドを検索エンジンに置き換えることで大量検索と大量インデックス作成に対応


Twitter の検索用バックエンドが MySQL から Lucene に置き換わりました。多少の言語対応の問題もあるようですが、無事に、そして問題なく動作しているようで、素晴らしいことです。

http://engineering.twitter.com/2010/10/twitters-new-search-architecture.html
http://jp.techcrunch.com/archives/20101006new-twitter-search/

タイトルにはわざと「検索エンジン」と記載しましたが、ここで注目すべきことは、検索のため (早く検索結果を返す、大量な検索に対応する、出来る限り早くドキュメントをインデックスして検索できるようにする) には検索エンジンを入れる方がより適切である、ということです。どんなに頑張っても RDBMS (今回のケースは MySQL) は RDBMS です。INSERT/UPDATE/DELETE などを伴うトランザクションには強いですが、検索のためにと考えれば、当然ながら検索エンジンの方が何十倍も得意でしょう。

誰からもそう思われるように、検索エンジンも RDBMS ぐらいに手近なものになれば。

広告