自宅サーバー Fedora (Home) »  MySQL でデーターベースサーバー構築 » Tritonn(Senna) で日本語全文検索

Tritonn(Senna) で日本語全文検索

Tritonn とは日本語全文検索エンジン Senna を MySQLから利用可能にするために MySQL を改造したものです。
ここでは Tritonn を利用するために必要な、形態素解析器である MeCab と日本語全文検索エンジンである Senna も合わせてインストールを行います。

  • MeCab のインストール
    Tritonn を利用するためには事前に Senna のライブラリ(libsenna)がインストールされている必要があります。また Senna を利用するためには MeCab のライブラリと辞書が事前にインストールされている必要があります。ここでは Senna の分かち書きインデックスを作成するために必要な MeCab のインストールを行います。
  • Senna のインストール
    Senna は DBMS やスクリプト言語処理系等に組み込んで日本語全文検索機能を強化するための組み込み型の全文検索エンジンです。n-gram インデックスと単語インデックスの特徴を兼ね備えた、高速かつ高精度な転置インデックスタイプのエンジンです。コンパクトな実装ですが、大規模な文書量と検索要求を処理できるように設計されており、純粋な n-gram インデックスを作成することも可能です。
  • Tritonn のインストール
    Tritonn は MySQL の FULLTEXT インデックスの処理に MyISAM のビルトインの FULLTEXT ではなく、Senna を使うように MySQL のソースコードが改変されています。また Senna を管理するための SQL コマンドや変数などを追加されていますが、本来の MySQL を扱うような感覚で利用することができます。インストールに関しても Triton 独自の configure オプションに加えて本来の MySQL の configure オプションも使用します。