エンタープライズサーチによる課題の解決 (8)


かなり前のことですが、@ITで記事にしていただいていた「エンタープライズサーチと6つの罠」に応える形で、解決方法を記載していきます。
  http://www.atmarkit.co.jp/im/cop/serial/search/01/01.html


解決方法その3. 柔軟なカスタマイズ機能を持ったコンテンツのリファインメント

企業で検索を利用するためには、柔軟なカスタマイズ機能を持つ製品の利用が不可欠です。対応しているファイルフォーマットが足りなかったり、コンテンツに関連したメタデータをRDBMSなど別の場所から取得したりといった場面に遭遇した場合に、カスタマイズ機能がなければその実現には多くの労力が必要となります。

FAST ESPでは、「パイプライン」とパイプラインの部品となる「ステージ」機能を提供し、検索システムによってステージを使い分け、時によってはステージを自作することでその柔軟性を確保しています。

上記のエンティティ抽出機能もこのパイプラインで利用する専用のステージで実現されています。検索システムで利用するパイプラインに人名や地名を抽出するステージを組み入れるわけです。

 

 

特殊なCADフォーマットなど、テキスト以外のコンテンツもこのパイプライン機能を利用することで検索に利用することができるようになります。例えば、特殊なフォーマットからテキストデータを取り出すためのモジュール (SDK やバイナリツール) が存在するなら、「モジュールを呼び出してテキストデータを取得する」ステージを含んだパイプラインを上図の「カスタムプラグイン」の箇所に入れます。ステージ作成というと大変なイメージがありますが、FAST ESPでは既に200種類以上のステージのテンプレートを用意しており、その中のあるステージにモジュールの場所を指定するだけで対応できます。

広告