SharePoint 2013 カスタム エンティティ抽出機能の利用方法


FAST Search Server 2010 for SharePoint (FS4SP) ではカスタム プロパティ抽出機能と呼んでいましたが、検索対象のアイテムをインデックス化する際に、本文などのプロパティ中に特徴的な用語 (例: 製品名、コード ネーム、支社名や部門名など多岐に渡ります) を抜き出し、検索インデックス内の管理プロパティに投入することで、絞り込みなどに利用するための機能をカスタム エンティティ抽出と呼びます。本投稿では、このカスタム エンティティ抽出機能の利用方法に関して記載します。

1. カスタム エンティティ抽出用の辞書を作成する

カスタム エンティティとして抽出する文字情報を記載したカスタム エンティティ抽出辞書を作成します。
UTF-8 エンコーディングで次のようなファイル products.csv を作成します。最初の列が検索対象アイテムに含まれていた文字列、二番目の列がカスタム エンティティとして抽出する文字列です。

Key,Display form
Access,アクセス
Excel,エクセル
Word,ワード
Office,オフィス
Exchange,Exchange
SharePoint,SharePoint
Windows Server,Windows
Windows 8,Windows
Windows 7,Windows
Windows XP,Windows
Windows Me,Windows
Windows 95,Windows
Windows NT,Windows

SharePoint リストからカスタム エンティティ抽出辞書を作成するためのサンプル コードもあります。こちらにアクセスし、スクリプトをダウンロードし、key と value 用の列を持つSharePoint リストとして作成し、いくつかアイテムを追加した上で次のコマンドを実行すれば CSV ファイルが作成可能です。

image

.\createCEEDictionaryFromSPList.ps1 “SharePointサイト名” “SharePointリスト名” “key用の列名” “value用の列名” <$trueまたは$false> <出力ファイル名>

2. カスタム エンティティ抽出用の辞書をデプロイする

SharePoint シェルから以下のコマンドを実行します。引数 DictionaryName には、日本語の辞書の場合には通常 Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.n (n は 1~5 のいずれか利用していない数字) を指定します。

$searchApp = Get-SPEnterpriseSearchServiceApplication Import-SPEnterpriseSearchCustomExtractionDictionary -SearchApplication $searchApp -FileName <UNC パス (例: \\SERVER\C$\work\dic.csv)> -DictionaryName <辞書名 (例: Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.1)>

3. カスタム エンティティ抽出対象の管理プロパティを指定する

  1. サーバーの全体管理の [アプリケーション構成の管理] – [サービス アプリケーションの管理] から [Search Service Application] の検索管理画面にアクセスします
  2. [クエリと結果] – [検索スキーマ] にアクセスします
  3. カスタム エンティティ抽出の対象にしたい管理プロパティを検索して見つけます
    image
  4. 画面下部の [カスタム エンティティ抽出] で、今回の場合 (上記「2. カスタム エンティティ抽出用の辞書をデプロイする」の Import-SPEnterpriseSearchCustomExtractionDictionary コマンドレットの DictionaryName 引数で「Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.1」を指定した場合) は [単語の部分抽出 – Custom1] を選択します
    image

4. 再クロールする

今回指定したカスタム エンティティ抽出を実施したいアイテムが含まれたコンテンツ ソースのフル クロールを実施してください。

5. 取得したカスタム エンティティを格納した管理プロパティを表示するようにUIを変更します (オプション)

  1. 例えば、絞り込みに表示したい場合には、絞り込み Web パーツの [絞り込み条件を選択] ボタンをクリックし、[使用できる絞り込み条件] から適切なもの (今回の場合は、「WordPartCustomRefiner1」) を選択します。ちなみに、表示テンプレートに [絞り込みアイテム (件数表示)] が選択されていますが、これは以前のエントリで作成したものです
    image 
  2. 検索結果画面を確認し、うまく表示されていれば完成です
    image

参照先

広告