SP1からのカスタム プロパティ抽出機能の利用方法


以前、FAST Search Server 2010 for SharePoint (FS4SP)のService Pack 1適用後にカスタム プロパティ抽出機能をアップグレードする方法をお伝えしましたが、ここでは新規にFS4SPを利用する場合の手順に関して記載します。

[FS4SP] SP1 からの新しいカスタム プロパティ抽出機能への移行

  1. カスタム プロパティとして抽出する文字情報を記載したカスタム プロパティ抽出辞書を作成します。
    UTF-8エンコーディングで次のようなファイルproducts.xmlを作成します。なお、抽出対象文字列は標準では大文字・小文字が区別されます。

    <?xml version=”1.0″ ?>
    <dictionary>
    <entry key=”抽出対象文字列” value=”抽出する文字列” />
    </dictionary>

  2. カスタム プロパティ抽出機能の設定ファイルを作成します。
    %FASTSEARCH%\etc\config_data\DocumentProcessor\CustomPropertyExtractors.xml ファイルを以下の内容で新規または追加で作成します。

    <?xml version=”1.0″ encoding=”UTF-8″?>
    <extractors>
      <extractor name=”任意の名称 (例:Products)” type=”Substring” property=”抽出したカスタム プロパティを投入するクロールされたプロパティ名 (例:products)“>
        <dictionary name=”辞書ファイル名 (例:products)” yield-values=”yes” />
      </extractor>
    </extractors>

  3. カスタム プロパティ抽出辞書を配置します。
    FS4SP管理サーバー上で、コマンド プロンプトから以下のコマンドを実行します。

    cd <辞書ファイルを置いたディレクトリ>
    lowercase products.xml products_normalized.xml

    FS4SP管理サーバー上で、FS4SP shellから以下のコマンドを実行します。

    Add-FASTSearchResource -FilePath “<辞書ファイルを置いたディレクトリ>\products_normalized.xml” -Path dictionaries\matching\products.xml

  4. クロールされたプロパティと管理プロパティを作成します。
    SharePointサーバーで、SharePointシェルから以下のコマンドを実行します。

    $c = New-FASTSearchMetadataCrawledProperty -Name productscp -varianttype 31 -Propset 48385c54-cdfc-4e84-8117-c95b3cf8911c
    $m = New-FASTSearchMetadataManagedProperty -name products -type 1
    $m.RefinementEnabled = 1 (絞込みに利用する場合)
    $m.MergeCrawledProperties = 1 (複数のカスタム プロパティを格納できるようにする場合)
    $m.Update()
    New-FASTSearchMetadataCrawledPropertyMapping -CrawledProperty $c -ManagedProperty $m

  5. クロールします。
  6. 取得したカスタム プロパティを格納した管理プロパティを表示するようにUIを変更します (オプション)。

(参考) Creating a Custom Property Extractor
http://msdn.microsoft.com/en-us/library/ff795797.aspx

広告