エンティティ抽出用のテーブルの追加
Natural Language Processing engine によって返されるデータは膨大な量であるため、必要に応じてそのデータの特定の部分だけを抽出することができます。部分的な抽出を行うには、エンティティ情報がテーブル形式で返され、エンティティ名だけでなく、信頼度、タイプ、およびセンチメント情報も取得できるようにします。
抽出するテーブル エンティティを追加できます以下の手順に従って、設定します。
- Transformation Designer でプロジェクトを開きます。
- 名前付きエンティティ ロケータを追加し、そのプロパティを開きます。
-
[一般] タブの [抽出モード] から、[テーブル フィールド] を選択します。
[テーブル モデル] フィールドが赤でハイライトされ、必須であることが示されます。
-
[テーブル モデル] をクリックします。
[プロジェクト設定] ウィンドウに [テーブル] タブが表示されます。
-
次の 4つのフィールドを [列プール] に追加します。
次の名前は参考用です。列に他の名前を使用する場合は、この手順の後半でそれぞれの名前が正しくマッピングされていることを確認してください。
-
エンティティ名
-
エンティティ信頼度
-
エンティティ タイプ
-
センチメント
-
-
エンティティ
という [テーブル モデル] を作成し、[OK] をクリックします。列を選択するためのテーブル モデルが開きます。
-
前の手順で作成した 4つの列をテーブル モデルに追加し、[閉じる] をクリックします。
[プロジェクト設定] の [テーブル] タブに戻ると、新しいテーブル モデルがリストされます。
-
[OK] をクリックして [プロジェクト設定] ウィンドウを閉じます。
[名前付きエンティティ ロケータのプロパティ] ウィンドウが表示されます。
- [テーブル モデル] リストから、新しく作成したテーブル モデルを選択します。
- それぞれのフィールドに、対応するテーブル モデルの列をマッピングします。
-
すべての結果を返すようにする場合は、これで十分です。結果をさらに絞り込む場合は、次のように 1 つ以上のフィルタを追加します。
- 結果をエンティティ タイプでフィルタリングするには、必要に応じて [エンティティ タイプ列] のリストから値を選択します。または、カスタムのエンティティ ファイルを使用している場合は、[エンティティ タイプ列] フィールドにそのエンティティ タイプの名前を入力します。
- 結果を信頼度でフィルタリングするには、必要に応じて [信頼度値] を調整します。
- 結果をセンチメントでフィルタリングするには、必要に応じてセンチメント オプションのリストから値を選択します。
-
[名前付きエンティティ ロケータのプロパティ] ウィンドウを開いた状態でテスト ドキュメントを選択し、[抽出] を実行します。
抽出が実行され、結果がテスト ドキュメントの一部に含まれます。
- テスト ドキュメントへの変更を [保存] します。
-
[名前付きエンティティ ロケータのプロパティ] ウィンドウに戻り、[テスト] をクリックします。
[テスト] タブに結果が表示されます。
-
テスト結果に問題がなければ、Validation のフォーム上のフィールドにテーブル フィールドをマッピングするか、結果を処理するスクリプトを作成します。
スクリプトの詳細については、Kofax TotalAgility のスクリプトのヘルプを参照してください。