ドキュメント タイプの抽出
フィールドを定義し、ドキュメント タイプからデータを抽出できます。
-
切り替えボタンを使用して、[フィールドを定義し、システムにドキュメント タイプからデータを抽出するように学習させます] に対して [はい] を選択します。
構成されたドキュメント タイプが表示されます。
-
フィールドを定義するドキュメントをクリックします。
選択したドキュメントが中央のペインに表示されます。
-
マウスを使用して、ドキュメントから抽出するフィールドをなげなわで指定します。
[フィールド プロパティを編集します ] ダイアログ ボックスが表示されます。
-
フィールド プロパティを構成します。
- フィールドの [名前] を入力します。
- [タイプ] リストで、[テキスト]、[日付]、または [番号] を選択します。
-
必要に応じて、フィールドに次の検証ルールを定義します。
-
[必須です]: フィールドを必須にするかどうかを選択します。
-
[最小文字長]: 最小文字長を入力します。
-
最大文字長: 最大文字長を入力します。
-
[許可される文字の定義]: フィールドに対して許可する文字を定義します。
-
[制限された文字の定義]: フィールドに対して制限する文字を定義します。
注-
構成されているフィールドは緑色で表示されます。フィールドにマウスを置くと、そのフィールドがトレーニングされていること、および競合の有無を示すメッセージがポップアップ表示されます。
-
フィールド タイプと検証ルールを構成すると、ルールに一致しないフィールドをシステムで検索できます。トレーニングされていないドキュメントで抽出可能なフィールドを確認することもできます。
-
ドキュメント タイプごとに、各フィールドのインスタンスを 3 つシステムに示す必要があります。ただし、各フィールドのインスタンスを 1 回または 2 回示した後で、各サンプル上のフィールドを検索できた場合は除きます。
-
- 使用しているドキュメント タイプの他のドキュメントに、同じプロセスを繰り返します。
- [保存] をクリックします。