抽出フィールドへのフィールドのフォーマット設定と検証の適用
構成可能なドキュメント タイプと定義済みのドキュメント タイプの両方のフィールドにフォーマット設定と検証を手動で適用するには、このトピックの手順を使用します。構成可能なドキュメント タイプの場合は、フォーマット設定と検証を適用する前にフィールドが存在している必要があります。
抽出がトレーニング ドキュメントに対して実行される際、およびテスト ドキュメントに対してテストされる際には、フォーマット設定と検証の両方がフィールド データに適用されます。フィールド抽出値のリストには、フォーマット設定された値が返されます。フォーマット設定前の元の値は、抽出データの円またはドキュメント イメージ上のフィールドにポインタを移動すると表示される、フィールドの詳細で確認できます。
検証に失敗した場合は、フィールドの詳細に検証メッセージも表示されます。
一部の定義済みのドキュメント タイプには、すでにフォーマット設定と検証が適用されています。ほとんどの日付フィールドは、ドキュメント タイプのロケールに合わせてフォーマット設定されます。国際的なドキュメントの日付は YYYY-MM-DD 形式、アメリカのドキュメントの日付は MM-DD-YYYY 形式になります。他にどのフィールドがフォーマット設定されているかは、フィールドの詳細で確認できます。[フィールド] タブで元の値と抽出結果が異なる場合は、抽出結果にフォーマット設定が適用されます。
すでにフォーマット設定されている定義済みのドキュメント タイプの日付フィールドにフォーマット設定を適用すると、フォーマッタは元の抽出された値ではなく、すでにフォーマット設定されている値を入力として使用します。たとえば、「アメリカ - 銀行取引明細書」ドキュメントの StatementDate を MM/DD/YYYY 形式の日付として出力するようフォーマット設定するには、日付フォーマッタの 「[あいまいな日付形式]」 設定に MM-DD-YYYY 形式を含める必要があります。そうしないと、フォーマッタは入力形式を認識せず、エラーを返します。
開始する前に
抽出フィールドにフィールドのフォーマット設定と検証を適用する前に、次の手順が完了していることを確認します。
-
構成可能なドキュメント タイプに 1 つ以上のフィールドがすでに構成されている。
-
定義済みのドキュメント タイプのみがソリューションに含まれている場合、抽出が有効になっている。
-
必要に応じて、フィールド フォーマッタとフィールド バリデータが構成されている。フォーマッタとバリデータの追加の詳細については、『Tungsten TotalAgility Advanced Studio ヘルプ』を参照してください。
手順
-
([フィールド]) メニューでドキュメントを選択し、 ([設定されたフィールドのリスト]) を選択します。
選択したドキュメントの構成済みフィールドのウィンドウが表示されます。ウィンドウは次のように分割されます。
-
構成された [フィールド] のリストが左側に表示されされます。
-
選択したフィールドの [プロパティ] が右側に表示されされます。
-
- フィールドのリストからフィールドを選択します。
-
オプション。フィールドの [名前] を変更します。
これは、本番中にこのフィールドに表示される名前です。この名前を変更しても抽出には影響せず、本番中にユーザーに表示される内容にのみ影響します。
- オプション。追加の [キーワード] を追加します。複数のキーワードはセミコロン (;) で区切ります。
-
([全般]) タブを選択し、次のように設定します。
[バーコードです]
なげなわによってバーコードが選択されている場合にのみ利用可能です。推奨フィールドはバーコードをサポートしていません。(デフォルト: オフ)
選択すると、フィールドはバーコードであると見なされ、次の設定が有効になります。
[バーコード タイプ]
バーコードを抽出する際には、リストから特定のバーコード タイプを選択すると、最適な抽出結果が得られます。なげなわでバーコードを選択するときにバーコード タイプがわかっている場合は、自動的にタイプが選択されます。バーコード タイプが不明な場合は、[すべて選択] を使用します。
[タイプ]
作成しているフィールドのタイプを選択します。(デフォルト: テキスト)
この設定には、次の 3 つの値があります。
-
テキスト
-
日付
-
[数字]
選択したフィールド タイプによって追加の設定が決まります。
[フォーマッタ] フォーマッタを適用すると、フィールドをより洗練させることができます。(デフォルト: フォーマッタなし)
デフォルトでは、次のフォーマッタを使用できます。
-
[フォーマッタなし]: 選択した場合、フォーマットのためにドキュメントからテキスト、文字、または数字が取得されることはありません。
-
[デフォルトの金額フォーマッタ]: デフォルトの通貨形式と典型的な小数点の記号の形式が含まれます。
-
[デフォルトの日付フォーマッタ]: 日付の順序や日付の出力形式など、基本的な日付形式が含まれます。
フィールド [タイプ] が [日付] に設定されている場合、[デフォルトの日付フォーマッタ] が自動的に選択されます。
トレーニング ドキュメントとテスト ドキュメントの両方について、抽出を実行すると、フィールド データにフィールドのフォーマット設定が適用されます。抽出データの円またはイメージ上のフィールドにポインタを移動すると、元の値が表示されます。
[必須です] このフィールドの値が本番中に必須である場合は、この設定を選択します。(デフォルト: オフ)
-
-
以下の設定は、[タイプ] で選択した値によって異なります。以下の表の関連する値に対する手順に従います。
テキスト
必要に応じて、次のように設定します。
- [最小文字長]:
-
フィールドで許可される最小文字数。最小文字長を入力するには、オンにしてください。抽出結果が最小文字数より少なかった場合、フィールドが無効としてマークされます。(デフォルト: オフ)
- [最大文字長]:
-
フィールドで許可される最大文字数。最大文字長を入力するには、オンにしてください。抽出結果が最大文字数より多かった場合、フィールドが無効としてマークされます。(デフォルト: オフ)
- [許可される文字の定義]:
-
許可される文字のリストを入力するには、オンにしてください。このリストはリテラルなので、区切り文字は必要ありません。(デフォルト: オフ)
- [制限された文字の定義]:
-
制限される文字のリストを入力するには、オンにしてください。このリストはリテラルなので、区切り文字は必要ありません。(デフォルト: オフ)
[日付]
必要に応じて、次のように設定します。
- [参照日付]:
-
参照日を選択します。すべての日付がこの日付と比較され、特定の日付範囲に収まっていることが確認されます。(デフォルト: 今日)
- [参照日の前の期間]:
-
参照日より前の何日間にわたり日付が有効になるかを指定するには、この設定をオンにします。このオプションは、ドキュメント内で検索する日付を参照日の直前の N 日間に制限します。この特定の日付範囲に該当しない日付は、無効になります。(デフォルト: オフ)
- [参照日の後の期間]:
-
参照日より後の何日間にわたり日付が有効になるかを指定するには、この設定をオンにします。このオプションは、ドキュメント内で検索する日付を参照日後の N 日以内に制限します。この日付の範囲に該当しない日付は無効になります。(デフォルト: オフ)
[数字]
このタイプのフィールドには追加の手順は必要ありません。
-
([検証]) タブを選択し、次のように設定します。
[手動フィールド確認が必要]
選択すると、このフィールドは無効としてフラグが付けられ、手動での確認が必要になります。(デフォルト: オフ)
[常に有効]
選択すると、結果が抽出されない場合でも、このフィールドは常に有効になります。(デフォルト: オフ)
[バリデータ]
このフィールドに適用される検証ルールのリスト。抽出結果がこれらのルールを満たさない場合は無効となり、構成済みの検証メッセージが表示されます。
検証ルールの構成の詳細については、『Tungsten TotalAgility Advanced Studio ヘルプ』を参照してください。
テスト ドキュメントとトレーニング ドキュメントの両方について、抽出を実行すると、フィールド データにフィールドの検証が適用されます。抽出されたフィールドが検証要件を満たしていない場合は、イメージ上のフィールドまたはその抽出データの円にポインタを移動すると、検証メッセージが表示されます。
抽出データの円の色は、検証エラーがあるかどうかを示すものではありません。抽出データの円が緑色でも、検証に失敗した抽出結果である可能性があります。抽出またはテスト後に、ポインタを円の上に移動して、検証メッセージがあるかどうかを確認します。
-
[保存] を選択します。
トレーニング ドキュメントで抽出が実行され、構成されたすべてのフォーマット設定とバリデータが適用されます。
抽出データの円形のヒントまたはイメージ上の抽出値を使用して、抽出値の詳細を確認できます。フィールドにフォーマット設定が適用されている場合、この情報には元の抽出値と、該当する場合は検証メッセージが含まれます。
フォーマット設定を適用しても結果が期待どおりでない場合は、抽出された値を入力としてフィールド フォーマッタをテストします。テストは成功するはずです。失敗した場合は、フォーマッタの設定を確認し、必要に応じて更新します。
- オプション。現在のドキュメント タイプまたは別のドキュメント タイプ内の他の抽出フィールドにフォーマット設定と検証を適用します。
-
オプション。フィールドを削除するには、 ([設定されたフィールドのリスト]) を開き、フィールドを選択して、 ([削除]) を選択します。[保存] を選択してウィンドウを閉じます。
フィールドのリストからフィールドが削除されます。
- このドキュメント タイプおよび他のドキュメント タイプの別のフィールドに検証とフォーマット設定を適用するには、手順 2 ~ 10 を繰り返します。
- オプション。ソリューションを保存 () します。
次のステップ
-
オプション。抽出フィールドをさらに追加します。