サンプル ドキュメント

ソリューション内の各ドキュメント タイプについてサンプル ドキュメントを追加できます。サンプル ドキュメントには 2 つの種類があり、[ドキュメント] メニューでソリューションを構成およびテストしたり、[フィールド] メニューで抽出を構成およびテストしたりするために使用できます。

  • トレーニング ドキュメント: 分類や抽出、および分割 (有効な場合) のトレーニングに使用します。

  • テスト ドキュメント: 分類と抽出のテストに使用します。

2 つのパネル間の仕切りを使用して、必要に応じてサイズを変更します。

トレーニング ドキュメントは 2 ~ 5 個用意することをお勧めします。必要に応じて、トレーニング ドキュメントとテスト ドキュメントの間でドキュメントを移動できます。

ソリューションをトレーニングした後でトレーニング ドキュメントまたはドキュメント タイプを変更する場合は、ソリューションを再トレーニングする必要があります。テスト ドキュメントは、ソリューションをトレーニングする必要なしに追加できます。

すべてのサンプル ドキュメントは次の特性を持つ必要があります。

特性

トレーニング ドキュメント

テスト ドキュメント

サポート対象のファイル タイプ

TIFF、JPEG、PNG、PDF

TIFF、JPEG、PNG、PDF

ファイルの品質

読み取りやすく、高解像度で、スキャン アーティファクトがない理想的なサンプル。

必要なすべてのフィールドに値が設定されている必要があります。

読み取りやすい、高解像度のファイルを含めます。

実際に起こり得るスキャン アーティファクトや空のフィールドは、テストに役立つことがあります。

一意なサンプル

1 つのドキュメント タイプには、同じタイプのサンプルのみを含めます。サンプルは同じレイアウトである必要はなく、タイプだけが同じである必要があります。

たとえば、銀行の取引明細書は銀行によって大きく異なりますが、含まれるサンプルがすべて銀行の取引明細書である必要があります。

分類と抽出の両方をテストするために、任意のタイプのサンプルを含めます。

ドキュメントの長さ

4 ページを超える長いドキュメントは避けます。

テストには任意の長さのドキュメントを含めます。

フルカラー イメージは避けます。白黒二値イメージをお勧めします。

テストには、白黒二値ドキュメントとカラー ドキュメントの両方を含めます。

[トレーニング ドキュメントのアップロード] では、各サンプル ドキュメントのアップロード ステータスが次のいずれかで示されます。

  • : ドキュメントは正常にアップロードされ、認識されています。

  • : ドキュメントのアップロード中に例外が発生しました。これは、認識の失敗、Tungsten TotalAgility の問題、またはユーザー セッションのタイムアウトが原因で発生する可能性があります。