白黒変換
抽出または分類のトレーニングのためのトレーニング ドキュメントをプロジェクトに追加すると、高解像度、色、形式が原因となって、ソース ファイルのサイズが大きくなることがあります。その結果、トレーニング セットが大規模になることがあります。同様に、添付されたテスト セット内のファイルが大きくなって、ドキュメント テストが大規模になることがあります。
この事態を回避するには、テストおよびトレーニング ドキュメントを白黒に変換します。この変換を行うとと、ドキュメント セットのサイズを最小限に抑えることができます。
この方法は、テスト セットとトレーニング セットに制限されます。ベンチマーク ドキュメント セットを変換することはできません。
最良の結果を得るには、トレーニング ドキュメントをモノクロ形式に変換する前に、プロジェクトをトレーニングしてください。これにより、変換中に失われた品質がトレーニング結果に悪影響を及ぼすことはなくなります。
同様に、テスト セットを変換する前に、すべての構成とテストを確実に完了してください。これにより、抽出結果を構成およびテストする際に、最高品質のドキュメントを使用できるようになります。
トレーニング ドキュメントを変換すると、次のようになります。
-
変換が完了した後に、元に戻すことはできません。
-
変換中に品質が若干低下します。
-
PDF はモノクロの白黒 TIFF に変換されます。
-
ベンチマーク ドキュメント セット内のドキュメントは変換できません。
-
保護されたプロジェクト内のドキュメントは変換できません
-
.txt のドキュメントまたは保護されたドキュメントは変換できません。これらのドキュメントを 1 つ以上選択した場合、これらのドキュメントはスキップされ、スキップされたファイルの数を示すメッセージが表示されます。
ページ数は多いが、テキスト レイヤーは 1 つだけの PDF や、より高度な圧縮方法で圧縮された小さな PDF は、白黒 TIFF に変換するとサイズが大きくなる場合があります。