白黒変換

抽出または分類のトレーニングのためのトレーニング ドキュメントをプロジェクトに追加すると、高解像度、色、形式が原因となって、ソース ファイルのサイズが大きくなることがあります。その結果、トレーニング セットが大規模になることがあります。同様に、添付されたテスト セット内のファイルが大きくなって、ドキュメント テストが大規模になることがあります。

この事態を回避するには、テストおよびトレーニング ドキュメントを白黒に変換します。この変換を行うとと、ドキュメント セットのサイズを最小限に抑えることができます。

この方法は、テスト セットとトレーニング セットに制限されます。ベンチマーク ドキュメント セットを変換することはできません。

最良の結果を得るには、トレーニング ドキュメントをモノクロ形式に変換する前に、プロジェクトをトレーニングしてください。これにより、変換中に失われた品質がトレーニング結果に悪影響を及ぼすことはなくなります。

同様に、テスト セットを変換する前に、すべての構成とテストを確実に完了してください。これにより、抽出結果を構成およびテストする際に、最高品質のドキュメントを使用できるようになります。

トレーニング ドキュメントを変換すると、次のようになります。

  • 変換が完了した後に、元に戻すことはできません。

  • 変換中に品質が若干低下します。

  • PDF はモノクロの白黒 TIFF に変換されます。

  • ベンチマーク ドキュメント セット内のドキュメントは変換できません。

  • 保護されたプロジェクト内のドキュメントは変換できません

  • .txt のドキュメントまたは保護されたドキュメントは変換できません。これらのドキュメントを 1 つ以上選択した場合、これらのドキュメントはスキップされ、スキップされたファイルの数を示すメッセージが表示されます。

ページ数は多いが、テキスト レイヤーは 1 つだけの PDF や、より高度な圧縮方法で圧縮された小さな PDF は、白黒 TIFF に変換するとサイズが大きくなる場合があります。