プリセットと自動ゾーン認識

デフォルトでは、[ゾーン ウィザード] はドキュメントを分析し、テキスト フィールドのエリアまたはボックスと OMR ゾーンのボックスを一致させるゾーンを作成します。つまり、ゾーンの境界はボックスの周囲とまったく同じになります。ゾーンに存在する黒いピクセルの総数によって、その OMR ゾーンがマークされているか、されていないかが決まるため、OMR ゾーンでは、周囲のボックス全体をゾーン内に含める必要があります。認識が 1 または 2 ピクセルずれたためにボックスの一部が欠落している場合は、抽出結果が不良になる可能性があります。この場合に対応できるようにするには、ゾーンにマージンを追加して、元の検出されたゾーンの周囲にいくつかのパディングを追加します。

テキスト ゾーンと OMR ゾーンの両方に、[垂直マージン][水平マージン] の設定があります。これらのマージン設定を使用すると、検出されたゾーンのゾーン サイズを拡張できます。OMR ゾーン マージンのサイズは、テキスト ゾーン マージンと異なる場合があります。

ゾーン検出後に OMR またはテキスト ゾーンのマージンを大きくすると、そのタイプのすべてのゾーンがリアルタイムで増加します。別のページに移動したときに、移動先のページでゾーンが既に検出されている場合は、マージン設定が保持されて、直ちに表示されます。それ以外の場合は、他のページでゾーンが検出されたときにマージンが表示されます。

たとえば、テキスト ゾーンに 2 mm の水平マージンと 3 mm の垂直マージンを指定した場合、検出された各テキスト ゾーンは、最初に検出されたゾーンよりも 4 mm 広く、6 mm 高くなります。この余分なパディングがあるために、ドキュメントがマージン エリア内でシフトし、登録がそのシフトに対応できない場合でも、抽出が成功する可能性があります。

ゾーンのマージンを大きくする場合は、微妙なバランスが必要になります。マージンを大きくしすぎると、ゾーンに不要なコンテンツが含まれる可能性があります。マージンを十分に大きくしないと、コンテンツが切り捨てられる可能性があります。いずれの場合も、認識率は低下します。OMR ゾーンで最良の結果を得るには、ゾーン内にボックス全体と数ピクセル分の空白が含まれていることを確認してください。

ゾーンはページ内に収まる必要があるため、ページ境界の外側にあるマージンはページの端で切り捨てられます。

[ゾーンを承認] を押すまで、マージンはゾーンに適用されません。[ゾーン ウィザード] を閉じた後、各ゾーンのプロパティを個別に編集し、必要に応じて各ゾーンを構成できます。