绘制识别区域

通过区域识别,自动使用在图像上绘制的区域中所识别的文本或数据填充索引字段值。每个区域内的文本将被复制到相关联的索引字段中。

可以设置要在编制索引期间执行以下类型的数据识别的区域:

  • 光学字符识别 (OCR)

  • 智能字符识别 (ICR)

  • 磁性墨水字符识别 (MICR)

  • 条形码识别

不应为 OCR/ICR/MICR 数据和条形码数据这两者设置一个识别区域;应始终为条形码数据使用一个单独的区域。此外,不支持每个区域多个条形码。为了确保对某区域成功进行条形码识别,必须完成“条形码设置”选项卡上的条形码配置。

如果不希望长期重复使用识别区域,请使用“套索”技术(也称为“橡皮圈”或“ad hoc”识别)。如果用于编制索引的信息的位置在各个文档间有明显的差异,则适合使用套索识别。在这种情况下,通常短期使用识别区域,然后将其丢弃;没有必要长期将其保存为模板。要使用此技术,请使用“套索模式”,此模式为索引设置选项卡上的默认设置。

可以将“记录”设置与“套索模式”结合使用,以确保至少为当前的会话保留识别区域(即使不将它们永久保存)。如果未选择“记录”,则从一个文档转到另一个文档时会丢弃这些区域。

使用“套索模式”,可以轻松设置“区域识别”,以便在大多数情况下高效地工作。如果您希望永久保留识别区域,请参阅设置识别区域模板

备注 要最大限度地缩短识别区域的处理时间,请使用“区域识别设置”窗口上的“快速模式”设置。
  1. 扫描示例文档。
  2. 如果要设置一个用于条形码识别的区域,请使用“条形码设置”选项卡配置适用的条形码。否则请继续执行下一步。
  3. “主页”选项卡上,单击“编制索引”切换到编制索引模式。
  4. 要将自定义区域识别设置应用于要绘制的区域,请执行以下操作:在“主页”选项卡的“区域识别”组中,单击“设置”并设置您的区域首选项(请参阅区域识别设置)。

    否则,会应用区域识别的默认设置,您可以继续执行下一步。

  5. “编制索引”面板上,单击要用识别区域中的数据填写的第一个索引字段。

    索引字段被选中。

  6. 执行以下某项操作:
    • “主页”选项卡的“区域识别”组中,单击“绘制区域”

    • 在页面微型工具栏或状态栏上,单击“绘制区域”

  7. 在查看器中的文档上,执行以下某项操作:
    • 绘制一个矩形用来围住包含文本的区域(这些文本将填入选定的索引字段)。为了确保准确度,请在文本的周围留一些空白以允许页面移动。

    • 单击要为选定的索引字段捕获的第一个文本字符的左上角。该区域会自动向右扩展 2 英寸,并从单击的位置向下扩展 1 英寸。在这种情况下,填写索引字段的文本将以在区域中检测到的第一个空格结束。

    新区域将在文档中突出显示为绿色(当关闭“记录”时,该区域显示为黄色)。您不能调整该区域的大小,但是可以根据需要将其删除并重新绘制。

    在区域中检测到的值将会填入选定的索引字段。在进入下一个字段之前,可以编辑该值。

  8. “编制索引”面板上,进入与查看器中文档相关联的下一个索引字段,并执行以下某项操作:
    • 创建另一个区域。

    • 手动输入值。

  9. 针对所有应用到查看器中文档的索引字段重复该过程。

    文档的所有区域都会显示在查看器中,且当前选择的索引字段会带有红色边框。

  10. 转至下一个文档。
    • 如果布局与上一个文档相同,则会将现有区域应用到新文档。Kofax Express 会自动调整区域大小以反映一个页面与下一个页面之间自然产生的拉伸及移动。此过程称为“自动套准”。

    • 如果布局与上一个文档不同,则不会将之前记录的区域应用到新文档。如果手动为新文档输入索引值,则仅当您稍后进入另一个属性与原始文档相匹配的文档时,才会重新使用现有区域。如果为新文档绘制其他区域,则会将它们应用到后续类似的文档,并且丢弃之前绘制的区域。

  11. 对所有要在批次中编制索引的文档重复该过程。
  12. 要将区域保存为模板以便在当前会话后可以重复使用,请参阅设置识别区域模板
  13. 执行以下操作之一:
    • 单击“绘制区域”退出绘制模式。还可以通过单击“局部显示”“缩放矩形”退出绘制模式。

    • 单击“编制索引”退出编制索引模式。