正規表現

正規表現は、テキスト形式の検証フォーム フィールド、ドキュメント フィールド、およびパスワード形式で使用されます。

TotalAgility には、定義済みの正規表現がいくつか用意されています。ただし、フォームおよびバリデータで使用するカスタムの正規表現を定義することもできます。

正規表現は、テキスト データのパターンを認識するために使用されます。テキスト データを評価し、式をドキュメント内のテキストと照合します。Kofax TotalAgility では、形式ロケータ、検証メソッド、およびフォーマッタで正規表現を使用して、ドキュメントの項目を識別および正規化します。

正規表現は抽象的な方法でデータを記述します。いくつかの一般的な例を次の表に示します。

形式

説明

一致

一致しない

C

1 文字

a

a

b,A

. (ピリオド)

任意の文字

b.g

bug, bag, big, bbg

bg, baag

\d

任意の 1 桁の数字

a\d

a5, a8, a0

aA, ab, a

c1c2c3

セット中の 1 文字

[abc]

a,b,c

1, 2, d, D, A, ab, bc

[c1-cn]

範囲内の 1 文字

[a-z]

b,g,x

1, 2, D, A

? (疑問符)

前の用語は任意です

x\d?

x, x7, x1

xx, xq

+ (プラス記号)

前の用語は 1 回以上繰り返すことができます

\d+

4, 2323, 100

A112, 2b, X

* (アスタリスク)

前の用語は 0 回以上繰り返すことができます

x\d*

x6, x, x100

100x, xx

{n}

前の用語は正確に n 回繰り返すことができます

y{3}

yyy

yy, yyyy

{m, n}

前の用語は m 回から n 回繰り返すことができます

\d{5,9}

12345, 999999999

1234, 999999999999

\

特殊文字をエスケープする

\$ \\ \- \? \.

$ \ - ?

!%

()

文字のグループ化

a(\$\$)?b

a$$b, ab

a$b, a$$

(e1|e2)

どちら一方

(abc|ABC)

abc, ABC

aBC, AbC

\n

後方参照 (丸括弧で一致した n 番目の項目は再度一致する必要があります)

(\d)x\1

1x1,2x2,3x3,4x4...

1x2,6x7...

インターネット上には、正規表現に関するサードパーティのリソースが多数あります。ただし、多くの場合、Kofax TotalAgility は一般的に使用される定義済みのテンプレートのセットを提供するため、正規表現に関する広範な知識は必要ありません。

ドキュメントのいずれかに、特定して抽出したい特殊な ASCII 文字が含まれている場合は、ASCII 文字の正規表現コードを使用してこれを行うことができます。次の表に、変換要件を示します。

ASCII 16 進数

特殊文字

正規表現コード

21

!

\x21

22

"

\x22

23

#

\x23

24

$

\x24

25

%

\x25

26

&

\x26

27

'

\x27

28

(

\x28

29

)

\x29

2A

*

\x2A

2B

+

\x2B

5E

^

\x5E

A7

§

\xxA7

たとえば、\x2A の 1 つのエントリを使用して、1 つの文字に一致させることができます。この場合、アスタリスク (*) です。さらに、これらの文字を範囲として使用できます。たとえば、[\x21-\x29] は次の文字のいずれかを見つけることができます。 !"#$%&'().

方法: 正規表現の管理