正規表現
正規表現は、テキスト形式の検証フォーム フィールド、ドキュメント フィールド、およびパスワード形式で使用されます。
TotalAgility には、定義済みの正規表現がいくつか用意されています。ただし、フォームおよびバリデータで使用するカスタムの正規表現を定義することもできます。
正規表現は、テキスト データのパターンを認識するために使用されます。テキスト データを評価し、式をドキュメント内のテキストと照合します。Kofax TotalAgility では、形式ロケータ、検証メソッド、およびフォーマッタで正規表現を使用して、ドキュメントの項目を識別および正規化します。
正規表現は抽象的な方法でデータを記述します。いくつかの一般的な例を次の表に示します。
形式 |
説明 |
例 |
一致 |
一致しない |
---|---|---|---|---|
C |
1 文字 |
a |
a |
b,A |
. (ピリオド) |
任意の文字 |
b.g |
bug, bag, big, bbg |
bg, baag |
\d |
任意の 1 桁の数字 |
a\d |
a5, a8, a0 |
aA, ab, a |
c1c2c3 |
セット中の 1 文字 |
[abc] |
a,b,c |
1, 2, d, D, A, ab, bc |
[c1-cn] |
範囲内の 1 文字 |
[a-z] |
b,g,x |
1, 2, D, A |
? (疑問符) |
前の用語は任意です |
x\d? |
x, x7, x1 |
xx, xq |
+ (プラス記号) |
前の用語は 1 回以上繰り返すことができます |
\d+ |
4, 2323, 100 |
A112, 2b, X |
* (アスタリスク) |
前の用語は 0 回以上繰り返すことができます |
x\d* |
x6, x, x100 |
100x, xx |
{n} |
前の用語は正確に n 回繰り返すことができます |
y{3} |
yyy |
yy, yyyy |
{m, n} |
前の用語は m 回から n 回繰り返すことができます |
\d{5,9} |
12345, 999999999 |
1234, 999999999999 |
\ |
特殊文字をエスケープする |
\$ \\ \- \? \. |
$ \ - ? |
!% |
() |
文字のグループ化 |
a(\$\$)?b |
a$$b, ab |
a$b, a$$ |
(e1|e2) |
どちら一方 |
(abc|ABC) |
abc, ABC |
aBC, AbC |
\n |
後方参照 (丸括弧で一致した n 番目の項目は再度一致する必要があります) |
(\d)x\1 |
1x1,2x2,3x3,4x4... |
1x2,6x7... |
インターネット上には、正規表現に関するサードパーティのリソースが多数あります。ただし、多くの場合、Kofax TotalAgility は一般的に使用される定義済みのテンプレートのセットを提供するため、正規表現に関する広範な知識は必要ありません。
ドキュメントのいずれかに、特定して抽出したい特殊な ASCII 文字が含まれている場合は、ASCII 文字の正規表現コードを使用してこれを行うことができます。次の表に、変換要件を示します。
ASCII 16 進数 |
特殊文字 |
正規表現コード |
---|---|---|
21 |
! |
\x21 |
22 |
" |
\x22 |
23 |
# |
\x23 |
24 |
$ |
\x24 |
25 |
% |
\x25 |
26 |
& |
\x26 |
27 |
' |
\x27 |
28 |
( |
\x28 |
29 |
) |
\x29 |
2A |
* |
\x2A |
2B |
+ |
\x2B |
5E |
^ |
\x5E |
A7 |
§ |
\xxA7 |
たとえば、\x2A の 1 つのエントリを使用して、1 つの文字に一致させることができます。この場合、アスタリスク (*) です。さらに、これらの文字を範囲として使用できます。たとえば、[\x21-\x29] は次の文字のいずれかを見つけることができます。 !"#$%&'().
方法: 正規表現の管理