トライグラム形式定義

このタイプの形式定義は、式がトライグラムと呼ばれる 3 つの文字グループに分けられるエラートレラント アルゴリズムです。

このタイプの形式定義は、アラビア語または右から左に記載されたその他のテキストをサポートしていません。

たとえば、「brain」を検索する場合は、「bra」、「rai」、および「ain」のトライグラムが作成されます。検索の結果、brain、rain、train、again との一致が見つかります。これらの一致のうち、3 つのトライグラムをすべて持っているのは 1 つだけなので、結果として「brain」 が返され、信頼度は最大になります。

ドキュメント内の OCR エラー、短い語句、または音声検索に対応するには、このフォーマット定義を使用します。