アダプティブ機能分類子を構成する
このトピックの手順を使用して、プロジェクト内の最上位のコンテンツ分類子を設定します。
各プロジェクトには、最上位のコンテンツ分類子が 1 つだけあります。このコンテンツ分類子はアダプティブ機能分類子 (AFC) であり、有効にすると、特定の要件を満たすようにこの最上位 AFC を構成できます。
ほとんどの場合、AFC のデフォルト設定で十分です。最良の結果を得るには、この分類子を構成する前に分類設定をテストしてから、必要な変更を加えて、以前の結果と比較します。
サブツリー分類子もアダプティブ機能分類子ですが、この最上位の分類子に加えた変更は、サブツリー分類子には影響しません。
開始する前に
コンテンツ分類用にアダプティブ機能分類子を構成するには、最初に コンテンツ分類子の初期化 してください。
手順
-
[プロジェクト] タブの [構成] グループで、[プロジェクト設定]
を選択します。
- 分類設定を表示するには、[分類] タブを選択します。
-
[コンテンツ分類] グループで、[アダプティブ機能分類子] に [プロパティ]
を選択します。
[アダプティブ機能分類子のプロパティ] ウィンドウが表示されます。
-
次の設定を構成します。
[数字を使用]
この設定により、テキスト フィルタ中に分類子で数字を機能として使用するか、無視するかを制御します。(デフォルト: オフ)
[機能の最大数]
クラスごとに内部生成される機能の最大数を制限します。(デフォルト: 5000)
[最短の機能の長さ]
機能に使用する最小文字数を指定します。この値は [最短の単語の長さ] より小さくすることはできません。(デフォルト: 3)
[最長の機能の長さ]
機能に使用する最大文字数を指定します。64 文字以下にする必要があります。(デフォルト: 50)
[最小機能頻度の自動選択]
[最小機能頻度] の自動設定を有効にします。この設定を選択した場合、[最小機能頻度] の値を手動で設定することはできません。(デフォルト: オフ)
[最小機能頻度]
コンテンツ分類の機能として使用されるクラスのトレーニング セット内にサブストリングが表示される頻度を指定します。(デフォルト: 2)
[単語の最初で機能を開始]
機能サブストリングを単語の先頭から開始する必要がある場合に指定します。選択しない場合、サブストリングは任意の位置から開始されます。(デフォルト: 選択済み)
[機能当たりの最大単語数 (0-n)]
機能ごとの単語数を制限します。値 0 は単語数が無制限であることを意味しますが、機能ごとの単語の合計文字数は 「[最長の機能の長さ]」 プロパティの値を超えることはありません。(デフォルト: 2)
[あいまい文字列一致検索を使用]
あいまい一致を有効にします。ただし、分類パフォーマンスが低下します。(デフォルト: オフ)
[あいまい長さ (5-10)]
あいまい文字列比較を設定します。(デフォルト: 5)
[最小クラス エントロピーの自動選択]
[最小クラス エントロピー] の自動設定を有効にします。この設定を選択した場合、最小クラス エントロピー値を手動で設定することはできません。(デフォルト: オフ)
[最小クラス エントロピー (0.0 - 1.0)]
機能が表示されるクラス数に応じて、機能の重要度を制御します。値が 1.0 の場合、機能は単一クラスのサンプル ドキュメント内にのみに表示され、それ以外の場合は分類には使用されません。値が低いほど、より多くのクラスでトレーニング セットにこの機能が含まれます。(デフォルト: 0.600)
-
[OK] を選択します。
[アダプティブ機能分類子のプロパティ] ウィンドウが閉じます。
- オプション。[OK] を選択して [プロジェクト設定] ウィンドウを閉じます。