サブツリー分類子のプロパティ ウィンドウ

このウィンドウでサブツリー分類子のプロパティを構成できます。

この設定に加えた変更を有効にするには、プロジェクトを再トレーニングする必要があります。

[テキスト フィルタ]

このグループには次の設定があります。

[数字を使用]

この設定により、テキスト フィルタ中に分類子で数字を機能として使用するか、無視するかを制御します。(デフォルト:オフ)

[最短の単語の長さ]

この値より短いすべての単語は、テキスト フィルタ中に無視されます。単語の長さとは関係なく、頻度が非常に低い機能または頻度が非常に高い機能も考慮されません。(デフォルト:3)

[トレーニング]

このグループには次の設定があります。

[機能の最大数]

クラスごとに内部生成される機能の最大数を制限します。(デフォルト:5000)

[最短の機能の長さ]

機能に使用する最小文字数を指定します。この値は [最短の単語の長さ] より小さくすることはできません。(デフォルト:3)

[最長の機能の長さ]

機能に使用する最大文字数を指定します。64 文字以下にする必要があります。(デフォルト:50)

[最小機能頻度の自動選択]

[最小機能頻度] の自動設定を有効にします。この設定を選択した場合、[最小機能頻度] の値を手動で設定することはできません。(デフォルト:オフ)

[最小機能頻度]

コンテンツ分類の機能として使用されるクラスのトレーニング セット内にサブストリングが表示される頻度を指定します。(デフォルト:2)

[単語の最初で機能を開始]

機能サブストリングを単語の先頭から開始する必要がある場合に指定します。選択しない場合は、サブストリングは任意の位置から開始されます。(デフォルト:選択済み)

[機能当たりの最大単語数 (0-n)]

機能ごとの単語数を制限します。値 0 は単語数が無制限であることを意味しますが、機能ごとの単語の合計文字数は 「[最長の機能の長さ]」 プロパティの値を超えることはありません。(デフォルト:2)

[あいまい文字列一致検索を使用]

あいまい一致を有効にします。ただし、分類パフォーマンスが低下します。(デフォルト:オフ)

[あいまい長さ (5-10)]

あいまい文字列比較を設定します。(デフォルト:5)

[最小クラス エントロピーの自動選択]

[最小クラス エントロピー] の自動設定を有効にします。この設定を選択した場合、最小クラス エントロピー値を手動で設定することはできません。(デフォルト:オフ)

[最小クラス エントロピー (0.0 - 1.0)]

機能が表示されるクラス数に応じて、機能の重要度を制御します。値が 1.0 の場合、機能は単一クラスのサンプル ドキュメント内にのみに表示され、それ以外の場合は分類には使用されません。値が低いほど、より多くのクラスでトレーニング セットにこの機能が含まれます。(デフォルト:0.600)

ウィンドウの下部にあるボタンの説明は、「共通 Transformation Designer ボタン」を参照してください。