カスタム センチメント

Natural Language Processing engine にはデフォルトで辞書が用意されていて、この中に、キーワードまたは語句、およびこれらがポジティブ、ニュートラル、ネガティブのいずれであるかを示す -1 〜 1 の範囲のセンチメント値が含まれています。単語または語句をドキュメントのセンチメント計算に含めるには、これらを辞書ファイルに追加する必要があります。インストールされている言語ごとに辞書ファイルがあります。

カスタム センチメント辞書をプロジェクトと一緒に、次の場所に保存する必要があります。

\Custom\SalienceData\<language>\salience\sentiment\general.hsd

<language> はユーザーが使用している言語を表す 2 文字のコードです。たとえば、Natural Language Processing engine でサポートされている言語と、フォルダに名前を付けるときに使用する必要がある 2 文字のコードを次に示します。

  • ドイツ語 - de

  • 英語 - en

  • スペイン語 - es

  • フランス語 - fr

  • イタリア語 - it

  • 日本語 - ja

  • 韓国語 - ko

  • オランダ語 - nl

  • ポルトガル語 - pt

  • ルーマニア語 - ro

  • 中国語 - zh

一般に使用される単語または語句が辞書に含まれておらず、生成されるセンチメント値が期待どおりでない場合は、辞書ファイル general.hsd のローカル コピーを作成し、必要に応じて編集することができます。

コピーされた general.hsd 内のすべてのエントリは、アルファベット順になります。エントリの形式は単語又はフレーズ<tab>-1と1の間の値 Word or Phrase<tab>Value between -1 and 1. です。

また、単語または語句が辞書に含まれていても、その値がローカル言語におけるその単語または語句の使用方法と一致しない場合は、必要に応じて値を変更できます。たとえば、「killing it」 という語句は、想定していた形容詞としてではなく、動詞として認識されるため、非常にネガティブなセンチメントとなります。同様な結果は 「da bomb」 という語句でも発生します。ドキュメント内にこれらの語句または類似の語句が頻繁に出現する場合は、これらを general.hsd ファイルに追加して、デフォルトのネガティブ センチメントを変更することを検討してください。