大規模なトレーニング セットの処理

プロジェクトを保存またはリリースするたびに、分類/抽出グループ全体または共有プロジェクトを含むプロジェクトの完全なコピーが TotalAgility のデータベースに保存されます。プロジェクトに大きなトレーニング セットが含まれている場合は、プロジェクトのサイズが非常に大きくなることがあります。トレーニング セットのサイズを最小限に抑えるには、次のオプションを検討する必要があります。

  1. 白黒二値イメージを使用します。フル カラー イメージは、白黒二値イメージと比べてサイズが 10 ~ 100 倍になります。Transformation Designer でプロジェクトをトレーニングする場合は、最初に使用するイメージとして白黒二値イメージを選択します。実行時にドキュメントを処理する場合は、TotalAgility Designer でイメージ処理アクティビティとレンディション機能を使用します。これにより、ドキュメントを白黒二値イメージに変換して処理を高速化できます (また、オンライン ラーニング用のトレーニング セットを小さくすることができます)。ただし、元のカラー イメージを記録システムにエクスポートすることは引き続きできます (レンディションに保持されます)。

  2. 不要なドキュメントを削除します。Transformation Designer でプロジェクトをトレーニングすると、ドキュメントに「必要」または「不要」のフラグが設定されます。不要なドキュメントは、削除しても、抽出精度に影響はありません。

  3. 白黒二値イメージを使用して、不要なドキュメントを削除したにもかかわらず、トレーニング セットが非常に大きくなった場合は、イメージをプロジェクトとは別に、TotalAgility データベースの外部に保存できます。これらのセットは「外部トレーニング セット」といいます。デフォルトでは、Transformation Designer のトレーニング セットはプロジェクトの一部であり、Transformation Designer でプロジェクトが開かれている間、プロジェクトの残りの部分と同じ一時フォルダに保存されます。Transformation Designer が閉じている場合は、一時フォルダ内のすべてのコンテンツが TotalAgility データベースに保存されます。トレーニング セットを「外部化」するには、次の操作を実行します。

    1. トレーニング セットを保存するディスクまたはネットワーク共有上のフォルダを選択します。

    2. Transformation Designer でフォルダを [テスト セット] として開きます。

      ドキュメント セットを開く

    3. [テスト セット] を右クリックして、[抽出トレーニング セットとして使用] (または [分類トレーニング セットとして使用]) を選択します。

      ドキュメント セットのテスト

      これで、抽出トレーニング セットはプロジェクトの一時フォルダではなく、選択したフォルダを指すようになります。

      ドキュメント フォルダ

      プロジェクトを保存して Transformation Designer を閉じるときに、このフォルダは TotalAgility に保存されません。

      • 必ずバックアップを実行してください。

      • ローカル コンピュータまたは共有ネットワーク フォルダ上の外部トレーニング セットにアクセスできる場合は、常に Transformation Designer でプロジェクトを開いてください。