トレーニング・セットをフェーズ 2 用に変更する

フェーズ 2 では、残っている検出結果すべてに教師あり機械学習手法を適用して、検出結果が影響力ありかどうかを決定します。

IFA のフェーズ 2 で用いられている機械学習では、トレーニング・セットを使用して分類モデルを構築しています。このモデルを使用して、次の 4 とおりの分類の 1 つを予測します。
    • 影響力高
    • 影響力中
    • 影響力低
    • 重要でない

IFA フェーズ 2 では、各分類に 0 から 1 の予測値を割り当てます。これは、このトレーニング・セットに基づいて機械が行う分類が正確である確率を表します。システムは、各検出結果に対するそれぞれの分類に対する確率を参照し、最も確率の高いものを選択して応答を決めます。

トレーニング・セットは、新規評価を手動で分類することで「学習」します。IFA は、次のアルゴリズムを設定順に使用して、評価ファイルから分類を読み取ります。
  • 注意
    • 1=高
    • 2=中
    • 3=低
    • 4=重要でない
  • 重大度の変更
    • 高 = 高
    • 中 = 中
    • 低 = 低
    • 情報 = 重要でない
  • 重大度
    • 高 = 高
    • 中 = 中
    • 低 = 低
    • 情報 = 重要でない
  • 除外検出結果 = 重要でない

理想的には、最も分類がしやすくなるよう重大度を調整します。重要でないとみなされた検出結果は除外できます。これらは「重要でない」検出結果としてトレーニング・セットに適用されます。

トレーニングの評価はすべて次の場所に保存されます。

<data_dir>\ml\spark\train
<data_dir> は、AppScan® ソース プログラム・データの場所です (「インストールとユーザー・データ・ファイルの場所」を参照)。

工場出荷時の設定の変更や、新規評価の追加によって、IFA は予測モデルを構築します。更新したトレーニング・ファイルを利用するには、サーバーを再起動します。