修改第 2 阶段的培训集

第 2 阶段对所有剩余结果使用受监督的机器学习技术,来确定结果是否可操作

IFA 的第 2 阶段中采用的机器学习使用培训集来构建分类模型。然后,该模型用于对四个分类之一执行预测,如下所示:
    • 高可操作性
    • 中等可操作性
    • 低可操作性
    • 不考虑在内

IFA 的第 2 阶段为每个分类分配一个介于 0 和 1 之间的预测值,该预测值表示机器基于此培训集在分类中处于正确状态的概率。然后,系统在生成的概率中查看每个结果的每个分类,并通过选择最高结果概率来选择响应。

培训集通过手动分类新评估来进行“学习”。IFA 按照偏好顺序使用以下算法从评估文件中读取分类:
  • 注释
    • 1=高
    • 2=中等
    • 3=低
    • 4=不适用
  • 已修改严重性
    • 高=高
    • 中=中等
    • 低=低
    • 参考=不考虑在内
  • 严重性
    • 高=高
    • 中=中等
    • 低=低
    • 参考=不考虑在内
  • 排除的结果=不考虑在内

理想情况下,严重性应进行调整以匹配分类所需的方法,因为这是最简单的路径。任何被视为“不考虑在内”的结果都可以排除,它们将作为“不考虑在内”的结果应用到培训集。

所有培训评估都存储在:

<data_dir>\ml\spark\train
其中 <data_dir>AppScan® 程序数据的位置, 如安装和用户数据文件位置中所述。

如果对工厂设置进行任何修改或新增评估,会触发 IFA 重建用于执行预测的模型。重新启动服务器以利用更新后的培训文件。