服务器或客户机崩溃后收集诊断信息

自动诊断收集工具在服务器和客户机发生崩溃后收集诊断数据,并在服务器或客户机重新启动时将收集的数据发送给函件收集数据库。然后可使用收集的数据来确定崩溃原因。

数据存储在“故障报告”文档中。在每个域中都有一个函件收集数据库。可以将一个域中所有客户机和服务器崩溃所产生的所有“故障报告”文档存储到一个数据库中,也可以为服务器崩溃和客户机崩溃分别创建一个数据库。您将在设置该功能时指定函件收集数据库。从客户机崩溃收集到的数据可以发送至客户的本地“自动数据收集”数据库中,以使客户可以快速识别在其站点上遇到的重复问题,或者可以将数据发送到相同的数据库中作为服务器数据。

故障分析器是一个服务器附加任务,它处理传递到“自动数据收集”函件收集数据库的所有新的崩溃。对于每个新崩溃,故障分析器任务将搜索包含“故障报告”文档的数据库,并确定堆栈是否与用户或服务器在该客户站点上已经看到的崩溃相匹配。“自动数据收集”数据库将列出相同崩溃的任何重复出现情况的所有“故障报告”以及“响应”文档,并指明重复出现情况与原始崩溃是完全匹配还是部分匹配。重复出现情况的响应文档是指“完全匹配故障报告”和“部分匹配故障报告”文档。“部分匹配故障报告”文档还包括“百分比匹配”,用于指明该报告与崩溃的原始“故障报告”相匹配的百分比。

使用桌面策略设置文档的“诊断”选项卡为客户机设置自动诊断数据收集。

使用“服务器配置设置”文档的“诊断”选项卡上的字段,指定是否在服务器上启用“故障分析器”任务。如果启用了故障分析器,在服务器启动时,Domino® 将读取本地 Domino® 目录中的“服务器配置设置”文档和桌面策略文档。如果有任何文档指定了“故障报告”数据库,Domino® 将确定该数据库是否驻留在本地服务器上。如果是,Domino® 会将该数据库添加到待监控数据库的列表中。每隔 10 秒,该进程将确定其所监控的任何数据库的数据修改时间是否已经更改。如果是,故障分析器将扫描新的未处理的文档,以尝试进行匹配。

出现次数和唯一标识计数将在崩溃的父“故障报告”文档中更新。出现次数是指某个崩溃已经发生的总次数;而唯一标识计数是指已经报告该问题的客户机和服务器的数量。

“故障报告”文档的“管理员”部分中包含“已解决”字段,该字段可用于针对向数据库报告的所有客户机和服务器版本,或者针对按发行版级别(例如,Domino® 6.5.1)或按热修订编号(例如,652HF10)标识的特定版本,将某个崩溃标记为已解决。

将故障标记为已解决之后,崩溃时带有相同特征符并且处于待解决故障的某一版本级别的所有客户机和服务器都不会标记为重复。相反,“故障报告”文档将保留为父文档。在视图中,已解决的文档旁边显示有一个复选标记。

先前存储在 Domino® 数据目录中的以下文件现在存储于诊断目录 IBM_TECHNICAL_SUPPORT 中,该目录位于 Notes/Domino 数据目录之下:

  • NSD 输出
  • memcheck 输出
  • 核心文件
  • 内存转储文件(以格式 memory_platform_machine name_date@time.dmp 创建,而不是以格式 memory.dmp 创建)
  • notes_child_pid

要防止诊断文件变得过大而占用大量磁盘空间,可指定这些文件可以存储的天数,超过此天数后,自动诊断收集工具将删除这些文件。

为客户机设置自动诊断收集功能时,可以指定该功能对于用户是否不可见,或者是否应提示用户指定他们是否希望向函件收集数据库发送诊断报告。如果指定不提示用户,那么该功能对用户是透明的。用户重新启动客户机并输入其密码后,该进程将在后台运行。如果指定应提示用户指定是否报告崩溃,用户还可指定是否在发送报告前查看报告。