[故障诊断]故障诊断 Lotus Domino 的挂起和崩溃3

IBM认证复习指导 2021-07-05 网络整理 可可

【shitiku.jxxyjl.com--IBM认证复习指导】

        notes.ini 设置  为了故障诊断性能和崩溃问题,您可以启用下列 notes.ini 调试参数:

  debug_threadid=1 记录每个服务器操作的每个进程和线程 id。
  debug_show_timeout=1 打开到控制台的信号量超时消息,并创建一个名为的 semdebug.txt 信号量文本文件。
  debug_capture_timeout=10 给每个信号量超时消息加时间戳。
  console_log_enabled=1 (domino 6 和更高版本)启用 domino 控制台日志记录。

  服务器崩溃的故障恢复

  您可以将故障恢复设置为自动处理 domino 服务器崩溃。当服务器崩溃时,它就自动关闭并重启,无需任何管理员干预。domino 将崩溃信息记录在 data 目录中。当服务器重启时,domino 检查它是否是崩溃后重启。如果是的,就会自动给 “mail fault notification to” 域中的人员或组发送一封电子邮件。

  重大的错误(比如操作系统异常或内部 panic)终止每个 domino 进程,并释放所有相关的资源。启动脚本检测该场景,并重启服务器。如果您使用的是多服务器分区,并且故障发生在单个分区中,那么只有该分区终止并重启。

  domino 7 中的新故障诊断特性

  本节简要介绍一些有助于您分析和纠正服务器挂起和崩溃的 domino 7 新特性。

  domino domain monitoring

  domino 7 中的一个最重要且有用的服务器维护和故障诊断特性是 domino domain monitoring (ddm)。这为监控一个域(或多个域)中的所有服务器提供了一个中央位置。ddm 使用名为 probes 的程序来收集来自单个服务器的服务器信息,然后报告回一个特殊的数据库(ddm.nsf),您可以在该数据库中查看所收集的数据。这允许您从单个 domino administrator 控制台监控、分析和故障诊断大量的服务器。

  activity trends

  activity trends 特性用于分析 “历史” 服务器数据,以助于发现只有通过很长时间才能发现的趋势。您可以查看该数据,来帮助预计和避免未来的问题。该数据从日志文件(log.nsf)和 catalog 任务收集而来,并存储在 activity trends 数据库(activity.nsf)中。activity trends collector 任务处理该数据,并产生 “趋势化” 数据,用于绘制图表和平衡资源。

  将状态条历史写到日志文件

  您可以将 notes 客户机状态条消息设置为记录到本地日志文件(log.nsf)或者您指定的外部文件。这有助于您故障诊断 notes 客户机崩溃。使用 notes.ini 的设置 logstatusbar=1 将状态条消息记录到 log.nsf。要查看已记录的消息,请打开 log.nsf 并点击 miscellaneous events 视图。状态条消息后跟有 status msg。要将状态条消息写到外部文件,请使用 notes.ini 的设置 debug_outfile=<path to file> 和 notes.ini 的设置 logstatusbar=1。例如:
  logstatusbar=1
  debug_outfile=c:\temp\statusbarlogging.txt

  这将状态条消息记录到文件 statusbarlogging.txt。

  log.nsf 文件也提供 notes 客户机崩溃之前记录到状态条中的动作的一个快照。

  fault analyzer

  fault analyzer 是一个新的服务器特性,用于在所有新的崩溃被提交到 automatic data collection mail-in 数据库时对它们进行处理。fault analyzer 任务搜索为 fault report 文档配置的数据库,并确定堆栈是否与用户或服务器已经看到过的崩溃相匹配。它通过分析 fault report mail-in 数据库中的调用堆栈,并分析它们以确定其中是否有相同问题的其他情况,从而在 automatic data collection 特性的基础上新增了功能。

  fault analyzer 是在设置 automatic data collection 的同时配置的。使用 server configuration 文档在服务器上设置 automatic data collection 和启用或禁用 fault analyzer。

  如果 fault analyzer 找到重复的故障报告,那么新的崩溃就被报告为初始崩溃的一个响应,并且附件要么被从响应文档删除以节省数据库空间,要么用响应文档进行保存。

  automatic data collection 增强

  当您使用 automatic data collection 工具来收集有关服务器崩溃的信息时,现在服务器被首先检查,看它是否运行在 domino 之下,如果是的,就使用 controller 日志。如果不是的,就检查服务器是否启用了控制台记录,如果是的,就使用控制台输出。最后,如果既没设置 domino controller,也没设置控制台记录,则会从 log.nsf 中提取数据。

  现在您可以选择,automatic data collection 工具在客户机或服务器上运行时,将会收集哪些文件(使用通配符)。在 notes 客户机上,它是使用 desktop policy settings 文档配置的。在 domino 服务器上,它是使用 server configuration 文档配置的。

  可能会出现这样的情况,即 automatic data collection 发送的输出非常大。如果这成为了问题,那么您可以配置 automatic data collection,限制 nsd 发送的附件和记录到 fault reports 数据库的控制台日志的大小。

  shutdown monitor

  在您发出退出或重启服务器的命令之后,domino 服务器通常要花很长时间才能实际关闭。为了避免这一延迟,shutdown monitor 任务确保 domino 在请求一终止时就立即终止。如果服务器不在指定的时间内终止,那么服务器将被迫终止,并在终止之前生成一个 nsd 日志。这个时间限制是在 server 文档的 automatic server restart 部分的 server shutdown timeout 域中指定的。

  默认的 server shutdown timeout 设置是 5 分钟。可以使用 notes.ini 的设置 shutdown_monitor_disabled=1 禁用该特性。

  process monitor(仅针对 windows 平台)

  process monitor 任务监控应该作为 domino 服务器环境一部分运行的进程。(该任务只运行在 microsoft windows 平台上;该功能在 domino for unix 平台上已实现,无需使用单独的服务器任务。)如果任何这些进程缺失,或者一个进程在没有完成通常的 domino 终止例程时就意外终止了,那么该任务将导致服务器 panic 并确定哪个进程过早终止了。process monitor 任务与 nprocmon.exe 一起工作,后者监控 nserver.exe 进程的异常终止。

  该特性可以大大减少异常终止问题出现的次数,而这样的问题很难分析(因为通常难以确定哪个进程终止了并导致了服务器问题)。要禁用 process monitor 任务,请在服务器的 notes.ini 文件中设置变量 process_monitor_disabled=1。

  结束语

  在本文中,我们定义了 domino 服务器挂起与崩溃之间的区别。讨论了在分析和修复 notes/domino 问题时可以使用的一些故障诊断过程和工具。还了解了 notes/domino 7 中引入的一些新的故障诊断特性。在 notes 客户机或 domino 服务器遇到挂起或崩溃时,您可以来参考这篇文章,当然,希望您不要经常碰到这种情况。

本文来源:https://shitiku.jxxyjl.com/ibmrenzhengfuxizhidao/6089.html

Copyright @ 2011- 考试题库网 All Rights Reserved. 版权所有

免责声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。

 站长统计