notes.ini 設(shè)置 為了故障診斷性能和崩潰問題,您可以啟用下列 notes.ini 調(diào)試參數(shù): debug_threadid=1 記錄每個(gè)服務(wù)器操作的每個(gè)進(jìn)程和線程 id。
debug_show_timeout=1 打開到控制臺(tái)的信號(hào)量超時(shí)消息,并創(chuàng)建一個(gè)名為的 semdebug.txt 信號(hào)量文本文件。
debug_capture_timeout=10 給每個(gè)信號(hào)量超時(shí)消息加時(shí)間戳。
console_log_enabled=1 (domino 6 和更高版本)啟用 domino 控制臺(tái)日志記錄。 服務(wù)器崩潰的故障恢復(fù)
您可以將故障恢復(fù)設(shè)置為自動(dòng)處理 domino 服務(wù)器崩潰。當(dāng)服務(wù)器崩潰時(shí),它就自動(dòng)關(guān)閉并重啟,無需任何管理員干預(yù)。domino 將崩潰信息記錄在 data 目錄中。當(dāng)服務(wù)器重啟時(shí),domino 檢查它是否是崩潰后重啟。如果是的,就會(huì)自動(dòng)給 “mail fault notification to” 域中的人員或組發(fā)送一封電子郵件。 重大的錯(cuò)誤(比如操作系統(tǒng)異常或內(nèi)部 panic)終止每個(gè) domino 進(jìn)程,并釋放所有相關(guān)的資源。啟動(dòng)腳本檢測(cè)該場(chǎng)景,并重啟服務(wù)器。如果您使用的是多服務(wù)器分區(qū),并且故障發(fā)生在單個(gè)分區(qū)中,那么只有該分區(qū)終止并重啟。 domino 7 中的新故障診斷特性
本節(jié)簡(jiǎn)要介紹一些有助于您分析和糾正服務(wù)器掛起和崩潰的 domino 7 新特性。 domino domain monitoring
domino 7 中的一個(gè)最重要且有用的服務(wù)器維護(hù)和故障診斷特性是 domino domain monitoring (ddm)。這為監(jiān)控一個(gè)域(或多個(gè)域)中的所有服務(wù)器提供了一個(gè)中央位置。ddm 使用名為 probes 的程序來收集來自單個(gè)服務(wù)器的服務(wù)器信息,然后報(bào)告回一個(gè)特殊的數(shù)據(jù)庫(ddm.nsf),您可以在該數(shù)據(jù)庫中查看所收集的數(shù)據(jù)。這允許您從單個(gè) domino administrator 控制臺(tái)監(jiān)控、分析和故障診斷大量的服務(wù)器。 activity trends
activity trends 特性用于分析 “歷史” 服務(wù)器數(shù)據(jù),以助于發(fā)現(xiàn)只有通過很長(zhǎng)時(shí)間才能發(fā)現(xiàn)的趨勢(shì)。您可以查看該數(shù)據(jù),來幫助預(yù)計(jì)和避免未來的問題。該數(shù)據(jù)從日志文件(log.nsf)和 catalog 任務(wù)收集而來,并存儲(chǔ)在 activity trends 數(shù)據(jù)庫(activity.nsf)中。activity trends collector 任務(wù)處理該數(shù)據(jù),并產(chǎn)生 “趨勢(shì)化” 數(shù)據(jù),用于繪制圖表和平衡資源。 將狀態(tài)條歷史寫到日志文件
您可以將 notes 客戶機(jī)狀態(tài)條消息設(shè)置為記錄到本地日志文件(log.nsf)或者您指定的外部文件。這有助于您故障診斷 notes 客戶機(jī)崩潰。使用 notes.ini 的設(shè)置 logstatusbar=1 將狀態(tài)條消息記錄到 log.nsf。要查看已記錄的消息,請(qǐng)打開 log.nsf 并點(diǎn)擊 miscellaneous events 視圖。狀態(tài)條消息后跟有 status msg。要將狀態(tài)條消息寫到外部文件,請(qǐng)使用 notes.ini 的設(shè)置 debug_outfile=<path to file> 和 notes.ini 的設(shè)置 logstatusbar=1。例如:
logstatusbar=1
debug_outfile=c:\temp\statusbarlogging.txt 這將狀態(tài)條消息記錄到文件 statusbarlogging.txt。 log.nsf 文件也提供 notes 客戶機(jī)崩潰之前記錄到狀態(tài)條中的動(dòng)作的一個(gè)快照。 fault analyzer
fault analyzer 是一個(gè)新的服務(wù)器特性,用于在所有新的崩潰被提交到 automatic data collection mail-in 數(shù)據(jù)庫時(shí)對(duì)它們進(jìn)行處理。fault analyzer 任務(wù)搜索為 fault report 文檔配置的數(shù)據(jù)庫,并確定堆棧是否與用戶或服務(wù)器已經(jīng)看到過的崩潰相匹配。它通過分析 fault report mail-in 數(shù)據(jù)庫中的調(diào)用堆棧,并分析它們以確定其中是否有相同問題的其他情況,從而在 automatic data collection 特性的基礎(chǔ)上新增了功能。 fault analyzer 是在設(shè)置 automatic data collection 的同時(shí)配置的。使用 server configuration 文檔在服務(wù)器上設(shè)置 automatic data collection 和啟用或禁用 fault analyzer。 如果 fault analyzer 找到重復(fù)的故障報(bào)告,那么新的崩潰就被報(bào)告為初始崩潰的一個(gè)響應(yīng),并且附件要么被從響應(yīng)文檔刪除以節(jié)省數(shù)據(jù)庫空間,要么用響應(yīng)文檔進(jìn)行保存。 automatic data collection 增強(qiáng)
當(dāng)您使用 automatic data collection 工具來收集有關(guān)服務(wù)器崩潰的信息時(shí),現(xiàn)在服務(wù)器被首先檢查,看它是否運(yùn)行在 domino 之下,如果是的,就使用 controller 日志。如果不是的,就檢查服務(wù)器是否啟用了控制臺(tái)記錄,如果是的,就使用控制臺(tái)輸出。最后,如果既沒設(shè)置 domino controller,也沒設(shè)置控制臺(tái)記錄,則會(huì)從 log.nsf 中提取數(shù)據(jù)。 現(xiàn)在您可以選擇,automatic data collection 工具在客戶機(jī)或服務(wù)器上運(yùn)行時(shí),將會(huì)收集哪些文件(使用通配符)。在 notes 客戶機(jī)上,它是使用 desktop policy settings 文檔配置的。在 domino 服務(wù)器上,它是使用 server configuration 文檔配置的。
可能會(huì)出現(xiàn)這樣的情況,即 automatic data collection 發(fā)送的輸出非常大。如果這成為了問題,那么您可以配置 automatic data collection,限制 nsd 發(fā)送的附件和記錄到 fault reports 數(shù)據(jù)庫的控制臺(tái)日志的大小。 shutdown monitor
在您發(fā)出退出或重啟服務(wù)器的命令之后,domino 服務(wù)器通常要花很長(zhǎng)時(shí)間才能實(shí)際關(guān)閉。為了避免這一延遲,shutdown monitor 任務(wù)確保 domino 在請(qǐng)求一終止時(shí)就立即終止。如果服務(wù)器不在指定的時(shí)間內(nèi)終止,那么服務(wù)器將被迫終止,并在終止之前生成一個(gè) nsd 日志。這個(gè)時(shí)間限制是在 server 文檔的 automatic server restart 部分的 server shutdown timeout 域中指定的。 默認(rèn)的 server shutdown timeout 設(shè)置是 5 分鐘。可以使用 notes.ini 的設(shè)置 shutdown_monitor_disabled=1 禁用該特性。 process monitor(僅針對(duì) windows 平臺(tái))
process monitor 任務(wù)監(jiān)控應(yīng)該作為 domino 服務(wù)器環(huán)境一部分運(yùn)行的進(jìn)程。(該任務(wù)只運(yùn)行在 microsoft windows 平臺(tái)上;該功能在 domino for unix 平臺(tái)上已實(shí)現(xiàn),無需使用單獨(dú)的服務(wù)器任務(wù)。)如果任何這些進(jìn)程缺失,或者一個(gè)進(jìn)程在沒有完成通常的 domino 終止例程時(shí)就意外終止了,那么該任務(wù)將導(dǎo)致服務(wù)器 panic 并確定哪個(gè)進(jìn)程過早終止了。process monitor 任務(wù)與 nprocmon.exe 一起工作,后者監(jiān)控 nserver.exe 進(jìn)程的異常終止。 該特性可以大大減少異常終止問題出現(xiàn)的次數(shù),而這樣的問題很難分析(因?yàn)橥ǔky以確定哪個(gè)進(jìn)程終止了并導(dǎo)致了服務(wù)器問題)。要禁用 process monitor 任務(wù),請(qǐng)?jiān)诜⻊?wù)器的 notes.ini 文件中設(shè)置變量 process_monitor_disabled=1。 結(jié)束語
在本文中,我們定義了 domino 服務(wù)器掛起與崩潰之間的區(qū)別。討論了在分析和修復(fù) notes/domino 問題時(shí)可以使用的一些故障診斷過程和工具。還了解了 notes/domino 7 中引入的一些新的故障診斷特性。在 notes 客戶機(jī)或 domino 服務(wù)器遇到掛起或崩潰時(shí),您可以來參考這篇文章,當(dāng)然,希望您不要經(jīng)常碰到這種情況。