疑難排解問題

疑難排解是一種系統性的問題解決方法。疑難排解的目標是判斷某項目為何無法按照預期運作,並說明如何解決這個問題。

疑難排解程序的第一個步驟是完整說明問題。問題說明可協助您及 HCL® 支援中心人員知道從哪裡著手尋找問題原因。這個步驟包括自問一些基本問題:

  • 問題的症狀為何?
  • 發生問題的位置?
  • 問題何時發生?
  • 問題是在怎樣的情況下發生?
  • 能夠重新產生問題嗎?

回答這些問題,通常會使問題得到更好的描述,這是進入問題解決路徑的最佳方式。

問題的症狀為何?

當開始描述問題時,最明顯的問題是:「問題是什麼?」。這個問題看起來直接而明確;不過,您可以將它分解成若干焦點更清晰的問題,以便建立更具描述性的問題寫照。這些問題可包括:

  • 是誰或何者提報問題?
  • 錯誤碼及訊息是什麼?
  • 系統失敗的狀況為何?例如,系統是否陷入迴圈、當掉、損毀、效能降低,或結果不正確?
  • 問題的商業影響如何?

發生問題的位置?

判斷問題的發生位置不是總是那麼簡單,但是卻是解決問題的其中一個最重要步驟。報告元件與失敗元件之間具有許多技術層次。在您探索問題時,網路、磁碟與驅動程式只是少數幾個會考量到的元件。

下列問題可協助您明確找出發生問題的位置,以隔離問題層:

  • 問題是發生在特定的一個平台或作業系統,或是普遍發生在多個平台或作業系統?
  • 是否支援現行環境與配置?

請記住,報告問題的層次,不必然就是問題起源的層次。識別問題起源包括瞭解問題所在的環境。請花一些時間完整地說明問題環境,包括作業系統和版本、所有對應軟體和版本以及硬體資訊。請確認您是在配置受支援的環境內執行;許多問題都可以追溯至不是預定要一起執行或尚未同時完整測試過的不相容軟體層次。

問題何時發生?

請擬訂一份導向問題之事件的詳細時間表,尤其是單次出現的情況。從後往前執行是最輕鬆的方式:從系統產生錯誤報告時間開始(盡可能精確,甚至精細到毫秒),透過可用的日誌及資訊,從後往前列出時間表。您通常只需要查看您在診斷日誌中找到的第一個可疑事件;不過,這件事並不容易,且需要練習。當涉及多層技術時,當每個都有它自己的診斷資訊時,尤其不容易知道何時停止查看。

若要列出詳細的事件時間表,請回答下列問題:

  • 問題是否只在白天或晚上的特定時間發生?
  • 問題發生的頻率為何?
  • 在報告問題的時間之前的一連串事件為何?
  • 問題是發生在環境變更之後嗎?例如升級或安裝軟體或硬體?

回應這類問題,有助於提供一個探索問題的參考架構。

問題是在怎樣的情況下發生?

疑難排解的一個重要部分,是瞭解發生問題時哪些系統和應用程式處於執行中。有關環境的這些問題可協助您識別問題的根本原因:

  • 問題是否一律在執行相同的作業時發生?
  • 是否需要進行特定的一連串事件,問題才會浮現?
  • 同時間是否還有其他應用程式執行失敗?

回答這些類型的問題可協助您解釋發生問題的環境,並產生任何相依關係。請注意,因同時間是有可能發生多個問題的,因此這些問題未必彼此相關。

問題會重新產生嗎?

從疑難排解的角度來看,理想的問題是能夠重新產生的問題。一般而言,只要問題能夠重新產生,您就能安排一套較大的工具或程序來協助您探索。因此,您可以重新產生的問題通常比較容易除錯和解決。不過,您可以重現的問題可能有個缺點:如果問題對業務運作會有重大影響,您不會希望它再次發生。如有可能,請在測試環境或開發環境中重建該問題,這樣通常可讓您在探索期間更具彈性,也更能掌控所發生的一切。

  • 問題是否可以在測試系統上重建?
  • 多位使用者或多個應用程式發生同類問題嗎?
  • 執行單一指令、一組指令或特定應用程式,或獨立式應用程式,能夠重建問題嗎?