硬碟是一般電腦內最重要的儲存媒體,硬碟會故障
的原因有很多,基本可以分為漸進式及突發式。
漸進式故障:硬碟隨著使用的時間正常老化而產生
的故障,例如主軸馬達是會逐漸磨損的,而在完全
故障之前碟片運轉的聲音會出現異常,而且硬碟讀
取資料時的穩定度也會下降,由於這樣漸進式的特
性,我們可以使用S.M.A.R.T. 這類的硬碟檢測軟
體進行監控。
突發式故障:是指突然發生的故障,例如電腦在使
用中卻途然受到撞擊而使得硬碟受損,或是硬碟的
晶片毀損導致無法抓取硬碟資料,這類故障通常無
法使用S.M.A.R.T. 反映出來
通常 S.M.A.R.T. 檢測都會使用CrystalDiskInfo
或是HDTune對硬碟進行監控檢測,這兩套軟體都
是針對 S.M.A.R.T. 的數值來做硬碟健康的標準判
斷,那什麼是 S.M.A.R.T. ?
S.M.A.R.T.,全稱為
「Self-Monitoring Analysis and Reporting Technology」,
即「自我監測、分析及報告技術」,是一種自動的硬
碟狀態檢測與預警系統和規範。通過在硬碟硬體內的
檢測指令對硬碟的硬體如磁頭、碟片、馬達、電路的
執行情況進行監控、記錄並與廠商所設定的預設安全
值進行比較,若監控情況將或已超出預設安全值的安
全範圍,就可以通過主機的監控硬體或軟體自動向使
用者作出警告並進行輕微的自動修復,以提前保障硬
碟資料的安全。除一些出廠時間極早的硬碟外,現在
大部分硬碟均配備該項技術。
小編這裡以 HDTune 5.5 來做講解(圖一)
執行 HDTune 後將分頁切換至健康狀態(紅框),
下方的則是各項 S.M.A.R.T.的檢測數據圖表(黃框),
ID 屬性標示碼:各檢測項目的內容
Current 目前值:該項目的現在值
Worst 最差:該項目曾出現過的峰值
Threshold 臨界值:一旦超過這數值就代表硬碟該項目有問題
Data 資料:該項目的數據記錄
Status 狀態:軟體依照數據判斷出該項目是否有問題
正常的硬碟在黃框處的狀態應該都是"好",一般的檢測
項目中重點是03、05、C5、C7
03 碟片啟動時間:硬碟從靜止到完全啟動的平均時間、
單位ms ,如果這一項有出現錯誤,主軸馬達有可能已
經老化
05 重定位磁區計數:代表的是硬碟有壞軌而且已經使
用備用磁區替換的數目
C5 等候重定的磁區計數:硬碟發現有問題的磁區,它
會先標記起來等待備用配磁區來換掉他,如果下次讀取
到該磁區正常的話就會消失,如果依然不正常就會將該
數值傳送到05
C7 通訊CRC錯誤:這個數值只要出現通常是排線沒插
好或是故障,只要將排線插好或是更換,數值不再增加
就可以,須注意的是這個數值只要一出現只會增加不會
減少。
圖二:
圖二中的05 的資料6688 已經超過臨界值50 所以
出現警告,C5 也還有96 個磁區在等待分配
圖三:
圖中的03 的資料為18663ms 等於18.6秒
由此可以判斷主軸馬達己經老化,0B 數值也出現 1 ,
這數值出現代表的硬碟的機械零件已經出現問題了
圖四:
圖四:
這個硬碟的05及C5 也都出現警告,BE 是WD 硬碟特有
的檢測項目,類似C2 的溫度檢測,C7 是因為傳輸介面
曾經有問題而產生的
硬碟是非常脆弱的儲存媒體,除了在運轉中別使硬碟受到
撞擊或是振動,電腦也需要選擇好一點的POWER 維持電
源的輸出穩定,以防硬碟的碟片被燒毀,而漸進式故障因
為有跡可循所以可以提前預知,使得在硬碟故障前提早備
份資料成為可能,但不管如何重要資料多備份總是沒錯,
畢竟硬體有價、資料無價。
參考資料 維基百科 S.M.A.R.T. 條目
https://zh.wikipedia.org/wiki/S.M.A.R.T.
留言列表