欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

SMART磁盤監(jiān)控方案-創(chuàng)新互聯

smartctl 命令行的使用.

創(chuàng)新互聯公司是一家網站設計公司,集創(chuàng)意、互聯網應用、軟件技術為一體的創(chuàng)意網站建設服務商,主營產品:成都響應式網站建設公司成都品牌網站建設全網整合營銷推廣。我們專注企業(yè)品牌在網站中的整體樹立,網絡互動的體驗,以及在手機等移動端的優(yōu)質呈現。成都網站制作、網站設計、移動互聯產品、網絡運營、VI設計、云產品.運維為核心業(yè)務。為用戶提供一站式解決方案,我們深知市場的競爭激烈,認真對待每位客戶,為客戶提供賞析悅目的作品,網站的價值服務。

SMART 磁盤監(jiān)控方案

命令行使用說明:

目前我們使用的服務器都帶有l(wèi)si的raid卡,當磁盤為SAS盤時使用smartctl時需要添加:

 smartctl -d megaraid,$deviceid  /dev/$diskname

當磁盤為SATA盤時使用smartctl時需要添加:

 smartctl -d sat+megaraid,$deviceid  /dev/$diskname

可以使用raid卡工具來查看磁盤接口類型

    megacli -cfgdsply -aall |grep 'PD TYPE'

若沒有使用raid卡則不需要加 -d參數.

SMART 磁盤監(jiān)控方案

命令行返回值

smartctl執(zhí)行完畢之后可以從$? shell變量中取得返回值,如果磁盤完全正常則返回值為0,否則根據錯誤類型設置相應的bit位.
各個bit的說明如下:

       Bit 0: Command line did not parse.

       Bit 1: Device open failed, device did not return an IDENTIFY DEVICE structure, or device is in a low-power mode (see -n option above).

       Bit 2: Some SMART or other ATA command to the disk failed, or there was a checksum error in a SMART data structure (see -b option above).

       Bit 3: SMART status check returned "DISK FAILING".

       Bit 4: We found prefail Attributes <= threshold.

       Bit 5: SMART status check returned "DISK OK" but we found that some (usage or prefail) Attributes have been <= threshold at some time in the past.

       Bit 6: The device error log contains records of errors.

       Bit 7: The device self-test log contains records of errors.  [ATA only] Failed self-tests outdated by a newer successful extended self-test are ignored.

查看bit設置:

      status=$?
       for ((i=0; i<8; i++)); do
         echo "Bit $i: $((status & 2**i && 1))" 
       done

需要重點監(jiān)控bit3, bit4, bit6, bit7,bit5是否設置,其他位置的設置需要提醒.

SMART 磁盤監(jiān)控方案

smartctl 顯示的屬性(Attribute)信息:

以公司內的一臺服務器為例說明:

[root@datacenter1.rack1.node11 ~]#smartctl -A -P use  /dev/sdb
smartctl 5.42 2011-10-20 r3458 [x86_64-linux-2.6.32-279.el6.x86_64] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   086   086   016    Pre-fail  Always       -       10813449
  2 Throughput_Performance  0x0005   132   132   054    Pre-fail  Offline      -       105
  3 Spin_Up_Time            0x0007   117   117   024    Pre-fail  Always       -       615 (Average 615)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       314
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   112   112   020    Pre-fail  Offline      -       39
  9 Power_On_Hours          0x0012   097   097   000    Old_age   Always       -       23637
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       313
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       478
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       478
194 Temperature_Celsius     0x0002   222   222   000    Old_age   Always       -       27 (Min/Max 5/70)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0

1,首先不同的磁盤廠商提供的ATTRIBUTE_NAME 列表可能不一樣,只是S.M.A.R.T屬性列表的子集,smart完整的屬性列表及其每個屬性的含義請參考這里:
http://en.wikipedia.org/wiki/S.M.A.R.T.#8

2,我們需要關注的字段 WHEN_FAILED
WHEN_FAILED字段顯示的規(guī)則:

  if(VALUE <= THRESH)
           WHEN_FAILED = "FAILING_NOW";
  else if (WORST <= THRESH)
           WHEN_FAILED = "in_the_past"(or past);
  else 
           WHEN_FAILED = "-";

也就說當某個ATTRIBUTE_NAME的WHEN_FAILED字段為“-”時表示這個屬性是正常的,也從沒發(fā)生過異常.

同時當smartctl 命令的返回值的bit4,bit 5設置就可以檢查看哪個ATTRIBUTE_NAME為非“-”就表示這個字段出問題了.

SMART 磁盤監(jiān)控方案

簡單的smartctl監(jiān)控方案

針對每塊盤沒半個小時執(zhí)行一次smartctl掃描:

smartctl -a  /dev/$devname

每次都要檢查smartctl的返回值,
如果返回值的bit2,可以使用smartctl -x -b warn /dev/$devname可以看到不支持哪些命令
Warning: device does not support SCT Data Table command
Warning: device does not support SCT Error Recovery Control command
如果返回值的bit4或者bit5設置,則需要檢查smartctl輸出中的START OF READ SMART DATA SECTION,即上節(jié)所講的ATTRIBUTE,并記錄WHEN_FAILED字段非“-”的ATTRIBUTE_NAME.
如果返回值的bit6設置,記錄smartctl -l xerror  /dev/$devname 的執(zhí)行結果.
如果返回值的bit7設置,記錄smartctl -l xselftest /dev/$devname 的執(zhí)行結果.
如果bit3設置表示smart自檢失敗.

以上的bit除了bit5.其他最好都能實時的發(fā)出警報信息,
其他bit如果置位,可以不需要實時的警報.

SMART 磁盤監(jiān)控方案

針對ATTRIBUTE_NAME的一些說明:

由于不同廠商的磁盤提供的ATTRIBUTE_NAME不完全一致, 加上我現在對某些字段的含義理解不夠,所以警報信息暫時不按照ATTRIBUTE_NAME來區(qū)分.
比如我們比較關注的Throughput_Performance,公司內的日立的磁盤的smart包含有此信息,而希捷的盤沒有.
至于需要更細化的監(jiān)控方案需要對ATTRIBUTE_NAME中的屬性有深入的理解再做定奪.

SMART 磁盤監(jiān)控方案

ssd盤的壽命監(jiān)控

ssd 盤的壽命監(jiān)控主要監(jiān)控以下的ATTRIBUTE:

Media_Wearout_Indicator:    使用耗費, 表示SSD上NAND的擦寫次數的程度
Reallocated_Sector_Ct:     出廠后產生的壞塊個數
Host_Writes_32MiB:     已寫32MiB的個數.
Available_Reservd_Space:    SSD上剩余的保留空間。

以上的ATTRIBUTE只要VALUE字段接近THRESH字段的值就需要報警,同樣可以使用上邊的說明來處理

另外有需要云服務器可以了解下創(chuàng)新互聯scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。

網頁標題:SMART磁盤監(jiān)控方案-創(chuàng)新互聯
本文來源:http://www.chinadenli.net/article12/dpdjgc.html

成都網站建設公司_創(chuàng)新互聯,為您提供響應式網站自適應網站面包屑導航外貿網站建設定制網站Google

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯

h5響應式網站建設