کنترل کارکرد صحیح هارد دیسک (دریافت پیوندک)

نوشته شده در تاریخ: 19/10/92 | نویسنده:هادی شهیدی

هارد دیسک

 

یکی از موضوعاتی که روی سرورهای اختصاصی همیشه باید مورد توجه قرارگیرد موضوع نگهداری هارد دیسک است.

هارد دیسک ها امروزه بسیار بهتر و قوی تر و بزرگتر از گذشته میتوانند اطلاعات ما را نگهداری کنند. اما موضوعی که راجع به یک دیسک همیشه باید مد نظر قرار گیرد از بین رفتن اطلاعات آن به دلیل خرابی دیسک است. یکی از نشانه های خرابی دیسک و نجات اطلاعات کنترل سرعت خواندن و نوشتن اطلاعات روی دیسک هاست.

با استفاده از دستور sar  در محیط command لینوکس اطلاعاتی راجع به موضوع مطرح شده بدست می آورید.

اخیراً بر روی یکی از سرورها Load بالای سرور توجه ما را جلب کرده بود و ما مانیتور دائمی سرور متوجه شدیم که اطلاعات با سرعت معمول از روی دیسک خوانده نمیشوند و این موضوع منجر به بالا رفتن بار سرور شده بود.

برای این منظور ابتدا دستور sar را اجرا کردیم با نتیجه زیر مواجه شدیم

12:00:01 AM     CPU     %user     %nice   %system   %iowait    %steal     %idle
12:10:01 AM     all     12.37      0.00      5.68     26.07      0.00     55.88
12:20:01 AM     all     11.37      0.00      3.84     18.77      0.00     66.01
12:30:01 AM     all     12.04      0.00      4.01     13.02      0.00     70.93
12:40:02 AM     all     11.00      0.00      4.06     16.20      0.00     68.73
12:50:01 AM     all     10.93      0.00      3.60     11.04      0.00     74.43
01:00:01 AM     all      9.14      0.00      3.73      8.52      0.00     78.62
01:10:01 AM     all     10.58      0.00      5.18      9.50      0.00     74.73
01:20:01 AM     all      8.60      0.00      3.17      8.84      0.00     79.39
01:30:01 AM     all     10.84      0.00      4.20      7.84      0.00     77.12
01:40:01 AM     all     11.78      0.00      3.67      4.54      0.00     80.01
01:50:01 AM     all     10.77      0.00      3.39     13.50      0.00     72.34
02:00:01 AM     all      7.60      0.00      3.42      2.43      0.00     86.55
02:10:01 AM     all      9.05      0.00      4.72      2.62      0.00     83.61
02:20:01 AM     all      8.07      0.00      2.91     11.07      0.00     77.95
02:30:01 AM     all      7.56      0.00      2.81      6.46      0.00     83.17
02:40:01 AM     all      7.14      0.00      2.97      9.05      0.00     80.84
02:50:01 AM     all      7.38      0.00      2.95      5.29      0.00     84.37
03:00:01 AM     all      7.76      0.00      3.80      3.49      0.00     84.95
03:10:01 AM     all      7.40      0.00      4.49      7.28      0.00     80.83
03:20:01 AM     all     11.86      0.00      3.86      4.03      0.00     80.25
03:30:06 AM     all      7.38      0.00      2.91      7.16      0.00     82.54
03:40:01 AM     all      6.27      0.03      2.61     41.75      0.00     49.34
03:50:01 AM     all      8.10      0.01      2.77      8.84      0.00     80.28
04:00:01 AM     all      6.72      0.04      3.39      8.77      0.00     81.09
04:10:01 AM     all      6.36      0.00      4.12     14.54      0.00     74.99
04:20:01 AM     all      6.38      0.00      2.46      3.15      0.00     88.02
04:30:01 AM     all      6.44      0.00      2.43      5.96      0.00     85.17
04:40:02 AM     all      5.82      0.16      2.86     20.34      0.00     70.83
04:50:01 AM     all      7.23      0.00      2.55      6.32      0.00     83.91
05:00:01 AM     all      6.45      0.00      3.15      8.72      0.00     81.68
05:10:01 AM     all      7.74      0.00      4.42     13.68      0.00     74.16
05:20:01 AM     all      5.58      0.00      2.25     15.59      0.00     76.57
05:30:01 AM     all      6.25      0.00      2.55      9.55      0.00     81.66
05:40:01 AM     all      4.91      0.00      2.35      4.76      0.00     87.98
05:50:01 AM     all      6.18      0.00      2.65      9.40      0.00     81.78
06:00:01 AM     all      7.39      0.00      3.56      7.94      0.00     81.12
06:10:01 AM     all      6.71      0.00      4.82     10.51      0.00     77.96
06:20:01 AM     all      6.89      0.00      2.58      6.61      0.00     83.92
06:30:01 AM     all      8.46      0.00      2.70      5.86      0.00     82.98
06:40:10 AM     all      6.68      0.00      2.58     10.04      0.00     80.70
06:50:01 AM     all      6.16      0.00      2.53      3.80      0.00     87.51
07:00:01 AM     all      7.33      0.00      3.82      9.14      0.00     79.70
07:10:01 AM     all      8.32      0.00      4.68     10.00      0.00     77.01
07:20:01 AM     all     11.18      0.00      2.49     13.05      0.00     73.29
07:30:01 AM     all      8.09      0.00      2.80      9.30      0.00     79.81
07:40:01 AM     all      7.13      0.00      3.07      8.94      0.00     80.86
07:50:01 AM     all      7.92      0.00      3.14      6.23      0.00     82.72
08:00:02 AM     all      9.29      0.00      4.13      8.17      0.00     78.41
08:10:01 AM     all      8.94      0.00      5.17     15.82      0.00     70.07
08:20:01 AM     all     12.22      0.00      4.08     13.47      0.00     70.23
08:30:14 AM     all     14.99      0.00      4.58     11.61      0.00     68.81
08:40:01 AM     all     13.87      0.00      5.02     13.58      0.00     67.53
08:50:01 AM     all     10.81      0.00      3.68     18.48      0.00     67.02
09:00:01 AM     all     12.91      0.00      5.03     17.97      0.00     64.10
09:10:01 AM     all     12.32      0.00      6.09     14.46      0.00     67.12
09:20:01 AM     all     11.58      0.00      3.81     13.35      0.00     71.26
09:30:01 AM     all     15.25      0.00      5.05     19.53      0.00     60.17
09:40:01 AM     all     15.23      0.00      5.25     14.29      0.00     65.23
09:50:01 AM     all     28.12      0.00      7.38     20.72      0.00     43.77
Average:        all      9.30      0.00      3.69     11.03      0.00     75.97

همانطوری که از ستون iowait و متوسط به دست آمده آن در پایین نتیجه این میزان از حد معمول برای یک یا دو ثانیه خارج شده بود.

سپس دستور زیر را اجرا کردیم

grep kernel /var/log/messages | grep ‘failed command’ | head

 

خروجی مطابق زیر وجود مشکل را در فایلهای لاگ سیستم تایید میکرد

Dec 22 03:11:23 uk kernel: ata3.00: failed command: READ DMA EXT
Dec 22 03:11:25 uk kernel: ata3.00: failed command: READ DMA EXT
Dec 22 03:11:27 uk kernel: ata3.00: failed command: READ DMA EXT
Dec 22 03:11:29 uk kernel: ata3.00: failed command: READ DMA EXT
Dec 22 03:11:31 uk kernel: ata3.00: failed command: READ DMA EXT
Dec 22 03:11:33 uk kernel: ata3.00: failed command: READ DMA EXT
Dec 22 03:11:35 uk kernel: ata3.00: failed command: READ DMA EXT
Dec 22 03:11:37 uk kernel: ata3.00: failed command: READ DMA EXT
Dec 22 03:11:39 uk kernel: ata3.00: failed command: READ DMA EXT
Dec 22 03:11:40 uk kernel: ata3.00: failed command: READ DMA EXT

 

و همچنین دستور زیر تعداد گزارش های خطا را نشان داد :

grep kernel /var/log/messages | grep ‘failed command’ -c

 

نتیجه در حدود 930 عدد بود .

وجود مشکل در دیسک کاملاً واضح بود و در نتیجه کل داستان به تغییر هارد دیسک انجامید.

شما هم میتوانید دیسک خود را چک کنید این موضوع بسیار حیاتی و ضروی است.