Smartmontools что это за программа
Мда. поведение ad4 мне совсем не нравится. Конечно, на этой машине ничего особо ценного на нём не хранится, но всё-таки.
Остаётся ждать писем 🙂 (Письма будут тока в случае ошибок)
P.S. Под 4.11 не завелось. Ругается:
/usr/local/etc/rc.d/>/usr/local/sbin/smartd -d -c /usr/local/etc/smartd.conf
smartd version 5.36 [i386-portbld-freebsd4.11] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
Opened configuration file /usr/local/etc/smartd.conf
Configuration file /usr/local/etc/smartd.conf parsed.
Device: /dev/ad0, opened
ATA support is not provided for this kernel version. Please ugrade to a recent 5-CURRENT kernel (post 09/01/2003 or so)
Device: /dev/ad0, not ATA, no IDENTIFY DEVICE Structure
Unable to register ATA device /dev/ad0 at line 27 of file /usr/local/etc/smartd.conf
Unable to register device /dev/ad0 (no Directive -d removable). Exiting.
Установка утилит Smartmontools и lm sensors в Ubuntu 20 04 LTS
/usr/local/etc/rc.d/>
Придётся поискать что-то другое 🙁
размещено: 2006-05-15,
последнее обновление: 2006-08-11,
автор: lissyara
Источник: www.lissyara.su
Проверка жесткого диска в Linux
Если и есть то, с чем вы очень не хотите столкнуться в вашей операционной системе, то это неожиданный выход из строя жестких дисков. С помощью резервного копирования и технологии хранения RAID вы можете очень быстро вернуть все данные на место, но потеря аппаратного устройства может очень сильно сказаться на бюджете, особенно если вы такого не планировали.
Чтобы избежать таких проблем можно использовать пакет smartmontools. Это программный пакет для управления и мониторинга устройств хранения данных с помощью технологии Self-Monitoring Analysis and Reporting Technology или просто SMART.
Большинство современных ATA/SATA/SCSI/SAS накопителей информации предоставляют интерфейс SMART. Цель SMART — мониторинг надежности жесткого диска, для выявления различных ошибок и своевременного реагирования на их появление. Пакет smartmontools состоит из двух утилит — smartctl и smartd. Вместе они представляют мощную систему мониторинга и предупреждения о возможных поломках HDD в Linux. Дальше будет подробно рассмотрена проверка жесткого диска linux.
Установка Smartmontools
Пакет smartmontools есть в официальных репозиториях большинства дистрибутивов Linux, поэтому установка сводится к выполнению одной команды. В Debian и основанных на нем системах выполните:
sudo apt install smartmontools
sudo yum install smartmontools
Во время установки надо выбрать способ настройки почтового сервера. Можно его вовсе не настраивать, если вы не собираетесь отправлять уведомления о проблемах с диском на почту.
VICTORIA 4.47 — ИНСТРУКЦИЯ по ПРОВЕРКЕ ДИСКА И ИСПРАВЛЕНИЮ БИТЫХ СЕКТОРОВ
Отправлять почту получится только на веб-сервере, к которому привязан домен, на локальной машине можно выбрать пункт только для локального использования и тогда почта будет складываться в локальную папку и её можно будет посмотреть утилитой mail. Теперь можно переходить к диагностике жесткого диска Linux.
Проверка жесткого диска в smartctl
Сначала узнайте какие жесткие диски подключены к вашей системе:
ls -l /dev | grep -E ‘sd|hd’
В выводе будет что-то подобное:
Здесь sdX это имя устройства HDD подключенного к компьютеру.
Для отображения информации о конкретном жестком диске (модель устройства, S/N, версия прошивки, версия ATA, доступность интерфейса SMART) Запустите smartctl с опцией info и именем жесткого диска. Например, для /dev/sda:
smartctl —info /dev/sda
Хотя вы можете и не обратить внимания на версию SATA или ATA, это один из самых важных факторов при поиске замены устройству. Каждая новая версия ATA совместима с предыдущими. Например, старые устройства ATA-1 и ATA-2 прекрасно будут работать на ATA-6 и ATA-7 интерфейсах, но не наоборот. Когда версии ATA устройства и интерфейса не совпадают, возможности оборудования не будут полностью раскрыты. В данном случае для замены лучше всего выбрать жесткий диск SATA 3.2.
Запустить проверку жесткого диска ubuntu можно командой:
smartctl -s on -a /dev/sda
Здесь опция -s включает флаг SMART на указном устройстве. Вы можете его убрать если поддержка SMART уже включена. Информация о диске разделена на несколько разделов, В разделе READ SMART DATA находится общая информация о здоровье жесткого диска.
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment rest result: PASSED
Этот тест может быть пройден (PASSED) или нет (FAILED). В последнем случае сбой неизбежен, начинайте резервное копирование данных с этого диска.
Следующая вещь которую можно посмотреть, когда выполняется диагностика HDD в linux, это таблица SMART атрибутов.
В SMART таблице записаны параметры, определенные для конкретного диска разработчиком, а также порог отказа для этих параметров. Таблица заполняется автоматически и обновляется на основе прошивки диска.
- ID # — идентификатор атрибута, как правило, десятичное число между 1 и 255;
- ATTRIBUTE_NAME — название атрибута;
- FLAG — флаг обработки атрибута;
- VALUE — это поле представляет нормальное значение для состояния данного атрибута в диапазоне от 1 до 253, 253 — лучшее состояние, 1 — худшее. В зависимости от свойств, начальное значение может быть от 100 до 200;
- WORST — худшее значение value за все время;
- THRESH — самое низкое значение value, после перехода за которое нужно сообщить что диск непригоден для эксплуатации;
- TYPE — тип атрибута, может быть Pre-fail или Old_age. Все атрибуты по умолчанию считаются критическими, то-есть если диск не прошел проверку по одному из атрибутов, то он уже считается не пригодным (FAILED) но атрибуты old_age не критичны;
- UPDATED — показывает частоту обновления атрибута;
- WHEN_FAILED — будет установлено в FAILING_NOW если значение атрибута меньше или равно THRESH, или в «-» если выше. В случае FAILING_NOW, лучше как можно скорее выполнить резервное копирование, особенно если тип атрибута pre-fail.
- RAW_VALUE — значение, определенное производителем.
Сейчас вы думаете, да smartctl хороший инструмент, но у меня нет возможности запускать его каждый раз вручную, было бы неплохо автоматизировать все это дело чтобы программа запускалась периодически и сообщала мне о результатах проверки. И это возможно, с помощью smartd.
Автоматическая диагностика в smartd
Автоматическая диагностика HDD в Linux настраивается очень просто. Сначала отредактируйте файл конфигурации smartd — /etc/smartd.conf. Добавьте следующую строку:
- -m — адрес электронной почты для отправки результатов проверки. Это может быть адрес локального пользователя, суперпользователя или внешний адрес, если настроен сервер для отправки электронной почты;
- -M — частота отправки писем. once — отправлять только одно сообщение о проблемах с диском. daily — отправлять сообщения каждый день если была обнаружена проблема. diminishing — отправлять сообщения через день если была обнаружена проблема. test — отправлять тестовое сообщение при запуске smartd. exec — выполняет указанную программу в место отправки почты.
Сохраните изменения и перезапустите smartd:
sudo systemctl restart smartd
Вы должны получить на электронную почту письмо о том, что программа была запущена успешно. Это будет работать только если на компьютере настроен почтовый сервер.
Также можно запланировать тесты по своему графику, для этого используйте опцию -s и регулярное выражение типа T/MM/ДД/ДН/ЧЧ, где:
Здесь T — тип теста:
Остальные символы определяют дату и время теста:
- ММ — месяц в году;
- ДД — день месяца;
- ЧЧ — час дня;
- ДН — день недели (от 1 — понедельник 7 — воскресенье;
- MM, ДД и ЧЧ — указываются с двух десятичных цифр.
Точка означает все возможные значения, выражение в скобках (A|B|C) — означает один из трех вариантов, выражение в квадратных скобках [1-5] означает диапазон (от 1 до 5).
Например, чтобы выполнять полную проверку жесткого диска linux каждый рабочий день в час дня добавьте опцию -s в строчку конфигурации вашего устройства:
Если вы хотите чтобы утилита сканировала и проверяла все устройства, которые есть в системе используйте вместо имени устройства директиву DEVICESCAN:
Проверка диска на ошибки в GUI
В графическом интерфейсе тоже можно посмотреть информацию из SMART. Для этого можно воспользоваться приложением Gnome Диски, откройте его из главного меню, выберите нужный диск, а затем кликните по пункту Данные самодиагностики и SMART в контекстном меню:
В открывшемся окне вы увидите те же данные диагностики SMART, а также все атрибуты SMART и их состояние:
Выводы
Если вы хотите быстро проверить механическую работу жесткого диска, посмотреть его физическое состояние или выполнить более-менее полное сканирование поверхности диска используйте smartmontools. Не забывайте выполнять регулярное сканирование, потом будете себя благодарить. Вы уже делали это раньше? Будете делать? Или используете другие методы?
Напишите в комментариях!
Оцените статью:
(15 оценок, среднее: 4,93 из 5)
Об авторе
Основатель и администратор сайта losst.ru, увлекаюсь открытым программным обеспечением и операционной системой Linux. В качестве основной ОС сейчас использую Ubuntu. Кроме Linux, интересуюсь всем, что связано с информационными технологиями и современной наукой.
9 комментариев
Иван 25 ноября, 2016 Ответить
Вы слишком замудрили в данной статье. Легче написать smartctl —scan и всё сразу видно.
И ещё у меня такую ошибку выдало Error 4324 occurred at disk power-on lifetime: 15035 hours (626 days + 11 hours)
А куда обращатся непонятно.
Smolkozlino 22 февраля, 2018 Ответить
Подскажите пожалуйста, можно ли получить карту диска, наподобие таковой в виктории, программой под линукс?
Дед 14 марта, 2018 Ответить
Не знаю такой, как вариант после проверки диска командой:
ddrescue -n -f /dev/sdX /dev/null file.log
или после клонирования на другое устройство можно посмотреть графическую карту с помощью:
ddrescueview file.log
Консольный вариант: ddrescuelog -t file.log
аноним 28 ноября, 2018 Ответить
аноним 21 января, 2019 Ответить
whdd наверное хорошо, только deb пакетов нет, а из исходников не собирается.
Денис 7 марта, 2020 Ответить
hard disk sentinel через ./ запустил и окей
Антон 1 января, 2021 Ответить
У меня получается непонятка.
По smart характеристикам диск хороший,
но после запуска самотестирования выдает ошибки чтения в одних и тех же секторах
Что это значит? счас приведу выхлоп
sudo smartctl —all /dev/sda
.
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED . SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 100 100 050 Pre-fail Always — 0
2 Throughput_Performance 0x0005 100 100 050 Pre-fail Offline — 0
3 Spin_Up_Time 0x0027 100 100 001 Pre-fail Always — 1795
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always — 3920
5 Reallocated_Sector_Ct 0x0033 100 100 050 Pre-fail Always — 0
7 Seek_Error_Rate 0x000b 100 100 050 Pre-fail Always — 0
8 Seek_Time_Performance 0x0005 100 100 050 Pre-fail Offline — 0
9 Power_On_Hours 0x0032 074 074 000 Old_age Always — 10664
10 Spin_Retry_Count 0x0033 178 100 030 Pre-fail Always — 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always — 3627
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always — 372
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always — 67
193 Load_Cycle_Count 0x0032 096 096 000 Old_age Always — 49523
194 Temperature_Celsius 0x0022 100 100 000 Old_age Always — 36 (Min/Max 7/47)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always — 0
197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always — 272
198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline — 7
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always — 0
220 Disk_Shift 0x0002 100 100 000 Old_age Always — 0
222 Loaded_Hours 0x0032 076 076 000 Old_age Always — 9681
223 Load_Retry_Count 0x0032 100 100 000 Old_age Always — 0
224 Load_Friction 0x0022 100 100 000 Old_age Always — 0
226 Load-in_Time 0x0026 100 100 000 Old_age Always — 266
240 Head_Flying_Hours 0x0001 100 100 001 Pre-fail Offline — 0 в то же время внутренний лог говорит о фиксации 79 ошибок:
SMART Error Log Version: 1
ATA Error Count: 79 (device log contains only the most recent five errors) а вот результаты самотестирования, которые я запускал: SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Selective offline Completed: read failure 00% 10662 516606384
# 2 Selective offline Completed: read failure 00% 10662 516606376
# 3 Selective offline Completed: read failure 00% 10662 516606376
# 4 Selective offline Completed: read failure 00% 10662 516606368
# 5 Selective offline Completed: read failure 00% 10662 516606368
# 6 Selective offline Completed: read failure 00% 10661 164354232
# 7 Selective offline Completed without error 00% 10661 —
# 8 Selective offline Completed: read failure 00% 10661 102832
# 9 Selective offline Completed: read failure 00% 10660 100296
#10 Short offline Completed: read failure 00% 10660 100296
#11 Selective offline Completed without error 00% 10660 —
#12 Short offline Completed: read failure 00% 10659 100296
#13 Extended offline Completed: read failure 00% 10371 100296
#14 Extended offline Aborted by host 90% 10367 —
#15 Short offline Completed: read failure 00% 10367 100296
#16 Short offline Completed: read failure 00% 10367 100296
#17 Short offline Completed: read failure 00% 10363 100296
#18 Short offline Completed: read failure 00% 10363 100296 SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 516606384 1953525160 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing из них видно куча bad секторов, а смарт атрибуты(выше) говорят что все ок.
Что это означает, не подскажете?
Источник: losst.pro
Smartmontools
Smartmontools это программа позволяющая получить S.M.A.R.T атрибуты жёсткого диска. Расшифровка части S.M.A.R.T атрибутов приведена в статье. Для данной программы существует и графическая обёртка Gsmartcontrol.
Установка
Пакет присутствует в хранилище пакетов debian.
Для установки пакета
- в командной строке: следует выполнить команду # apt-get install smartmontools
- в графическом режиме: воспользоваться специализированной программой управления пакетами
После установки пакет необходимо настроить.
Часто используемые команды
# /etc/init.d/smartmontools start — старт демона мониторинга # smartctl -a /dev/sda — просмотр S.M.A.R.T атрибутов жёсткого диска
Настройка
Для настройки добавляем в файл конфигурации /etc/default/smartmontools:
enable_smart=»/dev/sda» # разрешение проверки диска /dev/sda start_smartd=yes # указание запускать демон при старте системы smartd_opts=»—interval=3600″ # установка периода 3600 сек.
Литература
- Настройка smartmontools
- Мониторинг состояния устройств в Linux
- Мониторинг состояния жёсткого диска при помощи smartmontools
Справочная информация
- 09.07.2010: Smartmontools: создание статьи википедии, описание установки пакета на примере debian squeeze amd64
- 16.10.2010: Smartmontools: добавлено описание расшифоровки S.M.A.R.T атрибутов жёсткого диска
Источник: tdkare.ru
Узнаём данные S.M.A.R.T. в Linux. Контроль состояния HDD или SSD
В данной статье будет рассмотрено, как можно узнать данные S.M.A.R.T. в Linux, и как эти показания соотносятся с состоянием HDD или SSD. Рассмотрен консольный и графический способы.
S.M.A.R.T. (Self-Monitoring, Analisys and Reporting Technology) — это технология, предоставляющая пользователю различные данные о текущем состоянии жесткого диска или твердотельного накопителя. Анализируя данные S.M.A.R.T., пользователь может оценить состояние своих накопителей и решить, требуют ли они замены или ещё смогут работать долго и без сбоев.
Консольный способ: smartmontools
Узнать данные S.M.A.R.T. в чистом виде нам поможет утилита под названием smartmontools .
Приведем пример установки для дистрибутивов на основе Debian:
sudo apt-get install smartmontools
Теперь мы можем вывести все данные S.M.A.R.T. командой smartctl с опцией -a и указанием анализируемого диска (напомню, что узнать о всех дисках и разделах в системе можно командой sudo fdisk -l ):
sudo smartctl -a /dev/sda
Сначала будет выведена информация о модели вашего HDD и SSD:
Model Family: Western Digital Scorpio Blue Serial ATA
Device Model: WDC WD1600BEVT-24A23T0
Serial Number: WD-WXL1A30F0711
LU WWN Device Id: 5 0014ee 2045468cf
Firmware Version: 01.01A02
User Capacity: 160 041 885 696 bytes [160 GB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: 8
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Sat Jul 7 15:13:26 2012 VOLT
SMART support is: Available — device has SMART capability.
SMART support is: Enabled
Немного ниже можно найти саму таблицу с данными S.M.A.R.T.:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always — 0
3 Spin_Up_Time 0x0027 153 148 021 Pre-fail Always — 1333
4 Start_Stop_Count 0x0032 095 095 000 Old_age Always — 5432
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always — 0
7 Seek_Error_Rate 0x002e 100 253 000 Old_age Always — 0
9 Power_On_Hours 0x0032 080 080 000 Old_age Always — 14687
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always — 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always — 0
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always — 1811
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always — 659
193 Load_Cycle_Count 0x0032 197 197 000 Old_age Always — 11891
194 Temperature_Celsius 0x0022 104 089 000 Old_age Always — 39
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always — 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always — 0
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline — 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always — 0
200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age Offline — 0
Количество атрибутов может отличаться в зависимости от модели диска.
В этой таблице нам нужно смотреть на значение поля RAW_VALUE для нужного атрибута. Именно оно показывает текущее значение атрибута.
Наиболее важные показатели:
Raw_Read_Error_Rate — количество ошибок чтения. Ненулевое значение должно сильно насторожить, а большие значение и вовсе говорят о скором выходе диска из строя. Известно, что на дисках Seagate, Samsung (семейства F1 и более новые) и Fujitsu 2,5? большое значение в этом поле является нормальным. Для остальных же дисков в идеале значение должно быть равно нулю;
Spin_Up_Time — время раскрутки диска. Измеряется в миллисекундах т.е. в моём случае это 1.3 секунды. Чем меньше — тем лучше. Большие значения говорят о низкой отзывчивости;
Start_Stop_Count — количество циклом запуска/остановки шпинделя;
Reallocated_Sector_Ct — количество перераспределённых секторов. Большое значение говорит о большом количестве ошибок диска;
Seek_Error_Rate — количество ошибок позиционирования. Большое значение говорит о плохом состоянии диска;
Power_On_Hours — количество наработанных часов во включённом состоянии. По нему можно узнать сколько проработал диск во включённом состоянии. Довольно полезно, например, если покупать ноутбук с витрины и хочется узнать долго ли он там стоял;
Power_Cycle_Count — количество включений/выключений диска;
Spin_Retry_Count — количество попыток повторной раскрутки. Большое значение говорит о плохом состоянии диска;
Temperature_Celsius — температура диска в градусах Цельсия. При слишком высокой температуре диски могут быстрее выйти из строя;
Reallocated_Event_Count — количество операций перераспределения секторов;
Offline_Uncorrectable — количество неисправных секторов. Большое значение говорит о повреждённой поверхности.
Более наглядный графический способ: gnome-disk-utility
В графическом варианте и с описанием атрибутов, данные SMART представляет программа gnome-disk-utility . В русской локализации в меню она называется как «дисковая утилита». В английской локализации известна как «Disks».
Пример установки для дистрибутивов на основе Debian:
sudo apt-get install gnome-disk-utility
Запускаем программу.
В поле «состояние диска» уже можно увидеть оценку состояния диска на основе данных S.M.A.R.T. Чтобы увидеть значение конкретных атрибутов нажимаем на кнопку «Данные SMART»:
Пример данных о SSD (Твёрдотельном накопителе):
S.M.A.R.T.:
Здесь всё понятно и наглядно. Также присутствует описание атрибутов и оценка их показаний. Проблемные значения будут выделены красным цветом.
Комментарии:
Источник: linuxnow.ru
Мониторинг жёстких дисков при помощи SMART
Так уж вышло, что диски имеют свойство умирать. Но часто выяснить причину смерти накопителя бывает очень легко. Диски современных накопителей вращаются со скоростью в несколько тысяч оборотов в минуту. При этом расстояние от головки до поверхности диска составляет доли микрона.
Часто диски круглосуточно работают в условиях повышенной загрязнённости или при неблагоприятном температурном режиме, в системах с очень высокой нагрузкой или не очень хорошим обслуживанием. Опытные пользователи хорошо знакомы с симптомами умирающего накопителя: система начинает работать нестабильно, зависает, ядро сообщает о каких-то трудно объяснимых ошибках. В большинстве случаев на восстановление утерянных данных может уйти весь день, при условии, конечно, что у вас есть резервные копии. Хотя, даже если у вас и есть копии всех важных данных, внезапный отказ жёсткого диска может показаться вам катастрофой.
В этой статье рассказывается о том, как при помощи утилиты smartctl и сервера smartd наблюдать за состоянием дисков в системе.
SMART (Self-Monitoring, Analysis and Reporting Technology) присутствует во всех современных жёстких дисках. Диски со SMART самостоятельно наблюдают за своей жизнедеятельностью и работоспособностью. Такие диски,в случае возникновения ошибок, сами могут определить, что что-то работает не так. Такая возможность в большинстве случаев поможет предотвратить сценарий «внезапного» отказа жёсткого диска. Практически все реализации SMART позволяют пользователям запускать самотестирование накопителей и просматривать значения параметров производительности и надёжности.
Smartmontools можно загрузить с сайта проекта или найти в репозитарии своего дистрибутива.
Чтобы понять принципы работы smartmontools, полезно будет ознакомиться с историей создания и развития SMART. Первая спецификация SMART (SFF-8035i) была разработана группой производителей жёстких дисков.
Во второй редакции (апрель 1996-го) диски хранили во внутреннем списке до 30-ти атрибутов, отражавших состояния различных параметров производительности и надёжности, таких как количество ошибок чтения и поиска. Каждый атрибут имеет однобайтовое нормализованное значение в диапазоне от 1 до 253 и соответствующий однобайтовое пороговое значение. Если одно или более нормализованных значений атрибутов меньше или равны соответствующим пороговым, значит, вероятно, в ближайшие 24 часа жёсткий диск выйдет из строя или же истекает срок его службы, заявленный производителем. Значения некоторых атрибутов обновляются в процессе работы диска, а некоторые — лишь в процессе оффлайн-тестов, которые приостанавливают на время операции чтения вывода, и по этой причине запускаются при помощи специальных команд.
Начиная со стандарта ATA-4 введено требование удалить внутреннюю таблицу атрибутов. Вместо неё жёсткий диск должен отвечать на запросы о его состоянии ответами OK или NOT OK. Отрицательный ответ на запрос означает, что микропрограмма жёсткого диска определила, что тот скоро выйдет из строя. В стандарте ATA-5 было добавлено ведение протокола ошибок, а также набор команд для запуска самотестирования диска. Для того, чтобы воспользоваться всеми описанными возможностями, вам нужно знать, как при помощи smartmontools получать значения атрибутов SMART (большинство жёстких дисков имеют обратную совместимость с SFF-8035i), узнавать состояние диска, запускать самотестирование и анализировать протокол его работы (результаты последних 21 теста) и анализировать протокол ATA-ошибок жёсткого диска (информация о пяти последних ошибках).
smartctl
# smartctl -a /dev/sda
В приведённой вехрней части вывода команды smartctl -a приведена информация о модели и прошивке жесткого диска, в этом примере -Hitachi HTS . Smartmontools имеет собственную базу данных типов дисков. Если модель вашего накопителя присутствует в БД, то вы сможете правильно интерпретировать значения атрибутов SMART.
# sudo smartctl -a /dev/sda Password: smartctl 5.40 2010-10-16 r3189 [i486-slackware-linux-gnu] (local build) Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net === START OF INFORMATION SECTION === Model Family: Hitachi Travelstar 5K250 Device Model: Hitachi HTS542525K9SA00 Serial Number: 080601BB3F00WDDZUMAF Firmware Version: BBFOC3BP User Capacity: 250*059*350*016 bytes Device is: In smartctl database [for details use: -P show] ATA Version is: 8 ATA Standard is: ATA-8-ACS revision 3f Local Time is: Tue Apr 19 00:09:24 2011 MSD SMART support is: Available — device has SMART capability. SMART support is: Enabled
Далее отображаются поддерживаемые возможности вашего накопителя, а также примерное время выполнения различных вариантов самотестирования.
=== START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 645) seconds. Offline data collection capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. No Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 107) minutes. SCT capabilities: (0x003d) SCT Status supported. SCT Error Recovery Control supported. SCT Feature Control supported.
SCT Data Table supported.
Ниже отображаются результаты опроса состояния «здоровья» диска. В этом примере показан диск, который успешно прошёл тест. Если в вашем случае первая строка будет содержать результат FAILING — немедленно сделайте резервные копии всех нужных данных!
Показаны значения 19-ти атрибутов SMART (максимум их может быть 255). Имейте ввиду, что атрибуты SMART не являются частью стандарта ATA, хотя многие производители и используют их. Несмотря на то, что SFF-8035i не определяет, как правильно интерпретировать каждый атрибут, многие из них имеют де-факто соответствуют определённым параметрам.
В приводимом примере 14-й атрибут (ID #194) отражает внутреннюю температуру диска.
- Old_age — время жизни устройства достигло предела, определённого производителем;
- Pre-fail- ожидается выход устройства из строя.
=== START OF READ SMART DATA SECTION === SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000b 100 100 062 Pre-fail Always — 0 2 Throughput_Performance 0x0005 100 100 040 Pre-fail Offline — 0 3 Spin_Up_Time 0x0007 234 234 033 Pre-fail Always — 1 4 Start_Stop_Count 0x0012 099 099 000 Old_age Always — 2105 5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always — 0 7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always — 0 8 Seek_Time_Performance 0x0005 100 100 040 Pre-fail Offline — 0 9 Power_On_Hours 0x0012 082 082 000 Old_age Always — 7952 10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always — 0 12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always — 1844 191 G-Sense_Error_Rate 0x000a 100 100 000 Old_age Always — 0 192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always — 67 193 Load_Cycle_Count 0x0012 092 092 000 Old_age Always — 83444 194 Temperature_Celsius 0x0002 137 137 000 Old_age Always — 40 (Min/Max 15/50) 196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always — 1 197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always — 0 198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline — 0 199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always — 0 223 Load_Retry_Count 0x000a 100 100 000 Old_age Always — 0 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 No self-tests have been logged. [To run self-tests, use: smartctl -t] SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.
При помощи команды smartctl -l error /dev/sda можно просмотреть протокол ошибок диска. Если ошибки отсутствуют, то, естественно, протокол ошибок будет пустым. Обычно волноваться стоит лишь в том случае, когда количество ошибок в протоколе будет значительным, поскольку часто возникают случайные, незначительные ошибки в работе, которые не представляют особой серьёзности.
Ниже представлен вывод команды:
# smartctl -l selftest /dev/sda
запускающей механизмы самотестирования диска.
SMART Self-test log, version number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended off-line Completed 00% 3525 — # 2 Extended off-line Completed 00% 3357 — # 3 Short off-line Completed 00% 3059 —
- LifeTime отображается время, относительно момента включения питания диска, когда был запущен тест
- LBA_of_first_error отображает логический адрес блока, в котором обнаружена ошибка.
- Remaining отображает количество процентов, оставшееся до завершения.
- smartctl -t short /dev/sda быстрое тестирование, занимает около 2 минут
- smartctl -t long /dev/sda более тщательное тестирование, занимает около 1 часа.
При помощи команды smartctl -t offline можно запустить оффлайн-тестирование.
Демон smartd
Конечно же, вы можете регулярно самостоятельно вручную отслеживать состояние дисков при помощи smartctl, однако это довольно нудное и утомительное занятие.
В пакете smartmontools имеется демон smartd, который умеет выполнять всю рутину по регулярной проверке состояния дисков. Этот демон отслеживает SMART-данные дисков и обнаруживает ошибки.
smartd может быть сконфигурирован таким образом, чтобы запускать определённые сценарии оболочки, а также отсылать уведомления на e-mail администраторам в случае обнаружения ошибок. По умолчанию, когда smartd запускается, он регистрирует диски, находящиеся в системе и затем опрашивает SMART дисков каждые 30 минут на предмет ошибок в значениях атрибутов, состояний, результатов самотестирования или увеличения количества ATA-ошибок.
По умолчанию все найденные ошибки протоколируются в /var/log/messages через syslog.
Управлять настройкой smartd можно при помощи файла конфигурации /etc/smartd.conf. Содержимое этого файла считывается smartd в момент его запуска. Каждая строка содержит директивы, относящиеся к одному диску. Конфигурационные файлы выглядят так:
В первом поле определяется путь к устройству. Директива -o on включает автоматический запуск оффлайн-тестов, а директива -S on включает функцию автоматического сохранения значений атрибутов. Директива -m совместно с e-mail адресом указывает smartd адрес для отсылки уведомлений о найденных ошибках.
Директива -a заставляет smartd наблюдать за всеми доступными SMART-параметрами дисков. В приведённом примере конфигурации smartd будет протоколировать все изменения нормализованных значений атрибутов. Директива -I 194 указывает smartd игнорировать изменения значения атрибута #194, поскольку температура жёсткого диска довольно часто изменяется, а наличие в протоколе кучи сообщений об этом лишь будет мешать.
Обычно smartd запускается при помощи традиционного UNIX-механизма init. Например, в RedHat для запуска и останова smartd используются команды /etc/rc.d/init.d/smartd start и /etc/rc.d/init.d/smartd stop.
Источник: housecomputer.ru