Как узнать состояние жесткого диска: сколько он еще прослужит. Технология S.M.A.R.T

Маленький рассказ об S.M.A.R.T. атрибутах, их важности и понимании. В статье пойдет речь об расшифровке всех smart атрибутов ATA дисков. В предыдущих статьях речь шла об и . Теперь хочу немного описать атрибуты обычных АТА дисков на примере Seagate Barracuda ES.2 (ST31000340NS). Так же определим самые важные атрибуты, на которые нужно обращать внимание при мониторинге дисков используя smartctl. Для начала, можно убедиться, что наш диск поддерживает смарт

Root@ s01:~# smartctl -i /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF INFORMATION SECTION === Model Family: Seagate Barracuda ES.2 Device Model: ST31000340NS Serial Number: 9QJ2ADVC … ATA Version is: 8 ATA Standard is: ATA-8-ACS revision 4 Local Time is: Fri Feb 21 16:18:35 2014 CET … SMART support is: Available - device has SMART capability. SMART support is: Enabled

Две последние строки свидетельствуют о том, что диск поддерживает smart и можно посмотреть значение всех его атрибутов и их интерпретация будет корректной(интерпретация RAW_VALUE) . В данном случаи тип интерфейса (устройства) не указывался явно (не было указанно атрибут «-d»), по этому smartctl автоматически определил тип устройства и сказал, что «SMART support is: Enabled». Но если используются, к примеру массивы дисков (RAID контроллер), то smartctl может сказать, что смарт не поддерживается:

Root@s06:~# smartctl -i /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net Vendor: SMC Product: SMC2108 Revision: 2.90 User Capacity: 2,996,997,980,160 bytes Logical block size: 512 bytes Logical Unit id: 0xSerial number: Device type: disk Local Time is: Fri Feb 21 17:32:27 2014 IST Device does not support SMART

Но на самом деле, нужно просто знать (или подбирать) какие дисковые массивы используются, и тогда можно получить желаемый результат явно указав тип устройства:

Root@s06:~# smartctl -d megaraid,14 -i /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net Vendor: SEAGATE Product: ST1000NM0001 Revision: 0002 User Capacity: 1,000,204,886,016 bytes Logical block size: 512 bytes Logical Unit id: 0x5000c50041080343 Serial number: Z1N0TV980000C2157TYR Device type: disk Transport protocol: SAS Local Time is: Fri Feb 21 17:34:45 2014 IST Device supports SMART and is Enabled Temperature Warning Enabled

Также может быть проблема в версии smartctl ибо не все жесткие диски добавляются в базу SMART сразу после выхода в мир нового HDD или RAID контроллера. Или же в BIOS отключено поддержку (нужно включить). Так же может быть проблема в прошивке (firmware) самого жесткого диска. Можете также стоит для начала попытаться включить SMART командой:

Root@s01:~# smartctl -s on /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF ENABLE/DISABLE COMMANDS SECTION === SMART Enabled.

Следующая, интересующая нас часть вывода покажет суммарный результат проверки статуса здоровья диска (Если не Passed – нужно проводить замену диска). Так же выводится дополнительные характеристики диска и предполагаемое время выполнения коротких и длинных тестов.

Root@s01:~# smartctl -Hc /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x82) Offline data collection activity was completed without error. Auto Offline Data Collection: Enabled. Self-test execution status: (41) The self-test routine was interrupted by the host with a hard or soft reset. Total time to complete Offline data collection: (634) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: (1) minutes. Extended self-test routine recommended polling time: (226) minutes. Conveyance self-test routine recommended polling time: (2) minutes. SCT capabilities: (0x003d) SCT Status supported. SCT Error Recovery Control supported. SCT Feature Control supported. SCT Data Table supported.

В нашем случаи тип устройства определился автоматически и теперь можно вывести самое интересное — список атрибутов.

Root@s01:~# smartctl -A /dev/sda smartctl 5.41 2011-06-09 r3365 (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 068 059 044 Pre-fail Always - 130449727 3 Spin_Up_Time 0x0003 099 099 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 23 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 4 7 Seek_Error_Rate 0x000f 063 039 030 Pre-fail Always - 549998464474 9 Power_On_Hours 0x0032 052 052 000 Old_age Always - 42335 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 037 020 Old_age Always - 63 184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 188 Command_Timeout 0x0032 100 093 000 Old_age Always - 4295032870 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 076 049 045 Old_age Always - 24 (Min/Max 18/26) 194 Temperature_Celsius 0x0022 024 051 000 Old_age Always - 24 (0 17 0 0) 195 Hardware_ECC_Recovered 0x001a 041 021 000 Old_age Always - 130449727 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0

Используя SMART можно предугадать с довольно большой вероятностью проблемы связанные с:

  • Магнитными головками диска
  • Физическими повреждениями диска
  • Логическими ошибками
  • Механическими проблемами (проблемы привода, системы позиционирования)
  • Подачей питания (платы)
  • Температурой

Расшифруем полученный вывод.


Каждый атрибут имеет группу значений:

  • ID# — идентификационный номер атрибуты (детали ). Каждый атрибуты имеет свой уникальный ID, который должен быть одинаковым для всех фирм производителей дисков.
  • ATTRIBUTE_NAME – название атрибута. Так как разные фирмы производители дисков могут называть атрибуты по своему (сокращать, синонимы), лучше всего ориентироваться по ID атрибута.
  • FLAG (Status flag) – каждый атрибут имеет определенный флаг, назначенный фирмой разработчиком диска. В ОС с графическим интерфейсом значения этого флага предоставляется в виде набора буквенных обозначений – w,p,r,c,o,s (расшифровка ниже). И эти наборы предоставляются в виде шестнадцатеричного числа которые вы видели выше.
  1. W arranty: Указывает на жизненно важный атрибут диска и покрывается гарантией. Если этот флаг установлен и значение атрибута с этим флагом достигнет порогового (threshold) значения, в то время, когда диск еще на гарантии, то фирма должна будет заменить диск бесплатно.
  2. P erformance: Указывает на атрибут, который представляет показатель производительности диска – не критический.
  3. Error R ate: Атрибут с частотой ошибок.
  4. C ount of occurrences: Атрибут-счетчик происшествий.
  5. O nline test: Атрибут, который обновляет значения только через on-line тесты. Если не указан, то обновляется через off-line тесты.
  6. S elf preserving: Указывает на атрибут который может собирать и сохранять данные о диска, даже если S.M.A.R.T. отключен.
  • Value – Текущее значение атрибута(оценка атрибута диска на основе Raw_value). Низкое значение говорит о быстрой деградации диска или о возможном скором сбое. т.е. чем выше значение Value атрибута, тем лучше. Это значение атрибута нужно сравнивать с пороговым (threshold) значением. Если это критический атрибут и значение ниже порогового — нужно проводить замену диска.
  • Worst – Самое низкое значение атрибута за жизненный цикл диска. Значение может изменяться на протяжении жизни диска, и не должно быть ниже или равным пороговому значению (threshold).
  • Thresh (Threshold) – Пороговое значения атрибута назначенное создателем диска. Значение не меняется за жизненный цикл диска. Если значение Value атрибута станет равным или меньше порогового – появиться уведомление в колонке WHEN_FAILED. И диск нужно заменить.
  • Type – тип атрибута. Может быть критическим (pre-fail), который указывает на предстоящий отказ диска из-за ошибок или не критический, указывающий на достижение конца жизненного цикла диска.
  • Raw_value – Объективное значения атрибута, которое показывается в десятичном формате (вычисляется firmware диска) и известных только производителю единицах (имеет связь с Value, Threshold и Worst значениями).
  • WHEN_FAILED – Указывает на проблемы с атрибутом.

Атрибут диска примет значение failed, в случаи:

Value = f(Raw_value ) <= Threshold

  • f(Raw_value) – функция вычисления деградации (уменьшения) значения параметра Value в зависимости от значения Raw_value.

Недостатки такого подхода к вычислению деградации диска:

  • Для каждого производителя дисков и даже модели диска функция f(Raw_value) вычисляется по-разному.
  • Оценка каждого атрибута подсчитывается независимо друг от друга – т.е. игнорируются связи между атрибутами.

Теперь хочу представить таблицу с перечисленными всех атрибутов. Те атрибуты, которые выделены розовым — относятся к атрибутам критическим. К тому же, указано тип параметра в зависимости от величины значения. Т.е. чем больше значение параметра, тем лучше состояние здоровья диска или наоборот.

Теперь приступим к атрибутам:

#ID HEX Имя атрибута Лучше если… Описание
01 01 Raw Read Error Rate Частота ошибок при чтении данных с жёсткого диска. Происхождение их обусловлено аппаратной частью винчестера.
02 02 Throughput Performance Общая производительность накопителя. Если значение атрибута уменьшается перманентно, то велика вероятность проблем с винчестером.
03 03 Spin-Up Time Время раскрутки шпинделя из состояния покоя (0 rpm) до рабочей скорости. В поле Raw_value содержится время в миллисекундах/секундах в зависимости от производителя
04 04 Start/Stop Count * Полное число запусков, остановок шпинделя. Иногда в том числе количество включений режима энергосбережения. В поле raw value хранится общее количество запусков/остановок жёсткого диска.
05 05 Reallocated Sectors Count Число операций переназначения секторов. При обнаружении повреждённого сектора на винчестере, информация из него помечается и переносится в специально отведённую зону, происходит утилизация bad блоков, с последующим консервированием этих мест на диске. Этот процесс называют remapping. Чем больше значение Reallocated Sectors Count, тем хуже состояние поверхности дисков - физический износ поверхности. Поле raw value содержит общее количество переназначенных секторов.
07 07 Seek Error Rate Частота ошибок при позиционировании блока магнитных головок. Чем больше значение, тем хуже состояние механики, или поверхности жёсткого диска.
08 08 Seek Time Performance Средняя производительность операции позиционирования. Если значение атрибута уменьшается, то велика вероятность проблем с механической частью.
09 09 Power-On Hours (POH) Время, проведённое устройством, во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ.
10 0A Spin-Up Retry Count Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной.
11 0B Recalibration Retries Количество повторов рекалибровки в случае, если первая попытка была неудачной.
12 0C Device Power Cycle Count Число циклов включения-выключения винчестера.
13 0D Soft Read Error Rate Число ошибок при чтении, по вине программного обеспечения, которые не поддались исправлению.
187 BB Reported UNC Errors Неустранимые аппаратные ошибки.
190 BE Airflow Temperature Температура воздуха внутри корпуса жёсткого диска. Целое значение, либо значение по формуле 100 - Airflow Temperature
191 BF G-sense error rate Количество ошибок, возникающих в результате ударов.
192 C0 Power-off retract count Число циклов аварийных выключений.
193 C1 Load/Unload Cycle Количество циклов перемещения блока головок в парковочную зону.
194 C2 HDA temperature Показания встроенного термодатчика накопителя.
195 C3 Hardware ECC Recovered Число коррекции ошибок аппаратной частью диска (ошибок чтения, ошибок позиционирования, ошибок передачи по внешнему интерфейсу).
196 C4 Reallocation Event Count Число операций переназначения в резервную область, успешные и неудавшиеся попытки.
197 C5 Current Pending Sector Count Число секторов- кандидатов на перенос в резервную зону. Помечены как не надёжные. При последующих корректных операциях атрибут может быть снят.
198 C6 Uncorrectable Sector Count Число некорректируемых ошибок при обращении к сектору.
199 C7 UltraDMA CRC Error Count Число ошибок при передаче данных по внешнему интерфейсу.
200 C8 Write Error Rate / Multi-Zone Error Rate Общее количество ошибок при заполнения сектора информацией. Показатель качества накопителя.
201 C9 Soft read error rate Частота появления «программных» ошибок при чтении данных с диска, а не аппаратной части HDD.
202 Ca Data Address Mark errors Число ошибок адресно помеченной информации (Data Address Mark (DAM)).Если автоматически не корректируется - заменить устройство.
203 CB Run out cancel Количество ошибок ECC данных, присоединяемые к передаваемому сигналу, позволяющие принимающей стороне определить факт сбоя или исправить несущественную ошибку.
204 CC Soft ECC correction Количество ошибок ECC, скорректированных программным способом.
205 CD Thermal asperity rate (TAR) Число ошибок в следствии температурных колебаний.
206 CE Flying height * Высота между головкой и поверхностью диска компьютера.
209 D1 Offline seek performance * Drive’s seek performance during offline operations.
220 DC Disk Shift Дистанция смещения блока дисков относительно шпинделя. В основном возникает из-за удара или падения.
221 DD G-Sense Error Rate Число ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного crash датчика.
222 DE Loaded Hours * Время, проведённое блоком магнитных головок между выгрузкой из парковочной области в рабочую область диска и загрузкой блока обратно в парковочную область.
223 DF Load/Unload Retry Count * Количество новых попыток выгрузок/загрузок блока магнитных головок винчестера в/из парковочной области после неудачной попытки.
224 E0 Load Friction Величина силы трения блока магнитных головок при его выгрузке из парковочной области.
225 E1 Load Cycle Count Число циклов вход-выход в парковочную зону.
226 E2 Load ‘In’-time * Время, за которое привод выгружает магнитные головки из парковочной области на рабочую поверхность диска.
227 E3 Torque Amplification Count Количество попыток скомпенсировать вращающий момент.
228 E4 Power-Off Retract Cycle Количество повторов автоматической парковки блока магнитных головок в результате выключения питания.
230 E6 GMR Head Amplitude * Амплитуда «дрожания» (расстояние повторяющегося перемещения блока магнитных головок).
231 E7 Temperature Температура жёсткого диска.
240 F0 Head flying hours * Время позиционирования головки.
250 FA Read error retry rate Число ошибок во время чтения жёсткого диска.

Атрибуты дисков нужно смотреть в целом и самостоятельно прогнозировать замену, не только опираясь на smart атрибуты. Нужно дополнительно проводить тесты на бедблоки и запускать fscheck и smart тесты, о которых пойдет речь в следующих статьях.

Здравствуйте.

Предупрежден - значит вооружен! Это правило как нельзя кстати подходит к работе с жесткими дисками. Если заранее знать, что такой-то вот жесткий диск скорее всего выйдет из строя - то риск потери данных будет минимален.

Конечно, 100% гарантию не даст никто, но с высокой долей вероятности некоторые программы могут проанализировать показания S.M.A.R.T. (набор программно-аппаратных средств, следящих за состоянием жесткого диска) и сделать выводы по тому, сколько он еще прослужит.

Вообще, для осуществления такой проверки жесткого диска есть десятки программ, но в этой статье я хотел остановиться на одних из самых наглядных и простых для использования. И так…

Как узнать состояние жесткого диска

HDDlife

(Кстати, помимо HDD, поддерживает так же и SSD диски)

Одна из лучших программ для постоянного мониторинга состояния жесткого диска. Поможет вовремя распознать угрозу и заменить винчестер. Больше всего она подкупает своей наглядностью: после запуска и анализа, HDDlife представляет отчет в очень удобном виде: вам показывается в процентном соотношение «здоровье» диска и его производительность (самый лучший показатель, разумеется, это 100%).

Если ваши показатели выше 70% - это говорит о хорошем состоянии ваших дисков. Например, после пары лет работы (довольно активной кстати), программа проанализировала и сделала вывод: что данный жесткий диск здоров примерно на 92% (а это значит, что прослужить он должен, если не произойдет форс-мажора, как минимум еще столько же).

После запуска, программа сворачивается в трей рядом с часами и вы всегда можете контролировать состояние своего жесткого диска. При обнаружение какой-либо проблемы (например, высокая температура диска, или осталось слишком мало места на винчестере), программа оповестит вас всплывающим окном. Пример ниже.

Оповещение HDDLIFE о том, что заканчивается место на жестком диске. Windows 8.1.

Если же программа проанализирует и выдаст вам окно как на скриншоте ниже - советую вам не медлить с резервной копией (и заменой HDD).

HDDLIFE - данные на жестком диске в опасности, чем быстрее скопируете их на другие носители - тем лучше!

Hard Disk Sentinel

Эта утилита может поспорить с HDDlife - она так же хорошо ведет мониторинг состояние диска. Что больше всего подкупает в этой программе - это ее информативность, одновременно с простотой для работы. Т.е. она будет полезна, как начинающему пользователю, так и уже достаточно опытному.

После запуска Hard Disk Sentinel и анализа системы, вы увидите главное окно программы: слева будут представлены жесткие диски (в том числе и внешние HDD), а справа в окне будет отображаться их состояние.

Кстати, довольно интересная функция, по прогнозированию работоспособности диска, по тому, сколько он еще прослужит вам: например, на скриншоте ниже прогноз составляет более 1000 дней (это около 3-х лет!).

Состояние жёсткого диска ОТЛИЧНОЕ. Проблемные или слабые сектора не найдены. Ошибок набора оборотов или передачи данных не обнаружено.
Никаких действий предпринимать не надо.

Кстати, в программе реализована достаточно полезная функция: вы сами можете задать порог критической температуры жесткого диска, при достижении которой, Hard Disk Sentinel оповестит вас о превышении!

Hard Disk Sentinel: температура диска (в том числе и максимальная за все время использования диска).

Ashampoo HDD Control

Отличная утилита для контроля состояния жестких дисков. Встроенный в программу монитор позволяет заблаговременно узнать о появлении первых проблем с диском (кстати, программа может оповестить вас об этом даже по электронной почте).

Так же, помимо основных функций, в программу встроены ряд вспомогательных:

Дефрагментация диска;

Тестирование;

Очистка диска от мусора и временных файлов (всегда актуально);

Удаление истории посещений сайтов в интернете (полезно, если за компьютером вы сидите не одни и не хотите чтобы кто-то знал, чем вы занимаетесь);

Так же есть встроенные утилиты для снижения уровня шума диска, настройки питания и пр.

Скриншот окна Ashampoo HDD Control 2: с жестким диском все в порядке, состояние 99%, производительность 100%, температура 41 гр. (желательно, чтобы температура была менее 40 гр., но программа считает, что для данной модели диска все в порядке).

Кстати, программа полностью на русском языке, интуитивно продумана - разберется даже начинающий пользователь ПК. Особое внимание обратите на показатели температуры и состояния в главном окне программы. Если программа выдает ошибки или состояние оценивается как крайне-низкое (+ к тому же издается скрежет или шум из HDD) - рекомендую первым делом скопировать все данные на другие носители, а затем начать разбираться с диском.

Hard Drive Inspector

Отличительной чертой этой программы является:

1. Минимализм и простота: в программе нет ничего лишнего. Она выдает три показателя в процентном соотношении: надежность, производительность и отсутствие ошибок;

Hard Drive Inspector - мониторинг состояния винчестера.

СrystalDiskInfo

Простая, но зато надежная утилита для контроля за состоянием жестких дисков. Причем, она работает даже в тех случаях, когда многие другие утилиты отказываются, вылетая с ошибками.

Программа поддерживает несколько языков, не изобилует настройками, выполнена в стиле минимализма. Вместе с тем, в ней есть достаточно редкие функции, например, снижения уровня шума диска, контроль за температурой и пр.

Что еще очень удобно - так это графическое отображение ситуации:

Синий цвет (как на скриншоте ниже): все в порядке;

Желтый цвет: тревога, нужно предпринимать меры;

Красный: нужно принимать безотлагательные меры (если еще успеете);

Серый: программа не сумела определиться с показаниями.

CrystalDiskInfo 2.7.0 - скриншот главного окна программы.

HD Tune

Эта программа пригодится более опытным пользователям: которым помимо графического отображения «здоровья» диска, нужны еще и качественные тесты диска, в которых можно детально ознакомиться со всеми характеристиками и параметрами. Так же нельзя не отметить, что программа, помимо HDD, поддерживает и новомодные SSD диски.

Довольно интересную возможность HD Tune предлагает для того, чтобы быстро проверить диск на ошибки: диск на 500 ГБ проверяется примерно за 2-3 минуты!

HD TUNE: быстрый поиск ошибок на диске. На новом диске недопустимы красные «квадратики».

Так же весьма нужная информация - это проверка скорости чтения и записи диска.

HD Tune - проверка скорости работы диска.

Ну и нельзя не отметить вкладку с детальной информацией о HDD. Это бывает полезно, когда необходимо узнать, например, поддерживаемые функции, размер буфера/кластера или скорость вращения диска и пр.

HD Tune - детальная информация о жестком диске.

В общем-то, подобных утилит можно привести, как минимум, еще столько же. Думаю, что и этих большинству хватит более чем…

И последнее: не забывайте делать резервные копии, даже если состояние диска оценивается как отличное в 100% (хотя бы самые важные и ценные данные)!

Удачной работы…

Привет, друзья! Один хороший человек попросил посмотреть его жесткий диск. Диск емкостью 500 Гб, Seagate, выкидывать такой жалко. Система стала жутко тормозить. Позже Windows перестала с него нормально загружаться, запуск долгий, автоматическое восстановление при загрузке результатов не давало. Появились равномерные стуки. Они хорошо ощущаются, если приложить ладонь (очень мощный инструмент для анализа всего и вся 🙂 🙂 🙂).

Проверять диск средствами Windows уже не стал — система не запускается. По возможности, друг попросил сохранить данные и спасти диск. Сегодня поделюсь опытом на эту тему. Сегодня Вы узнаете:

Как проверить SMART жесткого диска с помощью программы Виктория

Обычно самую объективную информацию о состоянии можно получить и без тестирования поверхности — достаточно получить данные с системы S.M.A.R.T жесткого диска. По этим данным можно сразу сказать — есть ли смысл начинать исправлять ошибки поверхности или нет. А так же оценить общее состояние устройства, сколько оно может еще проработать.

Для того, чтобы протестировать диск, его было решено подключить к компьютеру через дополнительный шлейф в одно из гнезд на материнской плате. Перезагружаем компьютер и запустим программу Victoria 4.47 для Windows от имени Администратора, проанализируем S.M.A.R.T

C 1995 года жесткие диски для компьютера выпускаются со встроенной системой самоконтроля состояния (S.M.A.R.T), Диск в своих микросхемах после первого включения накапливает информацию о количестве проработанных часов, накопленных ошибках, температурном режиме, скорости с которой вращается блин, количестве сбойных секторов, ошибках чтения /записи. Современные жесткие диски даже оснащены собственным акселерометром — для накапливания информации об ударах, резких толчках. Эта информация представлена в виде небольшой таблицы, на которой мы видим в графическом представлении общее состояние нашего диска. Первое что нужно сделать при диагностике — это проверить S.M.A.R.T . Запустим программу:

Для того, чтобы оценить общее состояние диска, нужно выбрать сначала нужный диск из списка слева (номер диска обычно на корпусе у меня нужный диск SN5VM3HMX9 ).Запустим программу и перейдем на вкладку SMART:

Чтобы получить данные жмем на кнопку GET SMART (получить смарт):

Обращаем внимание на столбец health (здоровье), на столбец Name (имя атрибута). По традиции разработчик программы обозначил имена жизненно-важных параметров диска зеленым шрифтом. Так же по псеводграфическим шкалам визуально оценивается и общее состояние в графе health . Зеленый цвет — хорошо, желтый плохо. Красный — очень плохо. Пролистываем ниже:

Программа выдала у этого диска хороший «смарт». Но это не так. Я бы сказал, что S.M.A.R.T программа вернула, и это уже хорошо, потому что в запущенных случаях он вообще может не считывается. С этого диска СМАРТ считывался 23 секунды — это очень долго. Давайте разбираться, почему. Для начала нужно понять, что означают все эти характеристики, особенно выделенные зеленым цветом.

  1. Параметр ID1 RaW read error rate .Частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска. Для всех дисков Seagate, Samsung это - число внутренних коррекций данных, проведенных до выдачи в интерфейс, следовательно, на пугающе огромные цифры можно реагировать спокойно.
  2. Параметр ID3 Spin Up Time. Время раскрутки пакета дисков из состояния покоя до рабочей скорости. Растет при износе механики (повышенное трение в подшипнике и т. п.), также может свидетельствовать о некачественном питании (например, просадке напряжения при старте диска).
  3. Параметр ID4 Start/Stop Count - Полное число циклов запуск-остановка шпинделя. У дисков некоторых производителей (например, Seagate) - счётчик включения режима энергосбережения. В поле raw value хранится общее количество запусков/остановок диска.
  4. Параметр ID 5 Reallocated Sectors Count - самый важный для нас параметр. Число операций переназначения секторов. Когда диск обнаруживает ошибку чтения/записи, он помечает сектор «переназначенным» и переносит данные в специально отведённую резервную область. Вот почему на современных жёстких дисках нельзя увидеть bad-блоки - все они спрятаны в переназначенных секторах. Этот процесс называют remapping, а переназначенный сектор - remap . Чем больше значение, тем хуже состояние поверхности дисков. Поле raw value содержит общее количество переназначенных секторов. Рост значения этого атрибута может свидетельствовать об ухудшении состояния поверхности блинов диска.
  5. Параметр ID 7 Seek Error Rate - Частота ошибок при позиционировании блока магнитных головок. Чем их больше, тем хуже состояние механики и/или поверхности жёсткого диска. Также на значение параметра может повлиять перегрев и внешние вибрации (например, от соседних дисков в корзине ).
  6. Параметр ID 9 Power-On Hours (POH) .Число часов (минут, секунд - в зависимости от производителя), проведённых во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ (MTBF - mean time between failure).
  7. Параметр ID 10 Pin Up Retry Count . Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной. Если значение атрибута увеличивается, то велика вероятность неполадок с механической частью.

  1. Параметр ID 12 Device Power Cycle Count . Количество полных циклов включения-выключения диска.
  2. Параметр ID 184 End-to-End error . Данный атрибут - часть технологии HP SMART IV, это означает, что после передачи через кэш памяти буфера данных паритет данных между хостом и жестким диском не совпадают.
  3. Параметр ID 187 Reported UNC Errors. Ошибки, которые не могли быть восстановлены, используя методы устранения ошибки аппаратными средствами.
  4. Параметр ID 188 Command Timeout. Содержит количество операций, выполнение которых было отменено из–за превышения максимально допустимого времени ожидания отклика.Такие ошибки могут возникать из-за плохого качества кабелей, контактов, используемых переходников, удлинителей и т.д., несовместимости диска с конкретным контроллером SATA/РАТА на материнской плате и т.д. Из-за ошибок такого рода возможны BSOD в Windows.
    Ненулевое значение атрибута говорит о потенциальной «болезни» диска.
  5. Параметр ID 189 High Fly Writes. Содержит количество зафиксированных случаев записи при высоте «полета» головки выше рассчитанной, скорее всего, из-за внешних воздействий, например, вибрации. Для того, чтобы сказать, почему происходят такие случаи, нужно уметь анализировать логи S.M.A.R.T., которые содержат специфичную для каждого производителя информацию;
  6. Параметр ID 190 Температура воздуха внутри корпуса жёсткого диска . Для дисков Seagate рассчитывается по формуле (100 - HDA temperature). Для дисков Western Digital - (125 - HDA).
  7. Параметр ID 195 hardware ecc recovered. Содержит количество ошибок, которые были скорректированы аппаратными средствами ECC диска.

Обратил внимание, что после подключения этого диска к компьютеру система стала долго грузиться, и гораздо медленнее работать. Типичные симптомы для «битого жизнью» жесткого диска.

  • Параметр здоровье уже «среднее», очень много ошибок, долго работал;
  • Параметр здоровье «среднее» ошибок мало, механика не изношена;
  • Параметр

    Большое количество ошибок, здоровье, критическое. Магнитные головки уже возможно изношены, плохо работают;

    Параметр так же на критическом уровне, много ошибок;

  • Параметр на критическом уровне, много ошибок.
  • Поверхность этого диска не содержит много битых секторов, но что-то вызвало сбои. Может быть умирает потихоньку механика магнитных головок. Попробуем пробежаться тестами и посмотрим, как измениться S.M.A.R.T. после тестирования Запускаем сканирование из под DOC, версию 3,5.

    Как вылечить жесткий диск программой Виктория версии 3.5?

    Мы уже говорили, что сегодня самый важный для нас параметр в S.M.A.R.T — это количество переназначенных секторов. Когда сектор становится битым (Bad blok) программа Victoria этот сектор на диске находит, вычисляет его координаты и помечает как сбойный. Обращения к этом сектору больше не происходит — система его больше не видит. И тормозов нет. А в SMART записывается соответствующая информация. На этом принципе основана работа программы.

    Но количество резервных адресов не бесконечно, поэтому в тот момент, когда они израсходованы полностью, диск вылечить уже будет нельзя — нужно будет успеть скопировать с него важную информацию, пока это возможно. В нашем случае количество секторов еще не израсходовано. После запуска программа выглядит так:

    Сначала нужно выбрать диск, который мы будем проверять. Для этого на клавиатуре нажимаем клавишу P (английский алфавит) :

    Наш диск висит на третьем канале, соответственно мы с клавиатуры вводим цифру «3 » и нажимаем «Enter «. После этого программа поймет, какой диск Вы выбрали, и с ним можно будет работать. Внизу экрана есть список команд. Если нажать F9, мы вызовем тот же S.M.AR.T.:

    Некоторые показатели отличаются от предыдущих, но атрибут ID7 выглядит так же. Графическое отображение здоровья так же отличается, но можно разобраться — где мало зеленых квадратов, там дела плохи. Идем дальше. Так как SMART этого диска сказал нам, что он не надежен, использовать его для установки Windows я уже не буду. И с этого диска я уже заранее скопировал нужную информацию, для того чтобы ее не потерять в процессе. Попытаемся вылечить диск, насколько это возможно. Нажимаем клавишу F4, вызовем окно настроек сканирования:

    Третья строчка сверху -это режим сканирования. Линейное чтение — самое быстрое по времени. Сканирование происходит последовательно — начиная с первого сектора и заканчивается последним. Выбор режима осуществляется нажатием стрелок «вправо» и «влево» на клавиатуре. Четвертая строчка — это выбор метода лечения жесткого диска. В данном случае я выбрал стирание информации с поврежденных блоков сразу с 256 секторов. В эти сектора будут записаны нули и сектор перестанет быть сбойным.

    Внимание! В программе все операции с бад -блоками, ведущими к потере данных, обозначаются в меню красным цветом. Данные этих секторов будут безвозвратно потеряны. Делать это нужно в случае, если данные с диска заранее скопированы и требуется оценить степень повреждения блоков. Будьте осторожны!!

    Для запуска проверки нажимаем CTRL+ENTER:

    «Лечение» длилось около часа, большинство секторов не удалось стереть. Дефекты так и остались. Если есть время, можно попробовать стереть диск полностью, выбрав другой режим сканирования:

    Этот режим аналогичен низкоуровневому форматированию. Вся информация будет уничтожена, сектора сбойные (какие удастся стереть будут так же стерты). Некоторые разновидности ошибок могут быть исправлены. Правда, процесс может длиться долго. В некоторых случаях мне помогал этот режим восстановить работоспособность диска на некоторое время. Так сказать, последнее средство.

    Если не зависнет в процессе, значит скорее всего диск может еще поработать.. Всякое бывало! 🙂 . В этот раз я не буду этого делать — слишком долго. Попробуем сделать ремап — то для чего предназначена эта программа. Нужно выбрать «Линейное чтение » и «Advanced Remap »

    В программе два режима — классический и альтернативный (advanced ) . Классический используется и в операционных системах, при сканировании поверхности. А мы воспользуемся «фирменным». Нажимаем Ctrl+Enter:

    Весь процесс занял не более 15 минут. Впрочем, иногда проверку нужно запустить сразу повторно. Если сектора действительно переназначились, то дефектов больше программа не найдет. Всякое бывает! :-). Когда диск стерт, сканирование идет быстрее. Дело сделано, я нажал «на клавиатуре, для выхода из программы. Затем подключил диск и загрузился через Windows. Нужно посмотреть, что изменилось в SMART.

    Может ли программа Виктория вылечить SMART?

    В этот раз загрузка компьютера прошла штатно, без зависаний. В диспетчере дисков наш диск выглядит как не проинициализированный и не отформатированный (как с магазина 🙂). Снова получим SMART нашего диска:

    В этот раз SMART получил за 1 секунду. Есть разница, это хорошо. Проанализируем теперь наши жизненно важные атрибуты SMART:

    • Параметр ID1 снизился с 241 миллиона до 98 миллионов попугаев. Это неплохо;
    • Параметр ID5 повысился с 99 до 144. Это так и должно быть.Мы ведь переназначили сбойные сектора;
    • Параметр ID7 не изменился, программа к сожалению не лечит магнитные головки. 😥 Остается периодически проверять данный атрибут, или ждать пока Windows сама не ругнется на плохой SMART;
    • Параметр ID187 ухудшился, в процессе лечения накопились еще ошибки.

    Врят-ли такой диск можно активно использовать в дальнейшем, например для установки Windows. Его можно использовать, ненадолго подключая, может быть для того, чтобы сохранить на нем чуточку данных. Хотя, кто знает…

    Программа Виктория (как мы сегодня убедились) в некоторых случаях способна улучшить лишь некоторые атрибуты SMART, а другие — ухудшить. Но, не вылечить, потому что S.M.A.R.T. это не дефект, а средство контроля общего состояния винчестера. Виктории не под силу обнулить счетчики. Да и не нужно этого. Но, можно восстановить работоспособность и спасти данные. Вот для чего бывает полезна эта хорошая и нужная программа. На сегодня все, пока!!

Современный жёсткий диск — уникальный компонент компьютера. Он уникален тем, что хранит в себе служебную информацию, изучая которую, можно оценить «здоровье» диска. Эта информация содержит в себе историю изменения множества параметров, отслеживаемых винчестером в процессе функционирования. Больше ни один компонент системного блока не предоставляет владельцу статистику своей работы! Вкупе с тем, что HDD является одним из самых ненадёжных компонентов компьютера, такая статистика может быть весьма полезной и помочь его владельцу избежать нервотрёпки и потери денег и времени.

Информация о состоянии диска доступна благодаря комплексу технологий, называемых общим именем S.M.A.R.T. (Self-Monitoring, Analisys and Reporting Technology, т. е. технология самомониторинга, анализа и отчёта). Этот комплекс довольно обширен, но мы поговорим о тех его аспектах, которые позволяют посмотреть на атрибуты S.M.A.R.T., отображаемые в какой-либо программе по тестированию винчестера, и понять, что творится с диском.

Отмечу, что нижесказанное относится к дискам с интерфейсами SATA и РАТА. У дисков SAS, SCSI и других серверных дисков тоже есть S.M.A.R.T., но его представление сильно отличается от SATA/PATA. Да и мониторит серверные диски обычно не человек, а RAID-контроллер, потому про них мы говорить не будем.

Итак, если мы откроем S.M.A.R.T. в какой-либо из многочисленных программ, то увидим приблизительно следующую картину (на скриншоте приведён S.M.A.R.T. диска Hitachi Deskstar 7К1000.С HDS721010CLA332 в HDDScan 3.3):

В каждой строке отображается отдельный атрибут S.M.A.R.T. Атрибуты имеют более-менее стандартизованные названия и определённый номер, которые не зависят от модели и производителя диска.

Каждый атрибут S.M.A.R.T. имеет несколько полей. Каждое поле относится к определённому классу из следующих: ID, Value, Worst, Threshold и RAW. Рассмотрим каждый из классов.

  • ID (может также именоваться Number ) — идентификатор, номер атрибута в технологии S.M.A.R.T. Название одного и того же атрибута программами может выдаваться по-разному, а вот идентификатор всегда однозначно определяет атрибут. Особенно это полезно в случае программ, которые переводят общепринятое название атрибута с английского языка на русский. Иногда получается такая белиберда, что понять, что же это за параметр, можно только по его идентификатору.
  • Value (Current) — текущее значение атрибута в попугаях (т. е. в величинах неизвестной размерности). В процессе работы винчестера оно может уменьшаться, увеличиваться и оставаться неизменным. По показателю Value нельзя судить о «здоровье» атрибута, не сравнивая его со значением Threshold этого же атрибута. Как правило, чем меньше Value, тем хуже состояние атрибута (изначально все классы значений, кроме RAW, на новом диске имеют максимальное из возможных значение, например 100).
  • Worst — наихудшее значение, которого достигало значение Value за всю жизнь винчестера. Измеряется тоже в «попугаях». В процессе работы оно может уменьшаться либо оставаться неизменным. По нему тоже нельзя однозначно судить о здоровье атрибута, нужно сравнивать его с Threshold.
  • Threshold — значение в «попугаях», которого должен достигнуть Value этого же атрибута, чтобы состояние атрибута было признано критическим. Проще говоря, Threshold — это порог: если Value больше Threshold — атрибут в порядке; если меньше либо равен — с атрибутом проблемы. Именно по такому критерию утилиты, читающие S.M.A.R.T., выдают отчёт о состоянии диска либо отдельного атрибута вроде «Good» или «Bad». При этом они не учитывают, что даже при Value, большем Threshold, диск на самом деле уже может быть умирающим с точки зрения пользователя, а то и вовсе ходячим мертвецом, поэтому при оценке здоровья диска смотреть стоит всё-таки на другой класс атрибута, а именно — RAW. Однако именно значение Value, опустившееся ниже Threshold, может стать легитимным поводом для замены диска по гарантии (для самих гарантийщиков, конечно же) — кто же яснее скажет о здоровье диска, как не он сам, демонстрируя текущее значение атрибута хуже критического порога? Т. е. при значении Value, большем Threshold, сам диск считает, что атрибут здоров, а при меньшем либо равном — что болен. Очевидно, что при Threshold=0 состояние атрибута не будет признано критическим никогда. Threshold — постоянный параметр, зашитый производителем в диске.
  • RAW (Data) — самый интересный, важный и нужный для оценки показатель. В большинстве случаев он содержит в себе не «попугаи», а реальные значения, выражаемые в различных единицах измерения, напрямую говорящие о текущем состоянии диска. Основываясь именно на этом показателе, формируется значение Value (а вот по какому алгоритму оно формируется — это уже тайна производителя, покрытая мраком). Именно умение читать и анализировать поле RAW даёт возможность объективно оценить состояние винчестера.

Этим мы сейчас и займёмся — разберём все наиболее используемые атрибуты S.M.A.R.T., посмотрим, о чём они говорят и что нужно делать, если они не в порядке.

Аттрибуты S.M.A.R.T.
0x
0x

Перед тем как описывать атрибуты и допустимые значения их поля RAW, уточню, что атрибуты могут иметь поле RAW разного типа: текущее и накапливающее. Текущее поле содержит значение атрибута в настоящий момент, для него свойственно периодическое изменение (для одних атрибутов — изредка, для других — много раз за секунду; другое дело, что в программах чтения S.M.A.R.T. такое быстрое изменение не отображается). Накапливающее поле — содержит статистику, обычно в нём содержится количество возникновений конкретного события со времени первого запуска диска.

Текущий тип характерен для атрибутов, для которых нет смысла суммировать их предыдущие показания. Например, показатель температуры диска является текущим: его цель — в демонстрации температуры в настоящий момент, а не суммы всех предыдущих температур. Накапливающий тип свойственен атрибутам, для которых весь их смысл заключается в предоставлении информации за весь период «жизни» винчестера. Например, атрибут, характеризующий время работы диска, является накапливающим, т. е. содержит количество единиц времени, отработанных накопителем за всю его историю.

Приступим к рассмотрению атрибутов и их RAW-полей.

Атрибут: 01 Raw Read Error Rate

Для всех дисков Seagate, Samsung (начиная с семейства SpinPoint F1 (включительно)) и Fujitsu 2,5″ характерны огромные числа в этих полях.

Для остальных дисков Samsung и всех дисков WD в этом поле характерен 0.

Для дисков Hitachi в этом поле характерен 0 либо периодическое изменение поля в пределах от 0 до нескольких единиц.

Такие отличия обусловлены тем, что все жёсткие диски Seagate, некоторые Samsung и Fujitsu считают значения этих параметров не так, как WD, Hitachi и другие Samsung. При работе любого винчестера всегда возникают ошибки такого рода, и он преодолевает их самостоятельно, это нормально, просто на дисках, которые в этом поле содержат 0 или небольшое число, производитель не счёл нужным указывать истинное количество этих ошибок.

Таким образом, ненулевой параметр на дисках WD и Samsung до SpinPoint F1 (не включительно) и большое значение параметра на дисках Hitachi могут указывать на аппаратные проблемы с диском. Необходимо учитывать, что утилиты могут отображать несколько значений, содержащихся в поле RAW этого атрибута, как одно, и оно будет выглядеть весьма большим, хоть это и будет неверно (подробности см. ниже).

На дисках Seagate, Samsung (SpinPoint F1 и новее) и Fujitsu на этот атрибут можно не обращать внимания.

Атрибут: 02 Throughput Performance

Параметр не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении.

Атрибут: 03 Spin-Up Time

Время разгона может различаться у разных дисков (причём у дисков одного производителя тоже) в зависимости от тока раскрутки, массы блинов, номинальной скорости шпинделя и т. п.

Кстати, винчестеры Fujitsu всегда имеют единицу в этом поле в случае отсутствия проблем с раскруткой шпинделя.

Практически ничего не говорит о здоровье диска, поэтому при оценке состояния винчестера на параметр можно не обращать внимания.

Атрибут: 04 Number of Spin-Up Times (Start/Stop Count)

При оценке здоровья не обращайте на атрибут внимания.

Атрибут: 05 Reallocated Sector Count

Поясним, что вообще такое «переназначенный сектор». Когда диск в процессе работы натыкается на нечитаемый/плохо читаемый/незаписываемый/плохо записываемый сектор, он может посчитать его невосполнимо повреждённым. Специально для таких случаев производитель предусматривает на каждом диске (на каких-то моделях — в центре (логическом конце) диска, на каких-то — в конце каждого трека и т. д.) резервную область. При наличии повреждённого сектора диск помечает его как нечитаемый и использует вместо него сектор в резервной области, сделав соответствующие пометки в специальном списке дефектов поверхности — G-list. Такая операция по назначению нового сектора на роль старого называется remap (ремап) либо переназначение , а используемый вместо повреждённого сектор — переназначенным . Новый сектор получает логический номер LBA старого, и теперь при обращении ПО к сектору с этим номером (программы же не знают ни о каких переназначениях!) запрос будет перенаправляться в резервную область.

Таким образом, хоть сектор и вышел из строя, объём диска не изменяется. Понятно, что не изменяется он до поры до времени, т. к. объём резервной области не бесконечен. Однако резервная область вполне может содержать несколько тысяч секторов, и допустить, чтобы она закончилась, будет весьма безответственно — диск нужно будет заменить задолго до этого.

Кстати, ремонтники говорят, что диски Samsung очень часто ни в какую не хотят выполнять переназначение секторов.

На счёт этого атрибута мнения разнятся. Лично я считаю, что если он достиг 10, диск нужно обязательно менять — ведь это означает прогрессирующий процесс деградации состояния поверхности либо блинов, либо головок, либо чего-то ещё аппаратного, и остановить этот процесс возможности уже нет. Кстати, по сведениям лиц, приближенных к Hitachi, сама Hitachi считает диск подлежащим замене, когда на нём находится уже 5 переназначенных секторов. Другой вопрос, официальная ли эта информация, и следуют ли этому мнению сервис-центры. Что-то мне подсказывает, что нет:)

Другое дело, что сотрудники сервис-центров могут отказываться признавать диск неисправным, если фирменная утилита производителя диска пишет что-то вроде «S.M.A.R.T. Status: Good» или значения Value либо Worst атрибута будут больше Threshold (собственно, по такому критерию может оценивать и сама утилита производителя). И формально они будут правы. Но кому нужен диск с постоянным ухудшением его аппаратных компонентов, даже если такое ухудшение соответствует природе винчестера, а технология производства жёстких дисков старается минимизировать его последствия, выделяя, например, резервную область?

Атрибут: 07 Seek Error Rate

Описание формирования этого атрибута почти полностью совпадает с описанием для атрибута 01 Raw Read Error Rate, за исключением того, что для винчестеров Hitachi нормальным значением поля RAW является только 0.

Таким образом, на атрибут на дисках Seagate, Samsung SpinPoint F1 и новее и Fujitsu 2,5″ не обращайте внимания, на остальных моделях Samsung, а также на всех WD и Hitachi ненулевое значение свидетельствует о проблемах, например, с подшипником и т. п.

Атрибут: 08 Seek Time Performance

Не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении.

Атрибут: 09 Power On Hours Count (Power-on Time)

Ничего не говорит о здоровье диска.

Атрибут: 10 (0А — в шестнадцатеричной системе счисления) Spin Retry Count

О здоровье диска чаще всего не говорит.

Основные причины увеличения параметра — плохой контакт диска с БП или невозможность БП выдать нужный ток в линию питания диска.

В идеале должен быть равен 0. При значении атрибута, равном 1-2, внимания можно не обращать. Если значение больше, в первую очередь следует обратить пристальное внимание на состояние блока питания, его качество, нагрузку на него, проверить контакт винчестера с кабелем питания, проверить сам кабель питания.

Наверняка диск может стартовать не сразу из-за проблем с ним самим, но такое бывает очень редко, и такую возможность нужно рассматривать в последнюю очередь.

Атрибут: 11 (0B) Calibration Retry Count (Recalibration Retries)

Ненулевое, а особенно растущее значение параметра может означать проблемы с диском.

Атрибут: 12 (0C) Power Cycle Count

Не связан с состоянием диска.

Атрибут: 183 (B7) SATA Downshift Error Count

Не говорит о здоровье накопителя.

Атрибут: 184 (B8) End-to-End Error

Ненулевое значение указывает на проблемы с диском.

Атрибут: 187 (BB) Reported Uncorrected Sector Count (UNC Error)

Ненулевое значение атрибута явно указывает на ненормальное состояние диска (в сочетании с ненулевым значением атрибута 197) или на то, что оно было таковым ранее (в сочетании с нулевым значением 197).

Атрибут: 188 (BC) Command Timeout

Такие ошибки могут возникать из-за плохого качества кабелей, контактов, используемых переходников, удлинителей и т. д., а также из-за несовместимости диска с конкретным контроллером SATA/РАТА на материнской плате (либо дискретным). Из-за ошибок такого рода возможны BSOD в Windows.

Ненулевое значение атрибута говорит о потенциальной «болезни» диска.

Атрибут: 189 (BD) High Fly Writes

Для того чтобы сказать, почему происходят такие случаи, нужно уметь анализировать логи S.M.A.R.T., которые содержат специфичную для каждого производителя информацию, что на сегодняшний день не реализовано в общедоступном ПО — следовательно, на атрибут можно не обращать внимания.

Атрибут: 190 (BE) Airflow Temperature

Не говорит о состоянии диска.

Атрибут: 191 (BF) G-Sensor Shock Count (Mechanical Shock)

Актуален для мобильных винчестеров. На дисках Samsung на него часто можно не обращать внимания, т. к. они могут иметь очень чувствительный датчик, который, образно говоря, реагирует чуть ли не на движение воздуха от крыльев пролетающей в одном помещении с диском мухи.

Вообще срабатывание датчика не является признаком удара. Может расти даже от позиционирования БМГ самим диском, особенно если его не закрепить. Основное назначение датчика — прекратить операцию записи при вибрациях, чтобы избежать ошибок.

Не говорит о здоровье диска.

Атрибут: 192 (С0) Power Off Retract Count (Emergency Retry Count)

Не позволяет судить о состоянии диска.

Атрибут: 193 (С1) Load/Unload Cycle Count

Не говорит о здоровье диска.

Атрибут: 194 (С2) Temperature (HDA Temperature, HDD Temperature)

О состоянии диска атрибут не говорит, но позволяет контролировать один из важнейших параметров. Моё мнение: при работе старайтесь не допускать повышения температуры винчестера выше 50 градусов, хоть производителем обычно и декларируется максимальный предел температуры в 55-60 градусов.

Атрибут: 195 (С3) Hardware ECC Recovered

Особенности, присущие этому атрибуту на разных дисках, полностью соответствуют таковым атрибутов 01 и 07.

Атрибут: 196 (С4) Reallocated Event Count

Косвенно говорит о здоровье диска. Чем больше значение — тем хуже. Однако нельзя однозначно судить о здоровье диска по этому параметру, не рассматривая другие атрибуты.

Этот атрибут непосредственно связан с атрибутом 05. При росте 196 чаще всего растёт и 05. Если при росте атрибута 196 атрибут 05 не растёт, значит, при попытке ремапа кандидат в бэд-блоки оказался софт-бэдом (подробности см. ниже), и диск исправил его, так что сектор был признан здоровым, и в переназначении не было необходимости.

Если атрибут 196 меньше атрибута 05, значит, во время некоторых операций переназначения выполнялся перенос нескольких повреждённых секторов за один приём.

Если атрибут 196 больше атрибута 05, значит, при некоторых операциях переназначения были обнаружены исправленные впоследствии софт-бэды.

Атрибут: 197 (С5) Current Pending Sector Count

Натыкаясь в процессе работы на «нехороший» сектор (например, контрольная сумма сектора не соответствует данным в нём), диск помечает его как кандидат на переназначение, заносит его в специальный внутренний список и увеличивает параметр 197. Из этого следует, что на диске могут быть повреждённые секторы, о которых он ещё не знает — ведь на пластинах вполне могут быть области, которые винчестер какое-то время не использует.

При попытке записи в сектор диск сначала проверяет, не находится ли этот сектор в списке кандидатов. Если сектор там не найден, запись проходит обычным порядком. Если же найден, проводится тестирование этого сектора записью-чтением. Если все тестовые операции проходят нормально, то диск считает, что сектор исправен. (Т. е. был т. н. «софт-бэд» — ошибочный сектор возник не по вине диска, а по иным причинам: например, в момент записи информации отключилось электричество, и диск прервал запись, запарковав БМГ. В итоге данные в секторе окажутся недописанными, а контрольная сумма сектора, зависящая от данных в нём, вообще останется старой. Налицо будет расхождение между нею и данными в секторе.) В таком случае диск проводит изначально запрошенную запись и удаляет сектор из списка кандидатов. При этом атрибут 197 уменьшается, также возможно увеличение атрибута 196.

Если же тестирование заканчивается неудачей, диск выполняет операцию переназначения, уменьшая атрибут 197, увеличивая 196 и 05, а также делает пометки в G-list.

Итак, ненулевое значение параметра говорит о неполадках (правда, не может сказать о том, в само́м ли диске проблема).

При ненулевом значении нужно обязательно запустить в программах Victoria или MHDD последовательное чтение всей поверхности с опцией remap . Тогда при сканировании диск обязательно наткнётся на плохой сектор и попытается произвести запись в него (в случае Victoria 3.5 и опции Advanced remap — диск будет пытаться записать сектор до 10 раз). Таким образом программа спровоцирует «лечение» сектора, и в итоге сектор будет либо исправлен, либо переназначен.

В случае неудачи чтения как с remap , так и с Advanced remap , стоит попробовать запустить последовательную запись в тех же Victoria или MHDD. Учитывайте, что операция записи стирает данные, поэтому перед её применением обязательно делайте бэкап!

Иногда от невыполнения ремапа могут помочь следующие манипуляции: снимите плату электроники диска и почистите контакты гермоблока винчестера, соединяющие его с платой — они могут быть окислены. Будь аккуратны при выполнении этой процедуры — из-за неё можно лишиться гарантии!

Невозможность ремапа может быть обусловлена ещё одной причиной — диск исчерпал резервную область, и ему просто некуда переназначать секторы.

Если же значение атрибута 197 никакими манипуляциями не снижается до 0, следует думать о замене диска.

Атрибут: 198 (С6) Offline Uncorrectable Sector Count (Uncorrectable Sector Count)

Параметр этот изменяется только под воздействием оффлайн-тестирования, никакие сканирования программами на него не влияют. При операциях во время самотестирования поведение атрибута такое же, как и атрибута 197.

Ненулевое значение говорит о неполадках на диске (точно так же, как и 197, не конкретизируя, кто виноват).

Атрибут: 199 (С7) UltraDMA CRC Error Count

В подавляющем большинстве случаев причинами ошибок становятся некачественный шлейф передачи данных, разгон шин PCI/PCI-E компьютера либо плохой контакт в SATA-разъёме на диске или на материнской плате/контроллере.

Ошибки при передаче по интерфейсу и, как следствие, растущее значение атрибута могут приводить к переключению операционной системой режима работы канала, на котором находится накопитель, в режим PIO, что влечёт резкое падение скорости чтения/записи при работе с ним и загрузку процессора до 100% (видно в Диспетчере задач Windows).

В случае винчестеров Hitachi серий Deskstar 7К3000 и 5К3000 растущий атрибут может говорить о несовместимости диска и SATA-контроллера. Чтобы исправить ситуацию, нужно принудительно переключить такой диск в режим SATA 3 Гбит/с.

Моё мнение: при наличии ошибок — переподключите кабель с обоих концов; если их количество растёт и оно больше 10 — выбрасывайте шлейф и ставьте вместо него новый или снимайте разгон.

Атрибут: 200 (С8) Write Error Rate (MultiZone Error Rate)

Атрибут: 202 (СА) Data Address Mark Error

Атрибут: 203 (CB) Run Out Cancel

Влияние на здоровье неизвестно.

Атрибут: 220 (DC) Disk Shift

Влияние на здоровье неизвестно.

Атрибут: 240 (F0) Head Flying Hours

Влияние на здоровье неизвестно.

Атрибут: 254 (FE) Free Fall Event Count

Влияние на здоровье неизвестно.

Подытожим описание атрибутов. Ненулевые значения :

При анализе атрибутов учитывайте, что в некоторых параметрах S.M.A.R.T. могут храниться несколько значений этого параметра: например, для предпоследнего запуска диска и для последнего. Такие параметры длиной в несколько байт логически состоят из нескольких значений длиной в меньшее количество байт — например, параметр, хранящий два значения для двух последних запусков, под каждый из которых отводится 2 байта, будет иметь длину 4 байта. Программы, интерпретирующие S.M.A.R.T., часто не знают об этом, и показывают этот параметр как одно число, а не два, что иногда приводит к путанице и волнению владельца диска. Например, «Raw Read Error Rate», хранящий предпоследнее значение «1» и последнее значение «0», будет выглядеть как 65536.

Надо отметить, что не все программы умеют правильно отображать такие атрибуты. Многие как раз и переводят атрибут с несколькими значениями в десятичную систему счисления как одно огромное число. Правильно же отображать такое содержимое — либо с разбиением по значениям (тогда атрибут будет состоять из нескольких отдельных чисел), либо в шестнадцатеричной системе счисления (тогда атрибут будет выглядеть как одно число, но его составляющие будут легко различимы с первого взгляда), либо и то, и другое одновременно. Примерами правильных программ служат HDDScan, CrystalDiskInfo, Hard Disk Sentinel.

Продемонстрируем отличия на практике. Вот так выглядит мгновенное значение атрибута 01 на одном из моих Hitachi HDS721010CLA332 в неучитывающей особенности этого атрибута Victoria 4.46b:

А так выглядит он же в «правильной» HDDScan 3.3:

Плюсы HDDScan в данном контексте очевидны, не правда ли?

Если анализировать S.M.A.R.T. на разных дисках, то можно заметить, что одни и те же атрибуты могут вести себя по-разному. Например, некоторые параметры S.M.A.R.T. винчестеров Hitachi после определённого периода неактивности диска обнуляются; параметр 01 имеет особенности на дисках Hitachi, Seagate, Samsung и Fujitsu, 03 — на Fujitsu. Также известно, что после перепрошивки диска некоторые параметры могут установиться в 0 (например, 199). Однако подобное принудительное обнуление атрибута ни в коем случае не будет говорить о том, что проблемы с диском решены (если таковые были). Ведь растущий критичный атрибут — это следствие неполадок, а не причина .

При анализе множества массивов данных S.M.A.R.T. становится очевидным, что набор атрибутов у дисков разных производителей и даже у разных моделей одного производителя может отличаться. Связано это с так называемыми специфичными для конкретного вендора (vendor specific) атрибутами (т. е. атрибутами, используемыми для мониторинга своих дисков определённым производителем) и не должно являться поводом для волнения. Если ПО мониторинга умеет читать такие атрибуты (например, Victoria 4.46b), то на дисках, для которых они не предназначены, они могут иметь «страшные» (огромные) значения, и на них просто не нужно обращать внимания. Вот так, например, Victoria 4.46b отображает RAW-значения атрибутов, не предназначенных для мониторинга у Hitachi HDS721010CLA332:

Нередко встречается проблема, когда программы не могут считать S.M.A.R.T. диска. В случае исправного винчестера это может быть вызвано несколькими факторами. Например, очень часто не отображается S.M.A.R.T. при подключении диска в режиме AHCI. В таких случаях стоит попробовать разные программы, в частности HDD Scan, которая обладает умением работать в таком режиме, хоть у неё и не всегда это получается, либо же стоит временно переключить диск в режим совместимости с IDE, если есть такая возможность. Далее, на многих материнских платах контроллеры, к которым подключаются винчестеры, бывают не встроенными в чипсет или южный мост, а реализованы отдельными микросхемами. В таком случае DOS-версия Victoria, например, не увидит подключённый к контроллеру жёсткий диск, и ей нужно будет принудительно указывать его, нажав клавишу [Р] и введя номер канала с диском. Часто не читаются S.M.A.R.T. у USB-дисков, что объясняется тем, что USB-контроллер просто не пропускает команды для чтения S.M.A.R.T. Практически никогда не читается S.M.A.R.T. у дисков, функционирующих в составе RAID-массива. Здесь тоже есть смысл попробовать разные программы, но в случае аппаратных RAID-контроллеров это бесполезно.

Если после покупки и установки нового винчестера какие-либо программы (HDD Life, Hard Drive Inspector и иже с ними) показывают, что: диску осталось жить 2 часа; его производительность — 27%; здоровье — 19,155% (выберите по вкусу) — то паниковать не стоит. Поймите следующее. Во-первых, нужно смотреть на показатели S.M.A.R.T., а не на непонятно откуда взявшиеся числа здоровья и производительности (впрочем, принцип их подсчёта понятен: берётся наихудший показатель). Во-вторых, любая программа при оценке параметров S.M.A.R.T. смотрит на отклонение значений разных атрибутов от предыдущих показаний. При первых запусках нового диска параметры непостоянны, необходимо некоторое время на их стабилизацию. Программа, оценивающая S.M.A.R.T., видит, что атрибуты изменяются, производит расчёты, у неё получается, что при их изменении такими темпами накопитель скоро выйдет из строя, и она начинает сигнализировать: «Спасайте данные!» Пройдёт некоторое время (до пары месяцев), атрибуты стабилизируются (если с диском действительно всё в порядке), утилита наберёт данных для статистики, и сроки кончины диска по мере стабилизации S.M.A.R.T. будут переноситься всё дальше и дальше в будущее. Оценка программами дисков Seagate и Samsung — вообще отдельный разговор. Из-за особенностей атрибутов 1, 7, 195 программы даже для абсолютно здорового диска обычно выдают заключение, что он завернулся в простыню и ползёт на кладбище.

Обратите внимание, что возможна следующая ситуация: все атрибуты S.M.A.R.T. — в норме, однако на самом деле диск — с проблемами, хоть этого пока ни по чему не заметно. Объясняется это тем, что технология S.M.A.R.T. работает только «по факту», т. е. атрибуты меняются только тогда, когда диск в процессе работы встречает проблемные места. А пока он на них не наткнулся, то и не знает о них и, следовательно, в S.M.A.R.T. ему фиксировать нечего.

Таким образом, S.M.A.R.T. — это полезная технология, но пользоваться ею нужно с умом. Кроме того, даже если S.M.A.R.T. вашего диска идеален, и вы постоянно устраиваете диску проверки — не полагайтесь на то, что ваш диск будет «жить» ещё долгие годы. Винчестерам свойственно ломаться так быстро, что S.M.A.R.T. просто не успевает отобразить его изменившееся состояние, а бывает и так, что с диском — явные нелады, но в S.M.A.R.T. — всё в порядке. Можно сказать, что хороший S.M.A.R.T. не гарантирует, что с накопителем всё хорошо, но плохой S.M.A.R.T. гарантированно свидетельствует о проблемах . При этом даже с плохим S.M.A.R.T. утилиты могут показывать, что состояние диска — «здоров», из-за того, что критичными атрибутами не достигнуты пороговые значения. Поэтому очень важно анализировать S.M.A.R.T. самому, не полагаясь на «словесную» оценку программ.

Хоть технология S.M.A.R.T. и работает, винчестеры и понятие «надёжность» настолько несовместимы, что принято считать их просто расходным материалом. Ну, как картриджи в принтере. Поэтому во избежание потери ценных данных делайте их периодическое резервное копирование на другой носитель (например, другой винчестер). Оптимально делать две резервные копии на двух разных носителях, не считая винчестера с оригинальными данными. Да, это ведёт к дополнительным затратам, но поверьте: затраты на восстановление информации со сломавшегося HDD обойдутся вам в разы — если не на порядок-другой — дороже. А ведь данные далеко не всегда могут восстановить даже профессионалы. Т. е. единственная возможность обеспечить надёжное хранение ваших данных — это делать их бэкап.

Напоследок упомяну некоторые программы, которые хорошо подходят для анализа S.M.A.R.T. и тестирования винчестеров: HDDScan (Windows, DOS, бесплатная), MHDD (DOS, бесплатная).

Рано или поздно (лучше, конечно, если рано) любой пользователь задает себе вопрос о том, как долго еще протянет установленный у него на компьютере жесткий диск и не пора ли присмотреть ему замену. Удивительного в этом ничего нет, поскольку жесткие диски в силу своих конструктивных особенностей являются наименее надежными среди компьютерных комплектующих. При этом именно на HDD у большинства пользователей хранится львиная доля самой разнообразной информации: документов, снимков, разнообразного ПО и т.д., вследствие чего неожиданный выход диска из строя - всегда трагедия. Конечно, нередко информацию на внешне «мертвых» жестких дисках можно восстановить, но не исключено, что эта операция влетит вам «в копеечку», да и нервов будет стоить немалых. Поэтому гораздо эффективнее попытаться предупредить потерю данных.
Как? Очень просто… Во-первых, не забывать о регулярном резервном копировании данных, а во-вторых, контролировать состояние дисков с помощью специализированных утилит. Несколько программ такого плана в ракурсе решаемых задач мы и рассмотрим в данной статье.

Контроль SMART-параметров и температуры

Все современные HDD и даже твердотельные накопители (SSD) поддерживают технологию S.M.A.R.T. (от англ. Self-Monitoring, Analysis, and Reporting Technology - технология самоконтроля, анализа и отчетности), которая была разработана основными производителями жестких дисков для увеличения надежности их продукции. Данная технология базируется на непрерывном мониторинге и оценке состояния жесткого диска встроенной аппаратурой самодиагностики (специальными сенсорами), а ее основное предназначение - своевременное выявление возможного выхода накопителя из строя.

Мониторинг состояния HDD в реальном времени

Ряд информационно­диагностических решений для диагностики и тестирования «железа», а также специальные мониторинговые утилиты используют технологию S.M.A.R.T. для наблюдения за текущим состоянием различных жизненно важных параметров, описывающих надежность и производительность жестких дисков. Они считывают соответствующие параметры непосредственно с сенсоров и термодатчиков, которыми оснащены все современные жесткие диски, анализируют полученные данные и отображают их в виде краткого табличного отчета с перечнем атрибутов. При этом часть утилит (Hard Drive Inspector, HDDlife, Crystal Disk Info и т.п.) не ограничивается отображением таблицы атрибутов (значения которых для неподготовленных пользователей непонятны) и дополнительно выводит краткую информацию о состоянии диска в более доступном для понимания виде.

Диагностировать состояние жесткого диска с помощью такого рода утилит проще простого - достаточно ознакомиться с краткой базовой информацией об установленных HDD: с основными данными о дисках в Hard Drive Inspector, неким условным процентом здоровья жесткого диска в HDDlife, индикатором «Техсостояние» в Crystal Disk Info (рис. 1) и т.д. В любой из подобных программ предоставляется минимум необходимой информации о каждом из установленных на компьютере HDD: данные о модели винчестера, его объеме, рабочей температуре, отработанном времени, а также уровне надежности и производительности. Эта информация дает возможность сделать определенные выводы о работоспособности носителя.

Рис. 1. Краткая информация о «здоровье» рабочего HDD

Следует настроить запуск мониторинговой утилиты одновременно со стартом операционной системы, скорректировать интервал времени между проверками S.M.A.R.T.-атрибутов, а также включить отображение температуры и «уровня здоровья» жестких дисков в системном трее. После этого для контроля за состоянием дисков пользователю достаточно будет время от времени поглядывать на индикатор в системном трее, где будет отображаться краткая информация о состоянии имеющихся в системе накопителей: уровне их «здоровья» и температуре (рис. 2). Кстати, рабочая температура - это не менее важный показатель, чем условный показатель здоровья HDD, ведь жесткие диски могут внезапно выйти из строя вследствие банального перегрева. Поэтому если жесткий диск нагревается выше 50 °C, то разумнее будет обеспечить ему дополнительное охлаждение.

Рис. 2. Отображение состояния жесткого диска
в системном трее программой HDDlife

Стоит отметить, что в ряде таких утилит предусмотрена интеграция с проводником Windows, благодаря чему на иконках локальных дисков в случае их исправности отображается зеленый значок, а при возникновении проблем значок становится красным. Так что забыть о состоянии здоровья жестких дисков вам вряд ли удастся. При таком постоянном мониторинге вы не сможете пропустить момент, когда с диском начнут возникать какие­то проблемы, ведь в случае выявления утилитой критических изменений атрибутов S.M.A.R.T. и/или температуры она заботливо оповестит об этом пользователя (сообщением на экране, звуковым сообщением и т.д. - рис. 3). Благодаря этому можно будет успеть скопировать данные с внушающего опасение носителя заблаговременно.

Рис. 3. Пример сообщения о необходимости немедленной замены диска

Использовать на практике решения S.M.A.R.T.-мониторинга для наблюдения за состоянием жестких дисков совершенно необременительно, ведь все подобные утилиты работают в фоновом режиме и требуют минимум аппаратных ресурсов, поэтому их функционирование ни в коей мере не помешает основному рабочему процессу.

Контроль S.M.A.R.T.-атрибутов

Продвинутые пользователи, разумеется, вряд ли ограничатся для оценки состояния жестких дисков просмотром краткого вердикта одной из представленных выше утилит. Оно и понятно, ведь по расшифровке атрибутов S.M.A.R.T. можно выявить причину сбоев и при необходимости предусмотрительно предпринять какие­то дополнительные меры. Правда, для самостоятельного контроля S.M.A.R.T.-атрибутов потребуется хотя бы кратко ознакомиться с технологией S.M.A.R.T.

В состав поддерживающих эту технологию жестких дисков ивключены интеллектуальные процедуры самодиагностики, поэтому они способны «сообщать» о своем текущем состоянии. Данная диагностическая информация предоставляется как коллекция атрибутов, то есть конкретных характеристик жесткого диска, используемых для анализа его производительности и надежности.

Бо льшая часть важных атрибутов имеет один и тот же смысл для дисков всех производителей. Значения данных атрибутов при нормальной работе диска могут варьироваться в некоторых интервалах. Для любого параметра производителем определено некое минимально безопасное значение, которое не может быть превышено при нормальных условиях эксплуатации. Однозначно определить критически важные и критически неважные для диагностики параметры S.M.A.R.T. проблематично. Каждый из атрибутов имеет свою информационную ценность и свидетельствует о том или ином аспекте в работе носителя. Однако в первую очередь следует обращать внимание на следующие атрибуты:

  • Raw Read Error Rate - частота ошибок чтения данных с диска, возникших по вине оборудования;
  • Spin Up Time - среднее время раскрутки шпинделя диска;
  • Reallocated Sector Count - число операций переназначения секторов;
  • Seek Error Rate - частота появления ошибок позиционирования;
  • Spin Retry Count - число повторных попыток раскрутки дисков до рабочей скорости в случае неудачности первой попытки;
  • Current Pending Sector Count - количество нестабильных секторов (то есть секторов, ожидающих процедуру переназначения);
  • Offline Scan Uncorrectable Count - общее количество нескорректированных ошибок во время операций чтения/записи секторов.

Обычно атрибуты S.M.A.R.T. отображаются в табличном виде с указанием имени атрибута (Attribute), его идентификатора (ID) и трех значений: текущего (Value), минимального порогового (Threshold) и самого низкого значения атрибута за всё время работы накопителя (Worst), а также абсолютного значения атрибута (Raw). Каждый атрибут имеет текущее значение, которое может быть любым числом от 1 до 100, 200 или 253 (общих стандартов для верхних границ значений атрибутов не предусмотрено). Значения Value и Worst у совершенно нового винчестера совпадают (рис. 4).

Рис. 4. Атрибуты S.M.A.R.T. у нового HDD

Приведенная на рис. 4 информация позволяет сделать вывод, что у теоретически исправного винчестера текущие (Value) и наихудшие (Worst) значения должны быть максимально близкими друг к другу, а значение Raw у большинства параметров (за исключением параметров: Power-On Time, HDA Temperature и некоторых других) должно приближаться к нулю. Текущее значение может со временем изменяться, что в большинстве случаев отражает ухудшение параметров жесткого диска, описываемых атрибутом. Это можно увидеть на рис. 5, где представлены фрагменты таблицы атрибутов S.M.A.R.T. для одного и того же диска - данные получены с интервалом в полгода. Как видим, в более свежей версии S.M.A.R.T. увеличилась частота ошибок при чтении данных с диска (Raw Read Error Rate), происхождение которых обусловлено аппаратной частью диска, и частота ошибок при позиционировании блока магнитных головок (Seek Error Rate), что, возможно, свидетельствует о перегреве винчестера и его неустойчивом положении в корзине. Если текущее значение какого-нибудь атрибута приближается или становится меньше порогового, то жесткий диск признается ненадежным, и его следует срочно менять. Например, падение значения атрибута Spin-Up Time (среднее время раскрутки шпинделя диска) ниже критического значения, как правило, сообщает о полном износе механики, вследствие чего диск больше не в состоянии поддерживать заданную производителем скорость вращения. Поэтому необходимо контролировать состояние HDD и периодически (например, раз в 2-3 месяца) проводить диагностику S.M.A.R.T. и сохранять полученную информацию в текстовом файле. В дальнейшем эти данные можно будет сравнить с текущими и сделать определенные выводы о развитии ситуации.

Рис. 5. Таблицы атрибутов S.M.A.R.T., полученные с полугодовым интервалом
(более свежая версия S.M.A.R.T. внизу)

При просмотре S.M.A.R.T.-атрибутов в первую очередь стоит обращать внимание на критически важные параметры, а также на параметры, выделенные отличными от базового цвета (чаще синего или зеленого) индикаторами. В зависимости от текущего состояния атрибута в выводимой утилитой S.M.A.R.T. таблице он обычно маркируется тем или иным цветом, что облегчает понимание ситуации. В частности, в программе Hard Drive Inspector цветовой индикатор может иметь зеленый, желто­зеленый, желтый, оранжевый или красный цвет - зеленый и желто­зеленый цвета говорят о том, что всё нормально (значение атрибута не менялось или несущественно менялось), а желтый, оранжевый и красный цвета сигнализируют об опасности (хуже всего красный цвет, который говорит о том, что значение атрибута достигло своего критического значения). Если какой­то из критически важных параметров отмечен значком красного цвета, то нужно срочно заменить винчестер.

Просмотрим в программе Hard Drive Inspector таблицу S.M.A.R.T.-атрибутов того самого диска, краткая оценка которого мониторинговыми утилитами нами была приведена ранее. Из рис. 6 видно, что значения всех атрибутов в норме и все параметры промаркированы зеленым цветом. Аналогичную картину покажут и утилиты HDDlife и Crystal Disk Info. Правда, более профессиональные решения для анализа и диагностики HDD не столь лояльны и часто маркируют S.M.A.R.T.-атрибуты более придирчиво. К примеру, такие известные утилиты, как HD Tune Pro и HDD Scan, в нашем случае с подозрением отнеслись к атрибуту UltraDMA CRC Errors, который отображает число ошибок, возникающих при передаче информации по внешнему интерфейсу (рис. 7). Причина возникновения таких ошибок обычно связана с перекрученным и некачественным SATA-шлейфом, который, возможно, следует заменить.

Рис. 6. Таблица S.M.A.R.T.-атрибутов, полученная в программе Hard Drive Inspector

Рис. 7. Результаты оценки состояния S.M.A.R.T.-атрибутов
утилитами HD Tune Pro и HDD Scan

Для сравнения ознакомимся со S.M.A.R.T.-атрибутами очень древнего, но пока еще работающего HDD с периодически возникающими проблемами. Программе Crystal Disk Info доверия он не внушил - в индикаторе «Техсостояние» состояние диска было оценено как тревожное, а атрибут Reallocated Sector Count (Переназначенные сектора) оказался выделенным желтым цветом (рис. 8). Это весьма важный с точки зрения «здоровья» диска атрибут, обозначающий число секторов, переназначенных при обнаружении диском ошибки чтения/записи, при этой операции данные с поврежденного сектора переносятся в резервную область. Желтый цвет индикатора у параметра говорит о том, что оставшихся резервных секторов, которыми можно заменить сбойные, осталось мало, и вскоре переназначать вновь появляющиеся сбойные сектора окажется нечем. Проверим также, как оценивают состояние диска более серьезные решения, например широко используемая профессионалами утилита HDDScan, - но и здесь видим точно такой же результат (рис. 9).

Рис. 8. Оценка проблемного жесткого диска в CrystalDiskInfo

Рис. 9. Результаты S.M.A.R.T.-диагностики HDD в HDDScan

Значит, с заменой такого жесткого диска тянуть явно не стоит, хотя он еще и может некоторое время послужить, правда операционную систему на данный жесткий диск устанавливать, конечно, нельзя. Стоит отметить, что при наличии большого числа переназначенных секторов скорость чтения/записи падает (вследствие лишних движений, которые приходится совершать магнитной головке), и диск начинает заметно тормозить.

Сканирование поверхности на bad-сектора

К сожалению, на практике одним контролем SMART-параметров и температуры не обойтись. При появлении мельчайших свидетельств о том, что с диском что­то не так (в случае периодического зависания программ, например при сохранении результатов, появлении сообщений об ошибках чтения и т.д.) необходимо просканировать поверхность диска на наличие нечитаемых секторов. Для проведения подобной проверки носителя можно воспользоваться, например, утилитами HD Tune Pro и HDDScan или диагностическими утилитами от производителей винчестеров, однако эти утилиты работают только со своими моделями жестких дисков, а потому рассматривать их мы не будем.

При использовании подобных решений существует опасность повреждения данных на сканируемом диске. С одной стороны, с информацией на диске, если накопитель действительно окажется неисправным, в ходе сканирования может случиться все что угодно. С другой стороны, нельзя исключать некорректных действий со стороны пользователя, по ошибке запускающего сканирование в режиме записи, в ходе которого происходит посекторное затирание данных с винчестера определенной сигнатурой, и на основании скорости этого процесса делается вывод о состоянии жесткого диска. Поэтому соблюдение определенных правил предосторожности совершенно необходимо: перед запуском утилиты нужно создать резервную копию информации и в ходе проверки действовать строго по инструкции разработчика соответствующего ПО. Для получения более точных результатов перед сканированием лучше закрыть все активные приложения и выгрузить возможные фоновые процессы. Кроме того, следует иметь в виду, что при необходимости тестирования системного HDD нужно загрузиться с флэшки и с нее запускать процесс сканирования либо совсем снять жесткий диск и подсоединить его к другому компьютеру, с которого и запускать тестирование диска.

В качестве примера с помощью HD Tune Pro проверим на плохие сектора поверхность HDD, который выше не внушил доверия утилите Crystal Disk Info. В этой программе для запуска процесса сканирования достаточно выбрать нужный диск, активировать вкладку Error Scan и щелкнуть на кнопке Start . После этого утилита приступит к последовательному сканированию диска, считывая сектор за сектором и отмечая на карте диска сектора разноцветными квадратиками. Цвет квадратиков в зависимости от ситуации может быть зеленым (нормальные сектора) или красным (bad-блоки) либо будет иметь некий промежуточный между этими цветами оттенок. Как видим из рис. 10, в нашем случае полноценных bad-блоков утилита не нашла, но тем не менее налицо солидное количество секторов с той или иной задержкой чтения (судя по их цвету). В дополнение к оному в средней части диска имеется небольшой блок секторов, цвет которого близок к красному - данные сектора пока утилитой не признаны сбойными, но они уже близки к этому и перейдут в категорию сбойных в самое ближайшее время.

Рис. 10. Сканирование поверхности на bad-сектора в HD Tune Pro

Протестировать носитель на плохие сектора в программе HDDScan сложнее, да и опаснее, поскольку в случае неверно выбранного режима информация на диске будет безвозвратно утрачена. Первым делом для запуска сканирования создают новую задачу, щелкнув по кнопке New Task и выбрав в списке команду Suface Tests . Затем нужно удостовериться, что выбран режим Read - этот режим устанавливается по умолчанию и при его использовании тестирование поверхности жесткого диска производится по чтению (то есть без удаления данных). После этого нажимают на кнопку Add Test (рис. 11) и дважды щелкают на созданной задаче RD-Read . Теперь в открывшемся окне можно наблюдать процесс сканирования диска на графике (Graph) или на карте (Map) - рис. 12. По завершении процесса получим примерно такие же результаты, что выше были продемонстрированы утилитой HD Tune Pro, но с более четкой интерпретацией: сбойных секторов нет (они отмечаются синим цветом), но в наличии три сектора со временем отклика более 500 мс (помечены красным цветом), которые и представляют реальную опасность. Что касается шести оранжевых секторов (время отклика от 150 до 500 мс), то это можно считать в пределах нормы, поскольку такая задержка отклика зачастую вызывается временными помехами в виде, например, работающих фоновых программ.

Рис. 11. Запуск тестирования диска в программе HDDScan

Рис. 12. Результаты сканирования диска в режиме Read с помощью HDDScan

В дополнение следует отметить, что при наличии небольшого количества bad-блоков можно попытаться улучшить состояние жесткого диска, убрав плохие сектора путем сканирования поверхности диска в режиме линейной записи (Erase) с помощью программы HDDScan. После такой операции некоторое время диск еще может эксплуатироваться, но, конечно, не в качестве системного. Однако уповать на чудо не стоит, поскольку HDD уже начал сыпаться, и нет никаких гарантий, что в ближайшее время количество дефектов не возрастет и накопитель окончательно не выйдет из строя.

Программы для S.M.A.R.T.-мониторинга и тестирования HDD

HD Tune Pro 5.00 и HD Tune 2.55

Разработчик: EFD Software

Размер дистрибутива: HD Tune Pro - 1,5 Мбайт; HD Tune - 628 Кбайт

Работа под управлением: Windows XP/Server 2003/Vista/7

Способ распространения: HD Tune Pro - shareware (15-дневная демо-версия); HD Tune - freeware (http://www.hdtune.com/download.html)

Цена: HD Tune Pro - 34,95 долл.; HD Tune - бесплатно (только для некоммерческого применения)

HD Tune - удобная утилита для диагностики и тестирования HDD/SSD (см. таблицу), а также карт памяти, USB-дисков и ряда других устройств хранения данных. Программа отображает детальную информацию о накопителе (версия прошивки, серийный номер, объем диска, размер буфера и режим передачи данных) и позволяет установить состояние устройства с использованием данных S.M.A.R.T. и мониторинга температуры. Кроме того, с ее помощью можно провести тестирование поверхности диска на наличие ошибок и оценить производительность устройства, проведя серию тестов (тесты скорости последовательного и случайного чтения/записи данных, тест файловой производительности, тест кэша и ряд Extra-тестов). Также утилита может использоваться для настройки AAM и безопасного удаления данных. Программа представлена в двух редакциях: коммерческой HD Tune Pro и бесплатной облегченной HD Tune. В редакции HD Tune доступен только просмотр детальной информации о диске и таблицы атрибутов S.M.A.R.T., а также сканирование диска на ошибки и тестирование на скорость в режиме чтения (Low level benchmark - read).

За мониторинг S.M.A.R.T.-атрибутов в программе отвечает вкладка Health - считывание данных с сенсоров производится через установленный промежуток времени, результаты отображаются в таблице. Для любого атрибута можно просмотреть историю его изменений в численном виде и на графике. Данные мониторинга автоматически записываются в лог, но никаких уведомлений пользователя при критических изменениях параметров не предусмотрено.

Что касается сканирования поверхности диска на предмет наличия поврежденных секторов, то за эту операцию отвечает вкладка Error Scan . Сканирование может быть быстрым (Quick scan) и глубоким - при быстрой проверке проверяется не весь диск, а только какая-то его часть (зона сканирования определяется через поля Start и End). Поврежденные сектора отображаются на карте диска в виде красных блоков.

HDDScan 3.3

Разработчик: Artem Rubtsov

Размер дистрибутива: 3,64 Мбайт

Работа под управлением: Windows 2000(SP4)/XP(SP2/SP3)/Server 2003/Vista/7

Способ распространения: freeware (http://hddscan.com/download/HDDScan-3.3.zip)

Цена: бесплатно

HDDScan - утилита для низкоуровневой диагностики жестких дисков, твердотельных накопителей и Flash-дисков с интерфейсом USB. Основное предназначение данной программы - тестирование дисков на наличие bad-блоков и сбойных секторов. Также утилита может использоваться для просмотра содержимого S.M.A.R.T., мониторинга температуры и изменения некоторых настроек жесткого диска: управления шумом (AAM), управления питанием (APM), принудительного запуска/остановки шпинделя накопителя и др. Программа работает без установки и может запускаться с портативного носителя, например флэшки.

Отображение S.M.A.R.T.-атрибутов и мониторинг температуры в HDDScan производится по требованию. Отчет S.M.A.R.T. содержит информацию о производительности и «здоровье» накопителя в виде стандартной таблицы атрибутов, температура накопителя отображается в системном трее и в специальном информационном окне. Отчеты можно распечатывать или сохранять в MHT-файле. Возможно проведение S.M.A.R.T.-тестов.

Проверка поверхности диска производится в одном из четырех режимов: Verify (режим линейной верификации), Read (линейного чтения), Erase (линейной записи) и Butterfly Read (режим чтения Butterfly). Для проверки диска на наличие bad-блоков обычно используется тест в режиме чтения (Read), с помощью которого происходит тестирование поверхности без удаления данных (вывод о состоянии накопителя делается на основании скорости посекторного чтения данных). При тестировании в режиме линейной записи (Erase) информация на диске затирается, но зато данный тест может несколько подлечить диск, избавив его от сбойных секторов. В любом из режимов тестировать можно весь диск полностью либо определенный его фрагмент (зона сканирования определяется указанием начального и конечного логических секторов - Start LBA и End LBA соответственно). Результаты тестирования представляются в виде отчета (вкладка Report) и отображаются на графике (Graph) и карте диска (Map) с указанием в числе прочего количества сбойных секторов (Bads) и секторов, время отклика которых при тестировании заняло более 500 мс (помечены красным цветом).

Hard Drive Inspector 4.13

Разработчик: AltrixSoft

Размер дистрибутива: 2,64 Мбайт

Работа под управлением: Windows 2000/XP/2003 Server/Vista/7

Способ распространения: shareware (14-дневная демо-версия - http://www.altrixsoft.com/ru/download/)

Цена : Hard Drive Inspector Professional - 600 руб.; Hard Drive Inspector for Notebooks - 800 руб.

Hard Drive Inspector - удобное решение для S.M.A.R.T.-мониторинга внешних и внутренних HDD. В данный момент на рынке программа предлагается в двух редакциях: базовой Hard Drive Inspector Professional и портативной Hard Drive Inspector for Notebooks; последняя включает всю функциональность версии Professional, и в то же время учитывает специфику мониторинга жестких дисков ноутбуков. Теоретически существует еще версия SSD, но она распространяется только в OEM-поставках.

Программа обеспечивает автоматическую проверку S.M.A.R.T.-атрибутов через указанные промежутки времени и по завершении выдает свой вердикт относительно состояния накопителя с отображением значений неких условных индикаторов: «надежности», «производительности» и «отсутствия ошибок» вместе с числовым значением температуры и температурной диаграммой. Также приводятся технические данные о модели диска, его емкости, общем свободном месте и времени работы в часах (днях). В расширенном режиме можно посмотреть информацию о параметрах диска (размер буфера, название прошивки и т.д.) и таблицу атрибутов S.M.A.R.T. Предусмотрены разные варианты информирования пользователя в случае критических изменений на диске. Дополнительно утилита может быть использована для снижения уровня шума, производимого жесткими дисками, и снижения энергопотребления HDD.

HDDlife 4.0

Разработчик: BinarySense, Ltd

Размер дистрибутива: 8,45 Мбайт

Работа под управлением: Windows 2000/XP/2003/Vista/7/8

Способ распространения: shareware (15-дневная демо-версия - http://hddlife.ru/rus/downloads.html)

Цена : HDDLife - бесплатно; HDDLife Pro - 300 руб.; HDDlife for Notebooks - 500 руб.

HDDLife - простая утилита, предназначенная для контроля состояния жестких дисков и SSD (с версии 4.0). Программа представлена в трех редакциях: бесплатной HDDLife и двух коммерческих - базовой HDDLife Pro и портативной HDDlife for Notebooks.

Утилита осуществляет мониторинг S.M.A.R.T.-атрибутов и температуры через заданные промежутки времени и по результатам анализа выдает компактный отчет о состоянии диска с указанием технических данных о модели диска и его емкости, отработанном времени, температуре, а также отображает условный процент его здоровья и производительности, что позволяет сориентироваться в ситуации даже новичкам. Более опытные пользователи дополнительно могут посмотреть таблицу S.M.A.R.T.-атрибутов. В случае проблем с жестким диском предусмотрена возможность настройки уведомлений; можно настроить программу так, чтобы при нормальном состоянии диска результаты проверки не отображались. Возможно управление уровнем шума HDD и энергопотреблением.

CrystalDiskInfo 5.4.2

Разработчик: Hiyohiyo

Размер дистрибутива: 1,79 Мбайт

Работа под управлением: Windows XP/2003/Vista/2008/7/8/2012

Способ распространения: freeware (http://crystalmark.info/download/index-e.html)

Цена: бесплатно

CrystalDiskInfo - простая утилита для S.M.A.R.T.-мониторинга состояния жестких дисков (включая многие внешние HDD) и SSD. Несмотря на бесплатность программа обладает всем необходимым функционалом для организации контроля состояния дисков.

Мониторинг дисков производится автоматически через указанное число минут или по требованию. По окончании проверки в системном трее отображается температура контролируемых устройств; детальная информация об HDD с указанием значений S.M.A.R.T.-параметров, температуры и вердикта программы о состоянии устройств доступна в главном окне утилиты. Имеется функционал для настройки пороговых значений для некоторых параметров и автоматического уведомления пользователя в случае их превышения. Возможно управление уровнем шума (AAM) и питанием (APM).

К сожалению, немалая часть современных HDD нормально работает чуть больше года, потом начинаются разного рода проблемы, которые со временем могут привести к потере данных. Подобной перспективы вполне можно избежать, если внимательно следить за состоянием жесткого диска, например, с помощью рассмотренных в статье утилит. Однако забывать о регулярном резервировании ценных данных также не стоит, поскольку мониторинговые утилиты, как правило, удачно прогнозируют выход диска из строя по вине «механики» (согласно статистике компании Seagate, из-за механических компонентов выходят из строя около 60% HDD), но они не в состоянии предсказать гибель накопителя вследствие неполадок с электронными компонентами диска.