Технология SMART
Материал из Википедии — свободной энциклопедии
Для улучшения статьи желательно:
|
S.M.A.R.T (англ. Self Monitoring Analysing and Reporting Technology) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя. Начало технологии было положено фирмой IBM в 1995 году. Она получила название Predictive Failure Analysis (PFA). Подобные изыскания велись и фирмой Compaq, разработавшей технологию IntelliSafe.
SMART производит наблюдение за основными характеристиками накопителя, каждая из которых получает оценку. Характеристики можно разбить на две группы:
- Параметры, определяющие естественное старения жесткого диска (число оборотов шпинделя, число перемещений головок, количество циклов включения-выключения);
- текущие параметры накопителя (высота головок над поверхностью диска, число переназначенных секторов, время поиска дорожки и количество ошибок поиска).
Данные хранятся в шестнадцатеричном виде называемом «raw value» а потом пересчитывает в «value», значение, символизирующее надёжность относительно некоторого эталонного значения. Обычно «value» располагается от 0 до 100 (некоторые атрибуты имеют значения от 0 до 200 и от 0 до 253). Следует заметить, что технология SMART позволяет предсказывать выход устройства из строя в результате механических неисправностей, что составляет около 60 % от причин[1], по которым ломаются винчестеры. Предсказать последствия скачка напряжения или повреждения накопителя в результате удара, SMART неспособен.
Высокая оценка говорит об отсутствии изменений данного параметра или медленном его ухудшении. Низкая говорит о возможном скором сбое.
Значение, меньшее чем минимальное значение, при котором производителем гарантируется безотказная работа накопителя, означает выход узла из строя.
Технология S.M.A.R.T. позволяет осуществлять:
- мониторинг параметров состояния;
- сканирование поверхности;
- сканирование поверхности с автоматической заменой сомнительных секторов на надежные.
[править] Атрибуты SMART
Полная таблица всех возможных атрибутов SMART выглядит следующим образом
№№ | Hex | Имя атрибута | Описание |
---|---|---|---|
01 | 01 | Raw Read Error Rate | *КРИТИЧЕСКИЙ* частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска. |
02 | 02 | Throughput Performance | общая производительность диска. Если значение атрибута уменьшается, то велика вероятность, что с диском есть проблемы. |
03 | 03 | Spin-Up Time | *КРИТИЧЕСКИЙ* время раскрутки пакета дисков из состояния покоя до рабочей скорости.. |
04 | 04 | Start/Stop Count | полное число запусков/остановов шпинделя. У дисков некоторых производителей (Seagate, например) — счетчик включения режима энергосбережения. В поле raw value хранится общее количество запусков/остановок диска. |
05 | 05 | Reallocated Sectors Count | *КРИТИЧЕСКИЙ* число операций переназначения секторов. Когда диск обнаруживает ошибку чтения/записи, он помечает сектор «переназначенным», и переносит данные в специально отведенную область. Вот почему на современных жестких дисках не увидишь bad-блоки — все они спрятаны в переназначенных секторах. Этот процесс называют remapping, а переназначенный сектор — remap. Чем меньше значение, тем хуже состояние поверхности дисков. Поле raw value содержит общее количество переназначенных секторов. |
06 | 06 | Read Channel Margin | Запас канала чтения. Назначение этого атрибута не документировано. В современных накопителях не используется. |
07 | 07 | Seek Error Rate | *КРИТИЧЕСКИЙ* частота ошибок при позиционировании блока головок. Чем их больше тем хуже состояние механики и/или поверхности жесткого диска. |
08 | 08 | Seek Time Performance | Средняя производительность операции поиска магнитными головками. Если значение атрибута уменьшается, то велика вероятность проблем с механической частью. |
09 | 09 | Power-On Hours (POH) | число часов, проведённых во включённом состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ (MTBF — mean time between failure). |
10 | 0A | Spin-Up Retry Count | *КРИТИЧЕСКИЙ* число повторных попыток раскрутки дисков до рабочей скорости, в случае если первая попытка была неудачной. Если значение атрибута уменьшается, то велика вероятность, неполадок с механической частью. |
11 | 0B | Recalibration Retries | Количество повторов запросов рекалибровки, в случае если первая попытка была неудачной. Если значение атрибута уменьшается, то велика вероятность проблем с механической частью. |
12 | 0C | Device Power Cycle Count | количество полных циклов включения-выключения диска. |
13 | 0D | Soft Read Error Rate | Число ошибок при чтении по вине програмного обеспечения. |
190 | BE | Airflow Temperature (WDC) | Airflow temperature on Western Digital HDs (Same as temp. (C2), but current value is 50 less.) |
193 | C1 | Load/Unload Cycle | Количество циклов перемещения блока магнитных головок в парковочную зону/в рабочее положение. |
194 | C2 | Temperature | здесь хранятся показания встроенного термодатчика. |
195 | C3 | Hardware ECC Recovered | Число ошибок передачи данных по шине данных, которые удалось восстановить аппаратно. На SATA дисках значение ухудшается обычно при "разгоне" частоты системной шины - SATA интерфейс очень чувствителен к "разгону" компьютера. |
196 | C4 | Reallocation Event Count | *КРИТИЧЕСКИЙ* Число операций переназначения. В поле «raw value» атрибута хранится общее число попыток переноса информации с переназначенных секторов в резервную область. Учитываются как успешные так и неуспешные попытки. |
197 | C5 | Current Pending Sector Count | *КРИТИЧЕСКИЙ* В поле хранится число секторов, являющихся кандидатами на замену. Они не были ещё определены как плохие, но считывание их отличается от чтения стабильного сектора, это так называемые подозрительные или нестабильные сектора. В случае успешного последующего прочтения сектора он исключается из числа кандидатов. В случае повторных ошибочных чтений накопитель пытается восстановить его и выполняет операцию переназначения. |
198 | C6 | Uncorrectable Sector Count | *КРИТИЧЕСКИЙ* число неисправимых ошибок при обращении к сектору. В случае увеличения числа ошибок велика вероятность критических дефектов поверхности и/или механики накопителя. |
199 | C7 | UltraDMA CRC Error Count | число ошибок, возникающих при передаче данных по внешнему интерфейсу. |
200 | C8 | Write Error Rate / Multi-Zone Error Rate |
показывает общее количество ошибок, происходящих при записи сектора. Может служить показателем качества поверхности и механики накопителя. |
220 | DC | Disk Shift | *КРИТИЧЕСКИЙ* Дистанция смещения блока дисков относительно шпинделя. В основном возникает из-за удара или падения. Единица измерения неизвестна. |
221 | DD | G-Sense Error Rate | Число ошибок возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного ударочувствительного сенсора. |
222 | DE | Loaded Hours | Время, проведенное блоком магнитных головок между выгрузкой на рабочую область диска из парковочной области и загрузкой этого блока на парковочную область. |
223 | DF | Load/Unload Retry Count | Количество новых попыток выгрузок/загрузок блока магнитных головок на/из парковочную область после неудачной попытки. |
224 | E0 | Load Friction | Величина силы трения блока магнитных головок при его загрузке из парковочной области. |
226 | E2 | Load 'In'-time | Время, за которой привод загружает магнитные головки из парковочной области на рабочую поверхность диска. |
227 | E3 | Torque Amplification Count | Количество попыток скомпенсировать вращающий момент. |
228 | E4 | Power-Off Retract Cycle | Количество повторов автоматической парковки блока магнитных головок в результате выключения питания. |
230 | E6 | GMR Head Amplitude | Амплитуда «дрожания» (расстояние повторяющегося перемещения блока магнитных головок) |
[править] Ссылки
- Утилита smartmontools(англ.) (Краткая инструкция:
smartctl -h
)