Spin retry count как исправить? - OXFORDST.RU

Spin retry count как исправить?

ПК-Дайджест

Жесткий диск является одним из важнейших компонентов любого ПК. Он хранит в себе всю информацию, которой вы пользуетесь на вашем ПК. Именно поэтому нужно следить за состоянием этого компонента, как и впрочем любого другого, но в случае возникновения проблем с вашим жестким диском, вы можете потерять всю информацию на нём.

Прежде чем перейти к оценке состояния жесткого диска или SSD, необходимо запомнить важное правило:

Всегда делайте копии важных фалов и документов, ведь каким бы надежным и дорогим не был ваш накопитель, от сбоев в его работе никто не застрахован.

Общее состояние вашего жесткого диска

Итак, как же узнать, в каком состоянии находится ваш жесткий диск? Вскрывать его и смотреть его внутреннее состояние нельзя. да и незачем. Для оценки его текущего состояния придумали специальную технологию — «S.M.A.R.T.». Эта технология встроена в каждый жесткий диск любого производителя и формата, и позволяет судить о его состоянии, оценивая множество параметров его работы. Просмотреть эту информацию можно разными способами: запустить специальную программу в Windows или использовать специальный загрузчик, который работает напрямую с диска или флешки, и позволяет отобразить эту информацию с жесткого диска. Вторым методом можно воспользоваться, если не работает операционная система, и есть подозрения в неисправности жесткого диска. Мы же воспользуемся первым способом, как наиболее простым и легким.

Чтобы прочитать информацию «S.M.A.R.T.» с нашего жесткого диска, воспользуемся специальной программой — «CrystalDiskInfo». Данная утилита имеет простой интерфейс, русский язык, умеет отслеживать температуру накопителя. Скачать данную программу можно тут. Запускаем программу и видим следующее:

Одним из преимуществ данной программы является перевод всех показателей жесткого диска.

Выбираем в верхней панели один из жестких дисков:

Первое, на что нужно обратить внимание, так это общий статус диска (левый верхний угол, под надписью «Техсостояние»). Если там написано «Хорошо» или «Отлично», то с вашим диском все в порядке.

В случае, если написано «Тревога», то нужно задуматься о смене диска, и скопировать всю важную информацию на другой диск. Ниже представлен пример скриншота программы для диска на WD 500GB 2008 г. производства. Т.е. на момент написания статьи ему уже 9 лет. Такой диск точно требует замены.

Н еобходимо обращать внимание на температуру диска, она должна быть не выше 45-50 градусов. Если температура превышает данные значения, нужно задуматься об охлаждении вашего диска.

Косвенно о состоянии вашего жесткого диска можно судить по времени его работы. На сайте изготовителе вашего жесткого диска можно найти время наработки на отказ, однако даже если этот порог будет превышен, то это не значит, что жесткий диск не пригоден для использования. Это лишь сигнал к тому, что нужно иногда проверять его состояние.

Дополнительная полезная информация

Перед тем, как ознакомиться с данным пунктом, настоятельно рекомендуется узнать о базовых принципах работы жесткого диска из Википедии или других источников.

Пункт техсостояние показывает общую усредненную оценку состояния жесткого диска; если мы хотим узнать более подробные сведения о работе диска, то нужно разобраться в основных показателях работы нашего диска. Для этого разберем все строки из таблицы программы. У каждого диска есть предельное значение и фактическое значение. Чтобы было более наглядно, выполните действия как на картинке ниже, установив другое отображение для RAW данных.

Теперь рассмотрим основные колонки данной таблицы.

  • Левые голубые и желтые кружочки обозначают оценку программы жесткого диска,
  • Атрибут — в ней указывается название параметра,
  • Текущее — состояние параметра на данный момент
  • Наихудшее — наихудшее значение параметра Текущее за все время.
  • Порог — пороговое значение параметра, установленное заводом изготовителем данного диска.
  • Raw-значения — самый главный показатель, который нужно сравнивать с полем «Порог»

Н иже вы увидите список, где указан каждый параметр и как он считается; жирным шрифтом в нём отмечены самые важные параметры, которые показывают состояние жесткого диска. Чтобы оценить состояние, нужно каждый параметр из графы «Raw-значения» сравнивать с числом в графе «Порог». Если число из колонки «Raw-значения» больше числа в графе «Порог», то смотрите описание в списке ниже, чтобы оценить состояние диска.

Основные параметры S.M.A.R.T.

  • Ошибки чтения (Raw Read Error Rate) — атрибут показывает количество ошибок чтения с пластин жесткого диска. На дисках WD, Samsung до SpinPoint F1 (не включительно), Hitachi большое значение параметра указывает на аппаратные проблемы с диском. На дисках Seagate, Samsung (SpinPoint F1 и новее) и Fujitsu на этот атрибут можно не обращать внимания. Смотреть число в графе Raw-значения.
  • Время раскрутки (Spin-Up Time) — время раскрутки шпинделя с «блинами», значение не влияет на состояние диска.
  • Запуски/Остановки шпинделя (Number of Spin-Up Times (Start/Stop Count)) — количество запусков и остановок шпинделя, не влияет на состояние диска.
  • Переназначенные сектора (Reallocated Sector Count) — Очень важный параметр для оценки состояния диска. Сама суть параметра: при работе диска через какое-то время появляются битые сектора, которые неправильно записываются или читаются. Диск их помечает и заменяет на другие, которые были заранее зарезервированы производителем. Это параметр показывает количество таких переназначений. Если число в графе «Raw-значения» больше числа в графе «Порог», то у диска закончились резервные сектора и начинаются ошибки в работе. При превышении значения «порог» более чем на 10%, желательна замена диска.
  • Ошибки позиционирования (Seek Error Rate) — частота ошибки позиционирования головок на «блинах» жесткого диска. Не влияет на состояние диска.
  • Часы работы (Power On Hours Count (Power-on Time)) — значение показывает количество часов работы диска. Ничего не говорит о его состоянии.
  • Повторные попытки раскрутки (Spin Retry Count) — количество повторных попыток раскрутить шпиндель жесткого диска с «блинами». Чаще всего ничего не говорит о здоровье диска, но значительное увеличение этого параметра указывает на плохой контакт проводов питания или нестабильную работу блока питания компьютера.
  • Повторы рекалибровки (Calibration Retry Count (Recalibration Retries)) — показывает количество попыток жесткого диска установки головки считывания на нулевую дорожку. Ненулевое, а особенно растущее значение параметра, может означать проблемы с диском.
  • Включения/Отключения (Power Cycle Count) — количество полных циклов «включение-отключение» диска. Не связан с состоянием диска.
  • End-to-End ошибки — ошибка четности при передаче данных между кэшем и хостом. При увеличении параметра вероятны проблемы с диском.
  • Отказы отключения питания (Power Off Retract Count (Emergency Retry Count)) — количество суммарных циклов включения, отключения диска. Не влияет на состояние диска.
  • Циклы загрузки/выгрузки (Load/Unload Cycle Count) — количество циклов парковки и распарковки головок. Не влияет на состояние диска.
  • Температура (Temperature (HDA Temperature, HDD Temperature)) — показывает температуру диска. На разных дисках датчик температуры находиться в разных местах. Не влияет на состояние диска, но при превышении 55-60 градусов стоит задуматься о его охлаждении.
  • События переназначения (Reallocated Event Count) — количество операций переназначения секторов. Косвенно говорит о здоровье диска. Чем больше значение — тем хуже. Однако нельзя однозначно судить о здоровье диска по этому параметру, не рассматривая другие атрибуты.
  • Нестабильные сектора ( Current Pending Sector Count ) — количество нестабильных секторов, которые когда то диск посчитал испорченными, каждый раз перед записью в такой сектор, диск проверяет этот сектор на стабильность и в зависимости от его состояния, либо заменяет его на резервный либо помечает как битый. Ненулевое значение параметра говорит о неполадках (правда, не может сказать о том, в само́м ли диске проблема).
  • Неисправимые ошибки секторов (Offline Uncorrectable Sector Count (Uncorrectable Sector Count)) — обозначает тоже самое что и в предыдущем пункте, но эти данные диск получает в режиме самотестирования в простое.Ненулевое значение говорит о неполадках на диске.
  • CRC-ошибки UltraDMA (UltraDMA CRC Error Count) — количество ошибок при передаче данных между жестким диском и материнской платой. Увеличения значения свидетельствует о некачественном кабеле, на здоровье диска не влияет.
  • Ошибки записи (Write Error Rate (MultiZone Error Rate)) — частота возникновения ошибок записи. Ненулевое значение говорит о проблемах с диском, а именно о износе магнитных головок.
  • Ошибки адресации данных (Data Address Mark Error) — содержание атрибута — загадка, но проанализировав различные диски, могу констатировать, что ненулевое значение — это плохо.

Сравнение S.M.A.R.T. различных дисков и описание проблем. Примеры оценки.

Диск 1. SeaGate 200 Гб. 2003 г. выпуска

На диске странные значения по Raw-данным, но их появление связано с возрастом диска. На момент написания статьи ему 14 лет.

Диск 2. WesternDigital 500 Гб. 2008 г. выпуска

На диске много переназначенных и нестабильных, значительно превышающих порог — это значит, что размер диска уже уменьшился и идет его деградация.

Диск 3. WesternDigital 250 Гб. 2007 г. выпуска

Диск в полном порядке, однако присутствует странное время раскрутки шпинделя. Диск полностью исправен.

Диск 4. WesternDigital 640 Гб. 2008 г. выпуска

Огромное количество ошибок чтения-записи и нестабильные сектора. Диск на замену.

Читайте также  Экран повернулся на 90 градусов как исправить?

Атрибуты S.M.A.R.T.

Для просмотра атрибутов существует большое количество программ. Я рекомендую использовать MHDD (под DOS) либо универсальный информатор AIDA32 (под Windows).

Информация по атрибутам:

Критически важные атрибуты:

Raw Read Error Rate – частота ошибок при чтении данных с диска. Частота появления ошибок чтения информации с диска, происхождение которых обусловлено аппаратной частью жесткого диска.
Read Channel Margin – запас канала чтения. Назначение неизвестно.
Reallocated Event Count – Количество операций переназначения сбойных секторов. Показывает общее число попыток переназначения сбойных секторов в резервную область диска. При этом учитываются как успешные, так и неудачные операции.
Reallocated Sector Count – число переназначенных секторов. Когда жесткий диск встречает ошибку чтения/записи, он пытается переместить поврежденные данные в резервную область и, в случае успеха, помечает сектор как переназначенный. Благодаря этой возможности жесткие диски способны скрывать незначительное число плохих секторов.
Seek Error Rate – ошибки позиционирования блока головок. Ошибки позиционирования возникают при повреждении сервометок, перегреве носителя или в случае сбоя механической системы позиционирования. Большое количество ошибок позиционирования свидетельствует о низком качестве поверхности или поврежденной механике головок носителя.
Spin Retry Count – число повторных попыток раскрутки дисков до рабочей скорости при условии, что первая попытка была неудачной. Атрибут имеет не прямое значение, а отражает некий сборный параметр надежности.
Spin Up Time – среднее время раскрутки диска из состояния покоя до рабочей скорости. Ухудшение атрибута зачастую свидетельствует о некачественном блоке питания. Ухудшение аттрибута свидетельствует о возможных механических и температурных проблемах.

Информационные атрибуты:

Current Pending Sector Count – текущее число нестабильных секторов. Здесь хранится число претендентов на переназначение в резервную область диска. Если сектор будет считываться успешно, то он исключается из списка. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить и перенести информацию в резервную область, а сам сектор пометит как переназначенный. Постоянно нулевое значение этого атрибута говорит о низком качестве поверхности диска.
Disk Shift — сдвиг пакета дисков относительно оси шпинделя (часто возникает при падении винчестера).
Drive Temperature – температура. Отражает показания встроенного термодатчика. Температура имеет огромное влияние на срок службы диска.
G-Sense Error Rate – частота появления ошибок в результате ударных нагрузок. В соответствии с показаниями ударочувствительного сенсора выводит общее количество ошибок, возникших в результате удара, падения или неаккуратной установки диска в корпус компьютера.
GMR Head Amplitude – амплитуда дрожания головок в рабочем состоянии. Воздействие центробежной силы приводит к дрожанию головок над поверхностью диска. Высокая амплитуда дрожания может вызвать соприкосновение блока головок с поверхностью. Как следствие – появление поврежденных секторов.
Hardware ECC Recovered — количество ошибок чтения, которые были исправлены аппаратной частью HDD. При записи на диск к основным данным добавляется избыточная информация, которая позволяет восстановить данные, если они были считаны с ошибкой (естественно, восстановление возможно в некоторых пределах).
Load Friction — нагрузка на привод головок, вызванная трением в механических частях накопителя.
Load-in Friction (HoursTime) – общее время работы головки под влиянием нагрузок. Показывает общее время работы головок под влиянием центробежных сил.
Load-in Time — общее время нагрузки на привод головок. Предположительно данный атрибут показывает общее время работы накопителя под нагрузкой при условии, что головки находятся в рабочем состоянии (вне парковочной зоны).
Load/Unload Cycle Count — количество циклов вывода головок в специальную парковочную зону/в рабочее положение.
Load/Unload Retry Count — нагрузка на привод головок, вызванная многочисленными повторениями операций чтения, записи, позиционирования головок и т.п. Учитывается только период, в течение которого головки находились в рабочем положении.
Loaded Hours — нагрузка на привод головок, вызванная общей наработкой часов накопителем. Учитывается только период, в течение которого головки находились в рабочем положении.
Offline Correctable — этот атрибут относится к фоновому тестированию поверхности на предмет сбойных или ненадежных секторов. Предположительно, содержит количество сбойных секторов, найденных в этом режиме.
Power Cycle Count (Device (Drive) Power Cycle Count) – число полных циклов включения/выключения винчестера. По этому атрибуту можно оценить, как часто использовался диск.
Power Off Retract Count — количество зафиксированных повторов включения/выключения питания накопителя.
Power-On Hours – количество наработанных часов. Показывает общее время работы диска. В качестве порогового значения выбирается паспортное время наработки на отказ (MTBF – Mean Time Between Failures).
Recalibration Retries – количество повторов рекалибровки. Характеризует количество попыток установки головок на нулевую дорожку, при условии, что первая попытка была неудачной. Значение этого атрибута, меньшее порогового, говорит о неполадках в механике жесткого диска.
Seek Time Performance — средняя производительность операций позиционирования головок. Данный параметр показывает среднюю скорость позиционирования привода головок на указанный сектор. Снижение значения этого атрибута говорит о неполадках в механике привода.
Soft Read Error Rate – частота появления «программных» ошибок при чтении данных с диска. Информирует о программных ошибках чтения данных. К таковым можно отнести ошибки программного обеспечения, драйверов, файловой системы и неверную разметку диска. В общем, почти все, что не относится к аппаратной части винчестера.
Start/Stop Count – число циклов запуск-остановка шпинделя. Двигатель жесткого диска имеет вполне определенное – гарантированное производителем – число старт-стопов. Это значение и выбирается в качестве критического порога.
Throughput Performance – средняя производительность диска. Показывает среднюю пропускную способность жесткого диска. Уменьшение значения с некоторой вероятностью указывает на проблемы в накопителе.
Torque Amplification Count — количество усилий вращающего момента привода.
UltraDMA (Ultra ATA) CRC Error Count – общее количество ошибок CRC в режиме UltraDMA. На практике подобные ошибки появляются при разгоне системы, сильно перекрученном шлейфе, а также по вине драйвера.
Uncorrectable Sector Count – число нескорректированных ошибок. Информирует об ошибках чтения/записи, которые не удалось исправить. Возможной причиной возникновения подобных ошибок может быть повреждение механики или поверхности диска.
Write Error Rate (Multi Zone Error Rate) — частота появления ошибок при записи данных. Показывает общее число ошибок записи на диск. Чем меньше значение атрибута, тем хуже состояние поверхности или механики винчестера.
Использованы материалы из следующих источников: «Игромания», IZone

Как пользоваться программой Victoria HDD

К сожалению, жёсткие диски не вечны и со временем на них появляются не только фрагментация диска, но и повреждение (битые) сектора. Если же выполнить дефрагментацию диска можно используя встроенные средства системы, то исправление битых секторов задача посложнее. Неплохо себя показала программа Victoria HDD для проверки и восстановления битых секторов.

Эта статья расскажет, как пользоваться программой Victoria HDD 4.4.7. Программа позволяет в общем оценить здоровье жёсткого диска и выполнить автоматическую замену битых секторов нормальными или попытаться восстановить битые сектора. Смотрите также: Как проверить состояние жёсткого диска Windows 10.

Как работать с программой Victoria HDD

Поддержка программы Victoria HDD уже завершена и разработчик не выпускает обновления. Последняя версия программы Victoria HDD 4.4.7 доступна для скачивания бесплатно. После установки (или распаковки архива) Victoria HDD нужно запустить программу от имени администратора Windows 10.

В первой вкладке Standart пользователю нужно выбрать жёсткий диск для последующей работы с ним. Выбрав один с дисков дополнительно можно ознакомиться с общей информацией о диске.

Внутренняя система S.M.A.R.T постоянно диагностирует состояние жёсткого диска. Пользователю достаточно перейти в раздел SMART и нажать кнопку Get SMART для получения общей оценки состояния устройства. После завершения теста будет выведена оценка состояния жёсткого диска. Несмотря на значительное количество проблем, состояние моего диска ещё нормальное.

Раздел содержит множество параметров, с помощью которых и оценивается общее состояние жёсткого диска.

1. Raw Read Error Rate параметр, показывающий частоту ошибок чтения
2. Throughput Performance­ общая производительность жёсткого диска (уменьшение значения говорит о наличии проблем с диском)
3. Spin — Up Time количество времени необходимое для достижения нужной скорости вращения (увеличивается в процессе использования устройства)
4. Number of Spin-Up Times показывает сколько раз диск включался/выключался (помните, что новые диски также проходят тестирование)
5. Reallocated Sector Count показывает сколько секторов были повторно назначенные в специальную зарезервированную область диска
7. Seek Error Rate отображает частоту ошибок перемещения блока магнитной головки
8. Seek Time Performance­ указывает среднюю производительность операции позиционирования магнитными головками
9. Power On Hours Count содержит количество часов, которое проработал жёсткий диск за всё время
10. Spin-Up Retry Count показывает количество повторных стартов шпинделя
191. G-SENSOR shock counter количество ошибок, возникающих в результате сотрясений или ударов
192. Power­-off retract count суммарное количество циклов включения/выключения питания диска
194. HDA Temperature показывает значение рабочей температуры жёсткого диска
195. Hardware ECC recovered­ отображает число коррекции ошибок аппаратной частью диска (чтение, позиционирование, передача по внешнему интерфейсу)
196. Reallocation event count содержит количество операций переназначения секторов
197. Current pending sectors сектора жёсткого диска, которые ещё не были помечены как плохие, но уже отличаются по чтению от стабильных секторов
198. Offline scan UNC sectors число неисправимых ошибок по обращению к сектору
199. Ultra DMA CRC Error Count число ошибок, которые происходят во время передачи данных во внешнем интерфейсе
200. Write Error Rate показывает общее количество ошибок записи
Читайте также  0x80096001 Windows 7 как исправить?

После ознакомления с множеством вышеуказанных параметров пользователь самостоятельно может оценить состояние диска. Если же SMART показывает статус BAD, тогда нужно срочно задуматься о покупке нового диска. Так как в большинстве случаев исправить такое состояние невозможно.

Проверка жёсткого диска на битые сектора Victoria HDD

Перейдите в раздел Tests и нажмите кнопку Start для запуска проверки жёсткого диска.

Для оценки результатов тестирования обратите внимание на разноцветные блоки. Три верхних блока серого цвета говорят о том, что диск работает нормально. Если же присутствуют значения в зеленом и оранжевом секторах, это значит некоторые сектора повреждены. Если есть последние значения красного или синего цвета, пользователю нужно задуматься о замене жёсткого диска.

Исправление битых секторов жёсткого диска Victoria HDD

Доступны некоторые значения исправления секторов жёсткого диска.

  • Ignore — ничего не делать с повреждёнными секторами.
  • Remap — автоматическая замена нерабочих секторов рабочими.
  • Erase — очистка данных с повреждённых секторов с перезаписью.
  • Restore — восстановление данных в битых секторах с ошибками.

Простой способ исправления битых секторов есть замена нерабочих секторов другими рабочими. Для повышения производительности жёсткого диска рекомендуется перед началом тестирования выбрать значение Remap, и нажать кнопку Start.

Нельзя гарантировать полное исправление всех проблем с жёстким диском используя программу Victoria HDD 4.4.7. С помощью которой можно заменить нерабочие сектора рабочими и попытаться восстановить данные в битых секторах. Помните что с помощью любого программного обеспечения можно исправить программные ошибки, физические повреждения восстановлению таким способом не подлежат.

Системное администрирование и мониторинг Linux/Windows серверов и видео CDN

Статьи по настройке и администрированию Windows/Linux систем

  • Полезное
    • Карта сайта
    • Мой сайт-визитка
  • Рубрики
    • Linux
      • VoIP
      • Безопасность
      • Видеопотоки
      • Системы виртуализации
      • Системы мониторинга
    • Windows
    • Интересное
    • Сеть и Интернет
  • Мета
    • Войти
    • RSS Feed

S.M.A.R.T. (часть 3). Расшифровка и понимание SMART атрибутов

Маленький рассказ об S.M.A.R.T. атрибутах, их важности и понимании. В статье пойдет речь об расшифровке всех smart атрибутов ATA дисков. В предыдущих статьях речь шла об мониторинге BBU и жестких SCSI дисков и их атрибутов под Megaraid контроллером. Теперь хочу немного описать атрибуты обычных АТА дисков на примере Seagate Barracuda ES.2 (ST31000340NS). Так же определим самые важные атрибуты, на которые нужно обращать внимание при мониторинге дисков используя smartctl. Для начала, можно убедиться, что наш диск поддерживает смарт

Две последние строки свидетельствуют о том, что диск поддерживает smart и можно посмотреть значение всех его атрибутов и их интерпретация будет корректной(интерпретация RAW_VALUE) . В данном случаи тип интерфейса (устройства) не указывался явно (не было указанно атрибут «-d»), по этому smartctl автоматически определил тип устройства и сказал, что «SMART support is: Enabled». Но если используются, к примеру массивы дисков (RAID контроллер), то smartctl может сказать, что смарт не поддерживается:

Но на самом деле, нужно просто знать (или подбирать) какие дисковые массивы используются, и тогда можно получить желаемый результат явно указав тип устройства:

Также может быть проблема в версии smartctl ибо не все жесткие диски добавляются в базу SMART сразу после выхода в мир нового HDD или RAID контроллера. Или же в BIOS отключено поддержку (нужно включить). Так же может быть проблема в прошивке (firmware) самого жесткого диска. Можете также стоит для начала попытаться включить SMART командой:

Следующая, интересующая нас часть вывода покажет суммарный результат проверки статуса здоровья диска (Если не Passed – нужно проводить замену диска). Так же выводится дополнительные характеристики диска и предполагаемое время выполнения коротких и длинных тестов.

В нашем случаи тип устройства определился автоматически и теперь можно вывести самое интересное — список атрибутов.

Используя SMART можно предугадать с довольно большой вероятностью проблемы связанные с:

  • Магнитными головками диска
  • Физическими повреждениями диска
  • Логическими ошибками
  • Механическими проблемами (проблемы привода, системы позиционирования)
  • Подачей питания (платы)
  • Температурой

Расшифруем полученный вывод.


Каждый атрибут имеет группу значений:

  • ID# — идентификационный номер атрибуты (детали здесь). Каждый атрибуты имеет свой уникальный ID, который должен быть одинаковым для всех фирм производителей дисков.
  • ATTRIBUTE_NAME – название атрибута. Так как разные фирмы производители дисков могут называть атрибуты по своему (сокращать, синонимы), лучше всего ориентироваться по ID атрибута.
  • FLAG (Status flag) – каждый атрибут имеет определенный флаг, назначенный фирмой разработчиком диска. В ОС с графическим интерфейсом значения этого флага предоставляется в виде набора буквенных обозначений – w,p,r,c,o,s (расшифровка ниже). И эти наборы предоставляются в виде шестнадцатеричного числа которые вы видели выше.
  1. Warranty: Указывает на жизненно важный атрибут диска и покрывается гарантией. Если этот флаг установлен и значение атрибута с этим флагом достигнет порогового (threshold) значения, в то время, когда диск еще на гарантии, то фирма должна будет заменить диск бесплатно.
  2. Performance: Указывает на атрибут, который представляет показатель производительности диска – не критический.
  3. Error Rate: Атрибут с частотой ошибок.
  4. Count of occurrences: Атрибут-счетчик происшествий.
  5. Online test: Атрибут, который обновляет значения только через on-line тесты. Если не указан, то обновляется через off-line тесты.
  6. Self preserving: Указывает на атрибут который может собирать и сохранять данные о диска, даже если S.M.A.R.T. отключен.
  • Value – Текущее значение атрибута(оценка атрибута диска на основе Raw_value). Низкое значение говорит о быстрой деградации диска или о возможном скором сбое. т.е. чем выше значение Value атрибута, тем лучше. Это значение атрибута нужно сравнивать с пороговым (threshold) значением. Если это критический атрибут и значение ниже порогового — нужно проводить замену диска.
  • Worst – Самое низкое значение атрибута за жизненный цикл диска. Значение может изменяться на протяжении жизни диска, и не должно быть ниже или равным пороговому значению (threshold).
  • Thresh (Threshold) – Пороговое значения атрибута назначенное создателем диска. Значение не меняется за жизненный цикл диска. Если значение Value атрибута станет равным или меньше порогового – появиться уведомление в колонке WHEN_FAILED. И диск нужно заменить.
  • Type – тип атрибута. Может быть критическим (pre-fail), который указывает на предстоящий отказ диска из-за ошибок или не критический, указывающий на достижение конца жизненного цикла диска.
  • Raw_value – Объективное значения атрибута, которое показывается в десятичном формате (вычисляется firmware диска) и известных только производителю единицах (имеет связь с Value, Threshold и Worst значениями).
  • WHEN_FAILED – Указывает на проблемы с атрибутом.

Атрибут диска примет значение failed, в случаи:

Value = f(Raw_value) admin , 24 февраля 2014
Рубрики: Системы мониторинга
Метки: smart, мониторинг HDD

Spin retry count как исправить?

Что такое S.M.A.R.T.?
S elf- M onitoring, A nalysis and R eporting T echnology — технология оценки состояния жёсткого диска системой интегрированной аппаратной самодиагностики/самонаблюдения. Основная задача — определить вероятность выхода устройства из строя, предотвратив потерю данных.

Почему показания S.M.A.R.T. жестких дисков различных вендоров (производителей) отличаются?
— Потому что технология развивалась поэтапно, и внедрялась отдельно каждым производителем по-своему: сначала IBM с технологией PFA (P redictive F ailure A nalysis ), потом Compaq с IntelliSafe, затем по инициативе Compaq, компаниями IBM, Seagate, Quantum, Conner и Western Digital было создано стандартизованное подобие нынешнего S.M.A.R.T. симбиозом IntelliSafe и PFA.
— Стандарт SMART I предполагал мониторинг основных параметров и запускался только после команды по интерфейсу.
— Созданию стандарта SMART II способствовали инновации компании Hitachi: методика полной самодиагностики накопителя (E xtended S elf- T est ) и журналирование ошибок.
— Стандарт SMART III обеспечил прозрачное наблюдение за состоянием диска с функцией обнаружения дефектов поверхности и возможностью их восстановления.
— Современные атрибуты S.M.A.R.T. могут различаться для каждого отдельно взятого диска.

Что такое система само-тестирования (само-диагностики) диска?
— Иногда диск производит самопроверку, поэтому не пугайтесь, если заметите, что в тот момент, когда никаких интенсивных операций в системе не проходит, а диск на некоторое время начинает интенсивно трещать. Такие операции часто запускаются в том случае, если у вас имеются «pending сектора». Диск сам начнет (в момент минимальной нагрузки) перепроверять «кандидата», для того, чтобы исключить его из списка подозрения, либо наоборот исключить из относительной индексации.
— Документировано существует три типа тестов само-диагностики:
— Фоновый сбор данных (Off-line collection);
— Сокращенный тест (Short Self-test);
— Расширенный тест (Extended Self-test).
— Два последних способны выполняться как в автономном (off-line), так и в монопольном (on-line) режимах. Продолжительность их выполнения может длиться от нескольких секунд до минут и даже часов.
— Во время автономного тестирования возможно выполнение других команд, так как тестирование происходит в фоновом режиме. Во время монопольного режима тестирования выполнение других команд невозможно. Попытка исполнить другую команду приведет к прерыванию теста.
— Типичная задача само-тестирования — избавиться от «бэдов». Нужно заметить, что «релоки» могут быть (почти гарантированно) на диске сразу после его покупки «с нуля». Они будут находится в заводской резервной зоне (Primary list). Уже при непосредственной эксплуатации будет формироваться вторичный резерв (Growth list).
— Заметьте, «ремап» не может происходить до бесконечности, потому как объем пользовательской резервной зоны ограничен. Поэтому не удивляйтесь, если вдруг ваш «умирающий» диск (если вы по показаниям смарта заранее это определили) вдруг резко перестанет работать, хотя до этого вроде как худо-бедно трудился — он сам до отказа заполнит резерв «релоками», после чего уже не будет производить «ремап», и вы начнете терять данные. В том случае, если на «бэд-сектор» системного диска попадет системный файл, вы рискуете полюбоваться «синькой» (B lue S creen O f D eath ), с последующей невозможностью загрузки системы.

Атрибуты S.M.A.R.T.
— Это характеристики, использующиеся при анализе состояния надежности накопителя.

Значения атрибутов S.M.A.R.T.
Столбцы:
Value/Currentтекущее значение (в диапазоне от 0/1 до 100/200/255) — надежность конкретного атрибута относительно его эталонного значения, которое определяется производителем.
—Максимальное значение атрибута означает максимальную стабильность. Чем значение ниже, тем быстрее текущий параметр деградирует.
Worst — означает наихудшее из всех когда-либо запротоколированных значений, т.е. наихудшее (бывшее) состояние атрибута.
Thresholdпороговое значение для каждого отдельно взятого атрибута.
—Если текущее значение атрибута ниже, чем пороговое, значит вероятность отказа (если этот параметр критичен) велика.
Raw — значение атрибута во внутреннем формате. Иногда значения могут нести бесполезную нагрузку, гораздо важнее, что из них вычисляется преобразованное значение.
Dataпреобразованное значение атрибута, в большинстве случаев говорящее о состоянии параметра в доступной для восприятия форме.

Строки:
Основные критические (непосредственно влияющие на надежность работы диска) атрибуты:
Raw Read Error Rate — частота ошибок при чтении данных с поверхности диска. Возникает в случае, когда при единовременном проходе, головке не удается произвести чтение ячейки. Увеличение параметра вызвано обычно аппаратными неполадками.
Soft Read Error Rate — частота появления «программных» ошибок при чтении данных с диска. В данном случае виновата не аппаратная часть, а логическая (ошибка микропрограммы диска).
Write Error Rate — частота появления ошибок записи. Вызвана в большинстве своем неполадками механики.
Seek Error Rate — ошибки позиционирования головки. Вызваны неполадками движущей механики, либо повреждением «сервометок» (servo)из-за сильного термического расширения дисков или «промахом» самой головки.
— Магнитная головка знает в какое положение относительно дорожки диска ей необходимо закрепиться (сверяя свое положение по сервометкам) для того, чтобы попасть туда, куда нужно и считать запрашиваемую информацию с определенного адреса, и если ее местоположение не совпадает с реальной позицией над запрашиваемой дорожкой, то возникает ошибка позиционирования.
End-to-End error — ошибка четности при передаче данных между кэшем и хостом.
Reported Uncorrectable Errors — ошибки, которые не удается исправить методами аппаратной коррекции.
Current Pending Sector Count — при единовременном проходе у головки может не получиться считать данные с ячейки, в таком случае эта ячейка будет помечена «кандидатом на замену». Параметр этот может меняться, потому как неудача иногда возникает по вине самой головки (когда она виновата в том, что «промахнулась») хотя ячейка при этом исправна. При повторном проходе статус может быть снят, в том случае, если чтение удалось осуществить успешно. Если этот параметр всегда нулевой, это может говорить о том, что качество само-тестирования на низком уровне.
Reallocated Sectors Count — количество «переназначенных секторов» (remap). Если магнитной головке жесткого диска не удается при нескольких проходах произвести чтение/запись/верификацию ячейки, микропрограмма попытается переместить данные в резервную область диска (spare area — она не входит в область основной разметки) и, в случае успеха, помечает сектор как «переназначенный», т.е. при каждом запросе на чтение данных из этой ячейки, будет происходить «перенаправление» (redirect) на ее резерв, следовательно физически этот переназначенный сектор больше не будет использоваться.
— Благодаря «ремапу», на современных жестких дисках очень редко видны (при тестировании поверхности) «битые сектора» (bad block). Если на графике чтения с поверхности будут заметны «провалы» — резкое падение скорости чтения (до 10% и более), значит вероятны 2 варианта:
—- В этот момент к диску поступило обращение сторонней команды (например, системы);
—- На нем слишком много «ремапов», и головке приходится скакать туда-сюда по поверхности диска из основной разметки в резервную.
Reallocation Event Count — количество попыток «ремапа». В поле атрибута (raw value) хранится общее число попыток (как успешные, так и безуспешные) переноса информации с переназначенных секторов в резервную область.
Spin Up Retry Count — число повторных попыток раскрутки шпинделя до рабочей скорости. Возрастание значения говорит о том, что диски по той или иной причине не получилось вывести на расчетную скорость вращения с первой попытки. Ошибки обычно вызваны аппаратными проблемами.
Recalibration Retries — количество повторов попыток рекалибровки. Неполадки механики иногда приводят к тому, что диску приходится сбросить состояние позиционирования головки в нулевую дорожку. Значения этого атрибута засчитывается в том случае, если рекалибровка происходила большее количество раз, чем положено.
Read Error Retry Rate — количество повторных операций чтения ячейки. Возрастание параметра атрибута может говорить как о проблемах поверхности диска, так и некорректном функцмонировании считывающей головки.
Soft ECC correction — количество ошибок ECC (E rror- C orrecting C ode — код коррекции ошибок), удачно скорректированных программным способом.
Power-off Retract Count — количество операций вывода блока магнитных головок из рабочей зоны в парковочную, результатом которых послужил перебой питания диска.
Run Out Cancel — количество операций коррекции данных из-за неправильной хэш-суммы.
Hardware ECC Recovered — число коррекции ошибок аппаратной частью диска (ошибок чтения, ошибок позиционирования, ошибок передачи по интерфейсу).
Uncorrectable Sector Count — если обычно после ошибки чтения микропрограмма пытается исправить положение дел, то этот параметр показывает те случаи, когда коррекцию произвести не удалось. Чаще всего причина кроется в критической неисправности механики/аппаратной части, либо при наличии софт-бэда.
UltraDMA CRC Error Count — количество ошибок CRC (контроль целостности передачи данных) при обмене данными между диском и контроллером в режиме UltraDMA по контрольной сумме.
— Ошибка может возникать в нескольких случаях:
—- При сильном завышении частоты PCI (больше номинальных 33.3 MHz);
—- При надломленном или сильно закрученном кабеле (иногда даже замена шлейфа на аналогичный не помогает, нужно пробовать разные варианты в каждом конкретно взятом случае);
—- При ошибке драйверов ОС (при чем не только драйверов контроллера);
—- При сбое в работе (например, при внезапном скачке напряжения или отключения питания компьютера), когда посланные диском пакеты не доходят до контроллера.
Command Timeout — количество операций, отмененных по превышении предела ожидания. Возникают такие ошибки обычно при неисправном кабеле или сбоях в подаче питания (пруфлинк).
High Fly Writes — количество операций записи произведенных при положении магнитной головки выше номинального значения (head flying range).
Disk Shift — дистанция смещения блока дисков относительно шпинделя. В основном возникает из-за удара или падения.
G-Sense Error Rate — атрибут хранит показания ударо-чувствительного сенсора — общее количество ошибок, возникших в результате полученных накопителем внешних ударных нагрузок (при падении, толчке, излишней вибрации, неправильной установке, и т.п.).

Некритические атрибуты, сообщающие служебную информацию, не оказывающую прямого влияния на надежность диска.
Throughput Performance — средняя производительность диска по оценки программы само-диагностики. Регламентируется производителем.
Seek Time Performance — средняя производительность операции позиционирования магнитными головками. Аппаратно зависимый параметр.
Spin Up Time — время, затрачиваемое шпиндлем для того, чтобы выйти на расчетную скорость вращения. Ухудшение значение атрибута указывает на проблемы с приводом или подшипником.
Start/Stop Count — количество зафиксированных циклов запуска/остановки шпинделя.
Power-On Time Count — общее количество часов в рабочем состоянии. Значение зависит от отдельно взятого диска/производителя.
Power On/Off Retract Cycle — количество зафиксированных циклов полного включения/отключения.
Load/Unload Cycle Count — количество операция вывода блока магнитных головок в или из рабочей зоны.
Head Flying Hours — общее время, затраченное на позиционирование БМГ.

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: