Odjechani.com.pl

Pełna wersja: S.M.A.R.T. w dyskach twardych - Co to jest S.M.A.R.T.?
Aktualnie przeglądasz uproszczoną wersję forum. Kliknij tutaj, by zobaczyć wersję z pełnym formatowaniem.

tonyviroos

Co to jest S.M.A.R.T.?


S.M.A.R.T. (skrót od słów Self-Monitoring, Analysis and Reporting Technology) jest to technologia monitorowania, analizy i raportowania błędów, polegająca na przewidywaniu wystąpienia uszkodzeń dysku na podstawie stale monitorowanych parametrów (atrybutów), pozwalająca na wcześniejsze ostrzeżenie o możliwości wystąpienia potencjalnych problemów.

[Obrazek: samsung-1500-smart-crystak.png]

Technologia S.M.A.R.T wykorzystywana jest w dyskach ATA/IDE, SCSI/SAS oraz SATA przez praktycznie wszystkich wiodących producentów dysków twardych. Technologia S.M.A.R.T wykorzystuje szereg atrybutów indywidualnych dla każdego modelu dysku.

Jako protoplastę obecnej wersji S.M.A.R.T. uważa się bardzo prosty system zastosowany w 1992 roku przez IBM'a w jednym ze swoich serwerów opartych o dyski SCSI2. System badał niektóre kluczowe dla dysków parametry i raportował je użytkownikowi w uproszczony sposób. W późniejszym czasie Compaq, Conner, Quantum oraz Seagate utworzyły system zwany IntelliSafe, który monitorował parametry i których wartości mogły być przesyłane do systemu i odczytywane przez specjalistyczne oprogramowanie. Każdy z producentów mógł dowolnie decydować, które z parametrów miały być monitorowane.

W 2005 roku Compaq zwrócił się organizacji "Small Form Committee" w celu ustandaryzowania systemu. Wspierany był przez firmę IBM, dotychczasowych partnerów oraz Western Digital. Komisja zaakceptowała wniosek w rezultacie czego powstał standard nazwany S.M.A.R.T.

Kiedy S.M.A.R.T jest przydatny?

Aby odpowiedzieć na to pytanie należy wziąć pod uwagę rodzaje uszkodzeń, jakie mogą wystąpić podczas korzystania z dysków twardych. Uszkodzenia te podzielić można na przewidywalne oraz nieprzewidywalne.

Uszkodzenia nieprzewidywalne występują zazwyczaj w krótkim okresie czasu i zaliczyć do nich można np. nagły przypływ energii elektrycznej, na skutek której uszkodzeniu ulega elektronika sterująca pracą dysku, czy też uszkodzenie mechaniczne powstałe np. pod wpływem uderzenia czy też upadku dysku.

Tego typu sytuacji nie da się przewidzieć. W tego typu przypadkach technologia S.M.A.R.T. może być tylko pomocna przy przeprowadzeniu diagnozy stanu uszkodzeń (o ile stan dysku pozwoli na jej przeprowadzenie).

Uszkodzenia przewidywalne charakteryzują się pogorszeniem wartości pewnych rodzajów parametrów w ciągu określonego czasu, przed wystąpieniem uszkodzenia napędu. Wiele mechanicznych uszkodzeń jest uważanych za stopniowe i przewidywalne, jak np. powolne rozkręcanie dysku, co może świadczyć o zacierającym się łożysku lub błędami odczytu, co może świadczyć o uszkodzonej tasiemce komunikacyjnej sygnałowej, etc.

W tym drugim przypadku technologia S.M.A.R.T. spełnia rolę systemu wczesnego ostrzegania przed potencjalnymi zagrożeniami. Szacuje się, że skuteczność wykrywania potencjalnych awarii przez system S.M.A.R.T. wynosi około 30-40%.

Jak działa S.M.A.R.T.?

Łatwo to zrozumieć, gdy użyjemy analogii występującej np. w przemyśle motoryzacyjnym. Większość nowoczesnych aut posiada zestaw czujników monitorujących najważniejsze parametry silnika i gdy system diagnostyczny (potocznie nazywany komputerem) zauważy, że np. poziom oleju jest zbyt niski, to użytkownik zostanie o tym fakcie powiadomiony poprzez wyświetlenie odpowiedniego komunikatu (włączenie kontrolki, etc). W ten sam sposób działa S.M.A.R.T, który powiadamia o wystąpieniu anomalii, pozwalając na podjęcie działań zapobiegawczych (np. wcześniejszego skopiowania danych znajdujących się na danym dysku). Uszkodzenia mechaniczne, które są głównie przewidywalne, są przyczyną około 50-60% uszkodzeń dysków.

S.M.A.R.T. został stworzony w celu obserwacji stanu dysku przy użyciu rozmaitych metod i czujników. Pojedynczy dysk twardy ATA może mieć ok. 30-40 takich wartości, które nazywane są atrybutami. Odzwierciedlają one pośrednio lub bezpośrednio stan twardego dysku.

Praktycznie każdy nowy dysk twardy posiada zaimplementowaną technologię S.M.A.R.T. Pomimo, że S.M.A.R.T. jest ustandaryzowany niektórzy z producentów stosują własne metody pomiarów niektórych parametrów. Z tego ostatniego powodu znaczenie niektórych atrybutów może się różnić w zależności od producenta danego dysku.

Podczas pracy system S.M.A.R.T wykonuje różne testy, na wskutek których otrzymywane są wyniki w postaci wartości poszczególnych atrybutów i na podstawie których określany jest stan dysku twardego. Występuje parę rodzajów testów S.M.A.R.T.:
Immediate Offline Test krótko trwający (pare minut) podstawowy test dysku, pozwalający na wykrycie najistotniejszych problemów
Short Self Test krótki test trwający kilka-kilkanaście minut, pozwalający na wykrycie większości potencjalnych problemów
Extended Self Test długi test trwający nawet powyżej godziny, pozwalający na wykrycie wszystkich potencjalnych problemów z dyskiem twardym i polegający na przetestowaniu wszystkich parametrów monitorowanych przez system S.M.A.R.T.
Conveyance Self Test test mający na celu wykrycie uszkodzeń powierzchni nośnika magnetycznego, które mogły wystąpić np. podczas transportu dysku.
Warto wspomnieć, że testy S.M.A.R.T. są przeprowadzane w dwóch trybach:
CAPTIVE podczas trwania którego dysk zostaje wyłączony z użycia
IDLE, gdzie testy przeprowadzane są w czasie bezczynności dysku (czyli w czasie, gdy dysk nie nie wykonuje żadnych operacji odczytu/zapisu)


S.M.A.R.T. - skuteczność

Jak skuteczny jest S.M.A.R.T.?

System ten nie jest wyrocznią i nie potrafi przewidywać zdarzeń, które nastąpią w przyszłości. Ale potrafi mierzyć wartości szeregu parametrów, które mogą mieć wpływ na wydarzenia w przyszłości. Jak już napisaliśmy wcześniej S.M.A.R.T. nie uchroni nas przed uszkodzeniami mechanicznymi czy też awarią elektroniki, które występują nagle, bez żadnych wcześniej sygnalizowanych objawów.

Praktyka pokazuje, że nierzadko oprogramowanie diagnostyczne wyświetla status dysku - nazwijmy go "A" - jako prawidłowy a dysk "A" po pewnym czasie zaczyna działać nieprawidłowo lub przestaje działać. Jednak bardzo często dokładna analiza poszczególnych atrybutów dysku "A" pokazuje, że ich wartości są podejrzanie wysokie, a mimo to oprogramowanie diagnozujące nie zgłasza żadnych problemów.

Opisana powyżej sytuacja pokazuje, jak bardzo ważną kwestią jest "własnoręczna" obserwacja wartości poszczególnych atrybutów. Pomocne w diagnozie są programy typu Hard Disk Sentinel, które pozwalają na zapis historii odczytów wartości atrybutów i w ten sposób można śledzić zachodzące zmiany. Dokładna analiza zmian newralgicznych atrybutów pozwala na wcześniejsze wykrycie potencjalnego uszkodzenia i ograniczenie wystąpienia ryzyka utraty danych.

Rola atrybutów

Poszczególne atrybuty mają mniejszy lub większy wpływ na ocenę stanu dysku. Niektóre z nich są bardzo istotne . Mała zmiana w istotnym atrybucie może oznaczać (sygnalizować) pojawienie się poważnego problemu.

Istotną kwestią są powiązania pomiędzy atrybutami, które często są ignorowane. Zdarza się, że dwie lub więcej wartości atrybutów zbliżają się do progów granicznych, jednakże uszkodzenie nie jest zauważane, ponieważ żadna z wartości nie osiąga wymaganego poziomu progowego, co nie wywołuje alarmu w oprogramowaniu odczytującym wskazania S.M.A.R.T.


Temperatura – problem czujników


Procesory główne oraz nowsze karty graficzne posiadają zabezpieczenia przeciwko wysokim temperaturom w przeciwieństwie do większości twardych dysków, które takiego zabezpieczenia nie mają. Warto pamiętać, że twarde dyski są bardziej wrażliwe na wysokie temperatury niż jakikolwiek inny komponent komputera. Dlatego też producenci ograniczają maksymalną temperaturę operacyjną do 50-55 stopni Celsjusza. Nie każdy wie, że wiele czujników temperatury twardego dysku jest niedokładnych (czasem różnica pomiędzy wykrytą a prawdziwą temperaturą może wynosić 7-8 stopni Celsjusza lub nawet więcej). Dlatego w sytuacji, gdy dyski pracują w warunkach, gdzie panuje wysoka temperatura warto skorzystać z zewnętrznych termometrów i sprawdzić, czy temperatura na powierzchni obudowy nie przekracza wartości granicznych dla danego dysku twardego.

Kontrolery

Niektóre kontrolery/sterowniki twardych dysków nie dostarczają wartości progowych S.M.A.R.T lub wartości te równe są zeru. Twarde dyski połączone z takimi kontrolerami uniemożliwiają wykonanie prawidłowego odczytu danych z modułu S.M.A.R.T. Możliwa też jest sytuacja, kiedy dostarczona informacja jest niekompletna. Nie wpływa to bezpośrednio na stan dysku, lecz wyświetlona informacja może być nieprawidłowa. Podobna sytuacja ma miejsce w przypadku prób odczytania danych S.M.A.R.T. w dyskach zewnętrznych podpinanych do komputerów poprzez złącza USB, FireWire. Tylko niektóre z zastosowanych układów pozwalają na odczyt tych danych (spotykane głównie w urządzeniach znanych marek). W tego typu przypadkach należy zwrócić uwagę na wykorzystywane w analizie S.M.A.R.T. oprogramowanie. Bardziej zaawansowane programy wyświetlają ostrzeżenia, gdy wykryte zostaną kontrolery, które posiadają opisane wyżej ograniczenia.

"Bad sektory"

Jednym z głównych problemów pojawiających się w dyskach twardych były i są tzw. "bad sektory". Ich pojawienie się i zwiększająca się z czasem ich liczba zazwyczaj nie wróży niczego dobrego. Ich obecność można sprawdzić za pomocą dedykowanego dla danego producenta oprogramowania diagnostycznego.

W nowych dyskach system S.M.A.R.T stale analizuje powierzchnie dysku podczas standardowych operacji odczytu/zapisu. Jeśli znajdzie obszary sprawiające problemy (jeden lub więcej sektorów w których dane są trudne do odczytu lub do zapisu) to stara się odczytać te dane i skopiować je do obszaru zapasowego. To pierwotne miejsce zostaje zaznaczone jako bad sektor i dalsze operacje dotyczące zapisu czy odczytu przy wskazaniu na to miejsce są przekierowywane do obszaru zapasowego. Gdy operacja jest zakończona, pierwotny obszar (bad sektor) jest niedostępny dla użytkownika (systemu operacyjnego). Nawet ponowny format dysku nie wykaże problemów, ponieważ nieprawidłowy obszar (sektor(y)) nie jest już używany. Jak już wcześniej pisałem operacja ta nazywana jest potocznie realokacją lub remapowaniem sektorów.

Za pomocą dowolnego oprogramowania pozwalającego na odczyt parametrów S.M.A.R.T. można odczytać ilość realokowanych sektorów (atrybut 05 -> Reallocated Sectors Count).

Błędna metoda oceny

Ze względu na fakt, że S.M.A.R.T. nie jest ustandaryzowany, producenci twardych dysków korzystają z własnych algorytmów i mogą ustawić różne progi dla danych atrybutów. Może to być przyczyną wprowadzania użytkowników w błąd (szczególnie tych, którzy posiadają dyski różnych producentów i je ze sobą porównują).


Niebawem postaram się dodać oprogramowanie do odczytu S.M.A.R.T i opisać atrybuty.