Spolehlivý RAID controller

Pevné disky, CD, DVD a BR mechaniky, USB flashdisky, paměťové karty a další

Moderátor: Moderátoři Živě.cz

Odeslat příspěvekod cernakus 28. 12. 2016 07:26

Jestli ti jednou za měsíc RAID vyhodí disk, možná to bude tím, že tam nemáš ECC paměti. Prostě chybka, ten marvel je sice hw, ale obslužné rutiny bude mít v RAMce ne ve svoji vlastní paměti.
cernakus
Mírně pokročilý

Odeslat příspěvekod Python.p 28. 12. 2016 08:34

Chyba v RAM jen jedno měsíčně... No nevím.
Python.p
Je to rebel!
Uživatelský avatar

Odeslat příspěvekod cernakus 28. 12. 2016 08:46

Ten řadič nevyužívá celou oblast rám. Není to tak nereálné, jak myslíš.
cernakus
Mírně pokročilý

Odeslat příspěvekod Python.p 28. 12. 2016 08:56

Já bych to spíš viděl na nekompatibilitu.

No tak memtest a je to vyřešené.
Python.p
Je to rebel!
Uživatelský avatar

Odeslat příspěvekod cernakus 28. 12. 2016 10:32

Ne kompatibilita jednou za měsíc? No vyloučit to nelze.

Je to těžké odhadnout. Problém může být tak zapeklity, že bychom jej nelouskli ani kdybych měli tu desku před sebou.

Tazateli bych doporučil místo kupování drahých dedikovanych rodičů koupi celého nového základu na NAS. Samozřejmě pokud nepůjde z analyzovat proč stávající deska přímo na NAS určena, blbne.
cernakus
Mírně pokročilý

Odeslat příspěvekod Sasar 28. 12. 2016 10:41

A proč ne? S firmware řadičů Adaptec jsou problémy známé a táhnou se. Minimálně jednou za měsíc se provádí test disků, proto ho z pole vyhodí pouze 1x měsíčně. Zaznamenal jsem podobný problém s řadičem Dell Perc se SLC diskem Micron. Stačilo vyžebrat firmware a problémy jsou pryč.
Sasar
Junior
Uživatelský avatar

Odeslat příspěvekod Eagle 28. 12. 2016 11:18

ECC paměti mám, jsou otestované Memtestem, fungují. Systém nevykazuje žádné jiné potíže, stabilita je v pohodě, Prime95 vydrží klidně týden.

Problém Marvellu je podle mého v driveru, kdy některé verze driveru spolehlivě shazují administrační utilitu RAIDu. Disk vypadne z pole většinou při výraznějším zatížení, ovšem někdy taky i přes noc při téměř nečinnosti. V utilitě se objeví hláška, že disk je offline, ale přitom u stejné sekundy je tam zároveň záznam, že je online.

cernakus píše:Tazateli bych doporučil místo kupování drahých dedikovanych rodičů koupi celého nového základu na NAS.

A co by to mělo být? Tato deska má spotřebu jen cca 20W a její aktuální cena je 8,5 tisíce. TDP procesoru je pouze 14W, jediný 50mm Sunon Maglev zredukovaný přes dva odpory není slyšet a CPU i při maximálním vytížení nejde přes 40 stupňů Celsia. V této kategorii nevím o žádných ekvivalentech.
Eagle
Junior

Odeslat příspěvekod cernakus 28. 12. 2016 12:00

Jenže ti zjevně neplní, co dělat má. Takže i pitomá asrock am1 s patřičným cpu je lepší, než do této desky řvát řadič za desítku, kor když řadič na této desce tvoří 2/3 ceny tě desky. Zbytek je prakticky nic.

Bohužel ti nedokážu poradit. To co máš je kvalitní podvozek pro výkonný a spolehlivý NAS, mělo by to bezproblémově fungovat. Kde je chyba, nevím.

Ovsem kupovat do toho další řadič, mno nevím.
cernakus
Mírně pokročilý

Odeslat příspěvekod Python.p 28. 12. 2016 13:31

Tazatel nám stále neprozradil jaké disky má.

Kdybych si měl vsadit, sázím na nekompatibilitu, přesně jak píše Sasar.
Python.p
Je to rebel!
Uživatelský avatar

Odeslat příspěvekod Sasar 28. 12. 2016 14:16

V logu úplně každého raidu se zaznamenává detekce, chyby a všechny eventy disku. Logovat umí úplně každý řadič, od dvěstěkorunových Axago (Marvell, SIL) až po ty nejlepší. Každý neprůchozí příkaz, který odesílá a přijímá řadič se zaloguje v diagnostickém režimu (Buzzer) a nepochybuji, že informace o příčinách v logu budou.
Online/Offline ,ůže být jen proto, že disk a řadič čistí cache (Write Back) a disk, nebo řadič se neshodnou na činnosti práce s cache. Odpovídá to popisu.
Sasar
Junior
Uživatelský avatar

Odeslat příspěvekod soban 28. 12. 2016 15:25

Přesně koupil jsi MB určenou na nas s řadičemi tak je blbost do toho cpát další raid řadič.

Máš aktualizovaný BIOS a FW těch řadičů?

Máš tam HDD které jsou určené pro RAID?

Pokud ne tak tam bude nějaká nekompatibilita....

A jak psaly co se zapisuje do logu?

Co když vyskoušíš jiný OS?
/----------------------------------------\
| Petr Šobáň |
| Olomouc |
\----------------------------------------/
soban
Pokročilý

Odeslat příspěvekod Eagle 28. 12. 2016 16:00

Disky jsou 2x WD10JUCT. Kupované ve stejné době, mají stejný firmware.

OS je Windows Server 2008 R2.

Firmware řadiče je aktuální, drivery přiměřeně též (jak už jsem říkal, drivery Marvellu nejsou bezproblémové - používám ten, který se zdá být nejstabilnější).

V system logu jsem našel jenom záznamy tohoto typu:
Physical disk 4 is plugged out. - 21.12.2016 8:40:46
Physical disk 4 is plugged in. - 21.12.2016 8:40:49

Některé záznamy jsou ale k disku 1, další k disku 4 a disku 7. Přitom disky jsou jen dva a jsou na stejných portech. Další dva disky systému jsou na Intel řadičích.
Eagle
Junior

Odeslat příspěvekod Python.p 28. 12. 2016 16:40

1. HDD není v QVL
2. HDD není vhodný do NAS - nevhodný FW i když železo se může a asi i bude shodovat s jinými disky.
3. Bude asi vadný řadič v desce, pokud tedy neběží něco co by chtělo SW cestou ten disk odpojit. (Kor pokud tam nemáš disk na pozici 7)
4. Podívej se do logu co v tu dobu běží v OS.
5. Kdybys napsal jasně dané verze FW a ovladačů je možné tu nejdo bude třeba vědět konkrétní problém.
Python.p
Je to rebel!
Uživatelský avatar

Odeslat příspěvekod Eagle 28. 12. 2016 17:01

ad 1 - I kdyby byl, různé kusy stejného disku můžou mít (a často mají) jiné komponenty, takže to stejnak nic neznamená. I tento disk se dělá v různých verzích. Stejně tak disky uvedené v HDD QVL.
ad 2 - Usuzuješ z čeho?
ad 3 - Nějaký nápad, jak to spolehlivě otestovat?
ad 4 - Běží tam OS, nic víc, nic méně. To jsou stovky procesů. Najít konkrétní aktivitu dost dobře nejde.

ad 5:
Řadič:
BIOS Version: 1.0.0.1024
Firmware Version: 2.3.0.1063
Boot Loader Version: 2.1.0.1008
Driver Version: 1.2.0.1048

Systém:
BIOS: 2.30
BMC: 00.27.00
Eagle
Junior

Odeslat příspěvekod soban 28. 12. 2016 17:16

HDD fakt není určen pro RAID ale pro rekorder kde se nějaký výpadek stratí (ve videu to nepoznáš).

24x7 reliability - These drives are designed to last in always-on streaming digital audio/video environments such as DVR/PVR, digital video surveillance and other demanding multimedia applications.


Disky určené do raid polí totiž když narazí na chybu tak se ji nesnaží opravit a hlásí chybu hned a RAID ji opraví pomocí druhých HDD z kterých chybějící data dopočítá či použije data z druhého HDD.

RAID-specific, time-limited error
recovery (TLER)
Reduces drive fallout caused by the
extended hard drive error-recovery
processes common to desktop drives.


Pro raid jsou od WD určené HDD WD Re
/----------------------------------------\
| Petr Šobáň |
| Olomouc |
\----------------------------------------/
soban
Pokročilý

Předchozí stránkaDalší stránka

Kdo je online

Uživatelé procházející toto fórum: Žádní registrovaní uživatelé a 0 návštevníků