Stránka 2 z 3

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 07:26
od cernakus
Jestli ti jednou za měsíc RAID vyhodí disk, možná to bude tím, že tam nemáš ECC paměti. Prostě chybka, ten marvel je sice hw, ale obslužné rutiny bude mít v RAMce ne ve svoji vlastní paměti.

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 08:34
od Python.p
Chyba v RAM jen jedno měsíčně... No nevím.

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 08:46
od cernakus
Ten řadič nevyužívá celou oblast rám. Není to tak nereálné, jak myslíš.

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 08:56
od Python.p
Já bych to spíš viděl na nekompatibilitu.

No tak memtest a je to vyřešené.

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 10:32
od cernakus
Ne kompatibilita jednou za měsíc? No vyloučit to nelze.

Je to těžké odhadnout. Problém může být tak zapeklity, že bychom jej nelouskli ani kdybych měli tu desku před sebou.

Tazateli bych doporučil místo kupování drahých dedikovanych rodičů koupi celého nového základu na NAS. Samozřejmě pokud nepůjde z analyzovat proč stávající deska přímo na NAS určena, blbne.

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 10:41
od Sasar
A proč ne? S firmware řadičů Adaptec jsou problémy známé a táhnou se. Minimálně jednou za měsíc se provádí test disků, proto ho z pole vyhodí pouze 1x měsíčně. Zaznamenal jsem podobný problém s řadičem Dell Perc se SLC diskem Micron. Stačilo vyžebrat firmware a problémy jsou pryč.

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 11:18
od Eagle
ECC paměti mám, jsou otestované Memtestem, fungují. Systém nevykazuje žádné jiné potíže, stabilita je v pohodě, Prime95 vydrží klidně týden.

Problém Marvellu je podle mého v driveru, kdy některé verze driveru spolehlivě shazují administrační utilitu RAIDu. Disk vypadne z pole většinou při výraznějším zatížení, ovšem někdy taky i přes noc při téměř nečinnosti. V utilitě se objeví hláška, že disk je offline, ale přitom u stejné sekundy je tam zároveň záznam, že je online.

cernakus píše:Tazateli bych doporučil místo kupování drahých dedikovanych rodičů koupi celého nového základu na NAS.

A co by to mělo být? Tato deska má spotřebu jen cca 20W a její aktuální cena je 8,5 tisíce. TDP procesoru je pouze 14W, jediný 50mm Sunon Maglev zredukovaný přes dva odpory není slyšet a CPU i při maximálním vytížení nejde přes 40 stupňů Celsia. V této kategorii nevím o žádných ekvivalentech.

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 12:00
od cernakus
Jenže ti zjevně neplní, co dělat má. Takže i pitomá asrock am1 s patřičným cpu je lepší, než do této desky řvát řadič za desítku, kor když řadič na této desce tvoří 2/3 ceny tě desky. Zbytek je prakticky nic.

Bohužel ti nedokážu poradit. To co máš je kvalitní podvozek pro výkonný a spolehlivý NAS, mělo by to bezproblémově fungovat. Kde je chyba, nevím.

Ovsem kupovat do toho další řadič, mno nevím.

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 13:31
od Python.p
Tazatel nám stále neprozradil jaké disky má.

Kdybych si měl vsadit, sázím na nekompatibilitu, přesně jak píše Sasar.

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 14:16
od Sasar
V logu úplně každého raidu se zaznamenává detekce, chyby a všechny eventy disku. Logovat umí úplně každý řadič, od dvěstěkorunových Axago (Marvell, SIL) až po ty nejlepší. Každý neprůchozí příkaz, který odesílá a přijímá řadič se zaloguje v diagnostickém režimu (Buzzer) a nepochybuji, že informace o příčinách v logu budou.
Online/Offline ,ůže být jen proto, že disk a řadič čistí cache (Write Back) a disk, nebo řadič se neshodnou na činnosti práce s cache. Odpovídá to popisu.

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 15:25
od soban
Přesně koupil jsi MB určenou na nas s řadičemi tak je blbost do toho cpát další raid řadič.

Máš aktualizovaný BIOS a FW těch řadičů?

Máš tam HDD které jsou určené pro RAID?

Pokud ne tak tam bude nějaká nekompatibilita....

A jak psaly co se zapisuje do logu?

Co když vyskoušíš jiný OS?

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 16:00
od Eagle
Disky jsou 2x WD10JUCT. Kupované ve stejné době, mají stejný firmware.

OS je Windows Server 2008 R2.

Firmware řadiče je aktuální, drivery přiměřeně též (jak už jsem říkal, drivery Marvellu nejsou bezproblémové - používám ten, který se zdá být nejstabilnější).

V system logu jsem našel jenom záznamy tohoto typu:
Physical disk 4 is plugged out. - 21.12.2016 8:40:46
Physical disk 4 is plugged in. - 21.12.2016 8:40:49

Některé záznamy jsou ale k disku 1, další k disku 4 a disku 7. Přitom disky jsou jen dva a jsou na stejných portech. Další dva disky systému jsou na Intel řadičích.

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 16:40
od Python.p
1. HDD není v QVL
2. HDD není vhodný do NAS - nevhodný FW i když železo se může a asi i bude shodovat s jinými disky.
3. Bude asi vadný řadič v desce, pokud tedy neběží něco co by chtělo SW cestou ten disk odpojit. (Kor pokud tam nemáš disk na pozici 7)
4. Podívej se do logu co v tu dobu běží v OS.
5. Kdybys napsal jasně dané verze FW a ovladačů je možné tu nejdo bude třeba vědět konkrétní problém.

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 17:01
od Eagle
ad 1 - I kdyby byl, různé kusy stejného disku můžou mít (a často mají) jiné komponenty, takže to stejnak nic neznamená. I tento disk se dělá v různých verzích. Stejně tak disky uvedené v HDD QVL.
ad 2 - Usuzuješ z čeho?
ad 3 - Nějaký nápad, jak to spolehlivě otestovat?
ad 4 - Běží tam OS, nic víc, nic méně. To jsou stovky procesů. Najít konkrétní aktivitu dost dobře nejde.

ad 5:
Řadič:
BIOS Version: 1.0.0.1024
Firmware Version: 2.3.0.1063
Boot Loader Version: 2.1.0.1008
Driver Version: 1.2.0.1048

Systém:
BIOS: 2.30
BMC: 00.27.00

Re: Spolehlivý RAID controller

Odeslat příspěvekNapsal: 28. 12. 2016 17:16
od soban
HDD fakt není určen pro RAID ale pro rekorder kde se nějaký výpadek stratí (ve videu to nepoznáš).

24x7 reliability - These drives are designed to last in always-on streaming digital audio/video environments such as DVR/PVR, digital video surveillance and other demanding multimedia applications.


Disky určené do raid polí totiž když narazí na chybu tak se ji nesnaží opravit a hlásí chybu hned a RAID ji opraví pomocí druhých HDD z kterých chybějící data dopočítá či použije data z druhého HDD.

RAID-specific, time-limited error
recovery (TLER)
Reduces drive fallout caused by the
extended hard drive error-recovery
processes common to desktop drives.


Pro raid jsou od WD určené HDD WD Re