Reparatie DELL R300 Server

blackdog

Golden Member

Hi Lezers :-)

Deze keer iets wat met computers te maken heeft, en wel met de electronica er van.
Een van mijn Servers gaf vorige week de geest, die bij XS4ALL in het Datacenter hangt.
Misschien is dit leuk voor mensen die niet weten hoe ongeveer een 1U server er van binnen uit ziet en hoe ik deze Server ga repareren.

Dat is knap jammer, maar het was ook weer niet zo dringent dat ik direct moest gaan reageren.
Deze Server is grotendeels voor eigen gebruik en een deel van de toepassingen zijn door andere apparaten opgevangen in de loop van de tijd.
Deze Server is rond de 9 jaar oud en heeft een tijdlang als mijn testomgeving gediend en heeft de eerste vier jaar niet zoveel aangestaan.
Vijf jaar geleden gaven vlak achter elkaar twee stuks SuperMicro 1U servers de geest, daar had ik d.m.v Xenserver ongeveer 8 stuks virtuele machines op draaien.

Ook dat was rond die tijd niet meer echt nodig en ben toen naar 1 Server toegegaan waarvan hieronder een aantal plaatjes omdat ik deze moet gaan reparenren.
Deze Server was uitgerust met een ARECA RAID-5 SATA controler en ik had het voor elkaar gekregen om in een 2HD chassis 3HD's te plaatsen.
De dunne CDrom drive moest hiervoor wel verwijderd worden.
Ongeveer twee jaar geleden had ik een defecte HD en deze is toen vervangen en daarna heeft de server weer zonder hickups gewerkt.

Alleen nu bleekt dat er vlak achter elkaar twee disks van de drie schijven RAID-5 Array de geest hebben gegeven, tijdens het boot proces meld het Linux OS "HEL en Verdoemenis"
De schijven waren meer dan zes jaar oud, en om aan te geven hoe ik er vroeger mee omging, toen het nog "productie servers" waren, dan kregen de servers iedere 2,5 jaar nieuwe disken.

Dit alles is nu allemaal over en ik heb besloten deze Server "low cost" te repareren, daar ik voldoende andere mogelijkheden op andere plekken heb.
De laatste harddisk die er nog is ingezet van ongeveer twee jaar geleden, wordt de enige disk die er nog inkomt, dus geen hardware of software RAID meer.
Als ik klaar ben met de configuratie van het OS, dat ook deze keer weer ClearOS is dan maak ik een Image van de schijf en sla deze dan op een van mijn andere Servers op, als backup.

Dit is een foto die niet helemaal scherp is, maar wel goed voor het overzicht.
In het midden hoort een plastic tunnel die nu even verwijderd is.
Aan de rechter zijde zijn de drie harddisks te zien, waarvan twee stuks de aansluitingen zijn losgehaald.
Dit is om te kijken welke disk er niet meer gededecteerd wordt door de RAID controler.
De RAID controler licht linksonder die op de Riser Card geprikt zit, herkenbaar aan de rode SATA kabels die er aan zitten.
http://www.bramcam.nl/Diversen/R300/R300-10.png

Het rode kader geeft aan waar de derde disk van de RAID-5 array gezeten heeft.
Nu zit er aleen nog de 3TB WD RED in en de plastic tunnel voor de luchtstroom zit hier op zijn plaats.
http://www.bramcam.nl/Diversen/R300/R300-01.png

Dit is de RAID controler, wat ik al zij, dit is waarschijnlijk een ARECA model, kon geen merkje vinden en heb verschillende merken gebruikt voor dit soort servers.
http://www.bramcam.nl/Diversen/R300/R300-02.png

Dit is heel netjes, en vele zullen denken, die ventielatoren zijn vies!
En ik zeg dan dat XS4ALL zijn luchtbehandeling goed op orde heeft, ik heb hier niets aan gepoetss, en je ziet hier ongeveer 5 jaar stof :-)
http://www.bramcam.nl/Diversen/R300/R300-03.png

Vier printjes geheugen en totaal is dit 8GB, ruim voldoende voor mijn toepassing.
Er boven de chipset met zijn vinger koeler en de heatpipe koeler voor de processor, dit is een 2,5GHz Quadcore Xeon met als ik het goed heb 6MB cache.
http://www.bramcam.nl/Diversen/R300/R300-06.png

Een close up van de processor koeler, erg plat, maar je hebt weinig keus in een het 1U formaat Server.
http://www.bramcam.nl/Diversen/R300/R300-12.png

Wat moet ik nu repareren en een rede hebben om computer spul op CO te laten zien ;-)
Een aantal condensatoren beginnen bol te staan, bij deze condensator is het aluminium nog niet gebroken, maar dat kan over een paar maanden wel zo zijn.
Deze Rubican MCZ Series 2200uF 6,3V elco, zou een max ESR moeten hebben van 11mΩ
http://www.bramcam.nl/Diversen/R300/R300-05.png

Dit is ook weer een slechte foto maar, dit is de enige waarbij een beetje zichtbaar is dat er wat bolling aanwezig is.
http://www.bramcam.nl/Diversen/R300/R300-08.png

Zo ziet de voorkant van deze Server er uit.
Voor de gene die het niet weten, er is bijna altijd een VGA aansluiting aan de voorzijde aanwezig en twee maal USB.
Dit dient er voor dat als je aan de voorzijde staat, dat je makkelijk een monitor, keyboard en een muis kan inprikken.
Er is een klein knopje op het front aanwezig waar een "I" bij staat, deze heeft ondermeer de functie en blauwe LED aan de achterzijde te laten oplichten.
Zodat je de Server waar je aan werkt makkelijk kan herkennen, dat is een zeer handige functie!
Dat merk je wel als je zelf een aan ee nrek hebt gewerkt met vele servers er in :-)
Het rode kader geeft aan waar ik de extra HD had gemonteerd.
http://www.bramcam.nl/Diversen/R300/R300-09.png

Op het ogenblik ben ik de software aan het configureren en morgen bestel ik het zetje nieuwe elco's en laat dan later de reparatie van de print zien.
Dit is een screenshot van hoe de interface van ClearOS er ongeveer uit ziet.
Hier kan je de IP settings doen en andere belangrijke data invullen.
Later deze week dus wat meer electronica, hoe ik met mijn nieuwe hete lucht soldeer gereedschap en het JBC soldeer station de elco's vervang.

Groet,
Blackdog

You have your way. I have my way. As for the right way, the correct way, and the only way, it does not exist.

stof valt nog wel mee idd, een kast die 5 jaar 24/7 op de vloer in een kast van een bedrijf heeft gedraaid heeft gare fans van de onbalans die die dingen hebben gekregen van het aangeladen stof.

dit dell spul heb ik in het verleden zat gezien, opgezwollen elco's rond processoren waren toen al niet zeldzaam. de fans zijn wel aparte dingen met hun 5 draden, duur en levertijd tenzij lagers wisselen nog kan bij een defect. dat heb ik ook weleens gedaan toen er een mailserver in panne lag.

raid controllers die het laten afweten of een raid5 die hapert door gare disks is ook verre van zeldzaam. alleen die ene kapotte disk vervangen is dan ook vragen om herhaling in korte tijd, ik vervang ze ook elke zoveel jaar om uitval voor te blijven. goede koeling scheelt veel bij hdd's, lage temperatuur doet net als voor elco's veel.

die compacte servers hebben ook vaker 2,5 hdd's welke niet zo'n lang leven beschoren zijn als de degelijkere 3,5 modellen.

waar rook was, werkt nu iets niet meer

Ik ben helemaal niet zo kapot van 1U servers. Echt alles wat er zo ongeveer in zit is speciaal gebouwd voor die hoogte.
Ik heb zelf meerder 2U systemen gebouwd en gebruikt die vond ik al een ramp laat staan 1U.

Maar voor de rack space is het gunstig. Maar dat is het dan ook.

1-st law of Henri: De wet van behoud van ellende. 2-nd law of Henri: Ellende komt nooit alleen.

die 1U en 2U dingen zijn ook erg diep, vervang je op een bedrijf de servers kun je met pech ook de kasten vervangen.

waar rook was, werkt nu iets niet meer
blackdog

Golden Member

Hi,

Ik ben juist heel tevreden met de 1U servers die ik gehad heb.
De meeste hebben meer dan 7 jaar gedraaid en de gene die het langst "up" was, had rond de 1560 dagen :-) zonder 1 reboot!
Dat was een van mijn Supermicro servers met toen nog Clarkconnect er op als OS.

Het is juist altijd zeer stabiel geweest en ruim hun levensduur die je normaal steld, gehaald.
Dat deze Server na bijna 9 jaar oud te zijn en ongeveer 5 jaar 24x7x365 (elco's moederboard), een beetje omvalt, knap toch...

Dat je dikkere Servers nodig heb en dat dit b.v. makkelijker is wat ruimte betreft, tja wat wil je nu... kost ook meer geld voor de rackspace, stroomkosten enz.
Je koopt wat je nodig hebt, heb je een ondiepe kast dan weet ik van DELL dat ze ook ondiepe 1U servertjes hebben.
Maar ga dan weer niet vragen om 8 geheugen sleuven en b.v. 4x 3,5 Inch disks er in.
Oja natuurlijk moet er dan ook nog een redunente voeding in, zo kunnen we wel alles negatief maken...

Dit is geen klaag verhaal van mij, maar gewoon een reparatie topic om te laten zien hoe ik nog wat "low cost" levensduur uit de Server pers. :-)

Groet,
Blackdog

You have your way. I have my way. As for the right way, the correct way, and the only way, it does not exist.
Sine

Moderator

9 jaar is een ERG reputabele leeftijd voor 24/7 bedrijf. Wij proberen als het even kan servers en clients in 24/7 bedrijf iedere 6 a 7 jaar te vervangen.
Veel langer moet je ook niet wachten, dan begint het eea toch wat instabiel te worden.

Een enkele harddisk die in die tijd faalt, preventief vervangen heeft in de meeste gevallen geen zin.
Op een (blijkbaar) slechte batch schijven na hebben we daar ERG weinig last van gehad. En mocht er toch een array compleet falen weet je ook weer waarom je backups maakt ;)

Op 14 januari 2018 18:17:46 schreef testman:
die 1U en 2U dingen zijn ook erg diep, vervang je op een bedrijf de servers kun je met pech ook de kasten vervangen.

Dan hebben ze simpelweg de verkeerde kast geplaatst ... een netwerkkast is GEEN serverkast, hoe vaak ik daar tegen ben aangelopen bij klanten die zelf wel de kasten zouden leveren.

Van verbouwen van rails en kasten tot het toch nog vervangen van de hele kasten.

verkeerd is een groot woord, bedrijven die 3 servers terug hun netwerk en racks hebben aangelegd en toen nog staande servers hadden of 4/5U hoge PII modellen nog. die waren een stuk korter.

vaak laat men de deur achter dan eruit om 10cm overstekende servers nog op te vangen, maar het best neem je meteen racks van 1 meter diep. scheelt iig een hoop herrie als die vol gestapeld is..

op t werk stond nog een rack van 60cm diep, toen de oude staande hp server aan vervanging toe was moest dat rack ook vervangen worden voor een 1 meterse natuurlijk. was niet duur, want er is weleens een goed rack over met een projectje :P

waar rook was, werkt nu iets niet meer
mel

Golden Member

Ik vind het wel knap dat Linux "Hell en verdoemenis "kan typen.. :)
Maar wel een net topic.

u=ir betekent niet :U bent ingenieur..

Vaak is het de moeite niet om een MOBO van nieuwe elco's te voorzien. De technische en commerciele levensduur zijn meestal ten einde.

In dit soort servers zit allemaal speciaal spul, dan kan het nog wel de moeite waard zijn, als het ten minste geen stroom slurpend bord is.

Ik heb op borden ook wel eens de elco's vervangen in het switcher deel. Wel een uitdaging om ze eruit te krijgen en nieuwe erin. Omdat het vaak 6 layer boarden zijn gaat dat niet echt makkelijk.
Meestal verwarm ik het board voor met een fohn en dan de elco's eruit proberen te krijgen zonder schade aan de print.

1-st law of Henri: De wet van behoud van ellende. 2-nd law of Henri: Ellende komt nooit alleen.
StijnN

Golden Member

Ik heb inmiddels ook al van diverse DELL 2950 servers de elco's vv. Problemen begonnen ongeveer een jaar geleden.Vind ik toch wel respectabel voor die leeftijd.
De hoeveelheid stof die Blackdog laat zien is als je het met onze situatie vergelijkt absoluut verwaarloosbaar, ik heb servers gehad die massief vol gestoft waren en na reiniging weer probleemloos verder liepen.
Deze servers draaien inmiddels al 10 jaar 24/7 en de intentie is dat deze nog wel een paar jaar verder moeten. Helaas geen budget voor iets nieuws.

A person who never made a mistake never tried anything new.
rbeckers

Overleden

Wat ik interessant vind is de door de leverancier(s) gespecificeerde MTBF.
Dan blijkt een server van 7 jaar oud toch al behoorlijk oud te zijn.

je fikst een mobo ook niet om nog eens 6 jaar constant te gebruiken. vaak nog af en toe gebruik of als backup pc/servertje. komt ook wel voor dat een server vervangen wordt, ding ergens neergezet en wil je het ding nog eens aanszetten dan doet de voeding niks meer, elco's gaar wat pas in koude toestand merkbaar is.

had hier ook een voeding liggen, 14 jaar oude tagan atx. ding is 9 jaar terug als backup in de opslag gegaan. af en toe gebruikt geweest, maar toch starte een moederbord moeilijk met dat ding in koude toestand merkte ik. open gehaald, bleken er 4 elco's goed lek te zijn. van de gebruiksuren is het niet, maar eerder van de lange opslag en dan ineens weer gebruiken.

[Bericht gewijzigd door testman op dinsdag 16 januari 2018 15:13:42 (31%)

waar rook was, werkt nu iets niet meer
dijkmane

Golden Member

ik zou de moeite sparen en voor 99 eur een R310 of beter halen bij Serverhome.

voordat je dat moederbord eruit hebt, die elko's vervangen en dan nog afwachten, als de boel weer inelkaar zit, of t weer betrouwbaar werkt.

deze heeft simpelweg zijn tijd gehad dan.

In no Sense, Nonsense
blackdog

Golden Member

Hi dijkmane,

Heb je wel eens zo'n server geconfigureerd daar?
Lijkt allemaal leuk, maar voor ieder schroefje betaal je zowat.
Het wordt echt leuk als je de rails waar hij in moet komen te hangen gaat aanvinken.

Laat mij maar een paar elco's vervangen, dat is mijn werk als electronicus :-)
Het is geen productie Server meer, dus waarom zou ik het niet proberen om zijn leven nog even te verlengen.
Deze afweging heeft trouwens helemaal niets te maken, met hoe ik het voor mijn klanten zou oplossen.

Groet,
Blackdog

You have your way. I have my way. As for the right way, the correct way, and the only way, it does not exist.
dijkmane

Golden Member

jazeker, ook wel eens iets afgehaald daar.
maar je hoeft niet te configureren toch, je haalt een kale 310 en zet je mem enzo over.
uiteraard is t leuk om te proberen of je hier weer leven in krijgt.

In no Sense, Nonsense
blackdog

Golden Member

Hi,

Na en paar dagen goed ziek te zijn geweest, is nu de Server weer in werkende staat.
Het werken er aan ging niet echt snel efficientie 10% denk ik :-)
Buikgriep is killing...

Maar goed, hij draait weer en de eerste foto is die van de elco's die ik heb verwijderd.
Alle foto's zijn van deze avond, ik heb/had meer foto's gemaakt, maar de camera waar ik dat mee gedaan had melde niet dat er geen kaart is zat.
Of ik te gaar dat ik het niet gezien heb.

Nu nog maar 1 HD in de Server en in de blauwe kaders zitten de nieuwe elco's
http://www.bramcam.nl/Diversen/R300/R300-14.png

Dit is de nieuwe 2200uF elco, daar had ik nog een goed type van liggen en die zit er nu in.
http://www.bramcam.nl/Diversen/R300/R300-15.png

Dit is de vervanger geworden van de ligt bol staande 470uF, het is dus een KEMET Polymer model geworden.
http://www.bramcam.nl/Diversen/R300/R300-17.png

En dit is wat er uit kwam.
http://www.bramcam.nl/Diversen/R300/R300-16.png

En zoals al was vatgesteld, het verweideren van de oude en weer solderen van de nieuwe condensatoren was een helllll.
Ik heb mijn hete lucht station op vol vermogen op rond de 350C (1KW) gezet en moest daarna flink lang stoken voor mijn 150Watt soldeerstation ook maar iets uitrichte met zijn dikste punt...
Door het lang stoken op de pads aan de onderzijde gaat ook het masker rond de + aansluiting een beetje stuk.
Hier wordt dan bij het weer monteren de +pool vast gezet aan het massa vlak $#@$@#@#$$@#
De rede hiervan is, de ongelovelijke kleine ruimte die ze vrij laten rond het + padje!

Maar met mijn loep, wattestokjes, alcohol, een oude tandenborstel enz. heb ik het goed schoon gekregen zodat ik ieder padje goed kon controleren.
Geen foto's hiervan, sorry.

En hier een screenshot van de util "top"
Hij is nog niet helemaal in rust daar de Server net aan staat.
http://www.bramcam.nl/Diversen/R300/R300-18.png

Ik zorg er ook altijd voor dat de klok goed loopt, dit staatje is na ongeveer 15 uptime.
http://www.bramcam.nl/Diversen/R300/R300-19.png

Nu nog een paar dagen proef draaien en dan gaat hij weer het datacenter in.

Groet,
Blackdog

You have your way. I have my way. As for the right way, the correct way, and the only way, it does not exist.