Voeding stopcontacten via internet bedienen?

buckfast_beekeeper

Golden Member

Een goede server heeft 2 voedingen en 2 net aansluitingen. In onze netwerk kasten zit aan de ene zijde netspanning en aan de andere zijde UPS. Kwestie van het voedingsnet en de voeding redundant te houden.

Vinden de servers het leuk dat je gewoon de spanning er af haalt?

Kan je de servers niet beter laten rebooten door een dagelijks of wekelijks scriptje op een nachtelijk moment?

Honing kan je importeren, bestuiving niet.

het zou me niet verbazen dat ts 16A B automaten heeft, welke trippen als er 3 servers op moeten starten na een stroomuitval. de voedingen zijn dan wel 1000VA, maar leveren nog niet de helft van dat vermogen.. normaal zijn serverkasten met een trage automaat gevoed.

[Bericht gewijzigd door testman op 3 april 2017 18:07:22 (46%)]

waar rook was, werkt nu iets niet meer

Op 3 april 2017 10:39:28 schreef DJSmiley:
Idd, normaliter is dit met een switched PDU te doen als ook een IRMC/Idrac/Ilo niet werkt.

Dat is daarvoor bedoeld, ipv in een meterkast met kaku of ander materiaal gaan werken. Zoiezo wil je dat niet draadloos, en al helemaal niet met een open 433Mhz protocol.

Veel PDU's zijn van APC, maar ook genoeg andere merken die dit hebben. Al dan niet in 'lange' PDU achterin het rack, of in 1U vorm.

Alleen
Waarom crashed zo'n bak? Dat ding rebooten is symptoonbestrijding
En waarom met de hand rebooten? Een nagios/zabbix/whatever scriptje die de bak monitored en via snmp de ilo of pdu een reboot laat uitvoeren is een veel nettere oplossing.

Als zo een server crasht, draait deze onder zijn gewoon vermogen. Pak dat ik ergens kan instellen dat vanaf er een server onder de 700VA trekt, dat deze dan gewoon automatisch reboot? Dat zou mss wel een stuk makkelijker zijn dan een PLC en een hoop extra modules bij te gaan monteren...?

Je hebt een eigenaardige opstelling. Die servers zijn aan het bitcoin-minen?

Het liefst hestart je niet door vermogen te meten. Als je server even moet rebooten vanwege een update of iets dan zou hij in een oneindige herstartlus kunnen komen.

Als de software wat gebrekkig is en je kan dat niet verhelpen kan je een scriptje draaien dat sowieso elke XX uur reset of je zorgt dat je in de gaten houdt dat het geheugen volloopt of iets.

Op 3 april 2017 18:14:50 schreef K7Jz:
Je hebt een eigenaardige opstelling. Die servers zijn aan het bitcoin-minen?

Het liefst hestart je niet door vermogen te meten. Als je server even moet rebooten vanwege een update of iets dan zou hij in een oneindige herstartlus kunnen komen.

Als de software wat gebrekkig is en je kan dat niet verhelpen kan je een scriptje draaien dat sowieso elke XX uur reset of je zorgt dat je in de gaten houdt dat het geheugen volloopt of iets.

Onder andere bitcoin-minen ja. Het is niet dat deze constant crashen... Om de paar weken heb je af en toe eentje die gaat crashen. Lijkt me makkelijkst als deze dan gewoon gaat rebooten. Anders doe ik het manueel. Maar aangezien ik gebrek aan tijd heb en me daar niet constant mee kan bezighouden zou het interessant zijn moesten deze bij een crash gewoon vanzelf terug rebooten zodat ik geen 100 km moet rijden om een server te rebooten begrijp je? En deze via een app monitoren zou ideaal zijn!

't is dus geen volwaardige server maar een desktoppctje of budgetbord zonder ilo (waarbij de focus ligt op CPU/GPU)

Wat is er mis met de reset knop? moet je perse de voeding onderbreken? De resetknop kun je met een simpele arduino en relais boardje schakelen. Desnoods automatisch bij gemiste pings

Met een rPI kan dat ook, dan kun je er ook nog naar toe SSHen om 'm handmatig te schoppen

[Bericht gewijzigd door DJSmiley op 3 april 2017 18:47:56 (20%)]

de resetknop triggeren met een opto werkt iid ook. de hele voeding resetten is meer werk, en kost meer centen om te bouwen.

maar om 100 servers van op afstand te kunnen resetten gaat toch wel iets aan huisvlijt kosten om goedkoop te houden. het zijn gewoon 100 outputs die nodig zijn..

waar rook was, werkt nu iets niet meer

komaan zeg
om 100 servers te resetten spreken we hier over een bedrijf die die kosten in no way terug heeft, gewoon kwestie dat niemand nog ter plaatse moet zijn tenzij bij grote panne.
100 servers in blokken van 3 stuks per contactor is peanuts.
Een ander groot voordeel is dat men alles kan opvragen en dat bij spanningsval men een sms krijgt en ook bij opkomst van spanning.
Dit wordt al veelvuldig gebruikt in veel bedrijven met het voordeel dat bedrijfsleiders ook hun installatie vanop afstand kunnen bedienen.
Water geven aan de planten ? of dieren ? gewoon een sms ... niet zeker ? vraag een status op, alles via android of iphone.
100 servers resetten is het commando aan 1 hoofd contactor, zo simpel.

100 servers tegelijk aan/uit schakelen is idd geen punt, kwestie van de juiste hoofdschakelaar nemen of een dikke contactor. maar de servers per stuk schakelen via de voeding is wat complexer. dan zou je de uitgangen van de relais meteen uit moeten voeren naar de servers, vanuit een grote kast met dinrails. die apc dingen zijn niet bruikbaar, want ze hebben wel veel aansluitingen, maar vanuit 1 groep gevoed. de knx units kun je van 8 verschillende voedingen voorzien. en ja daar zit wel wat geld in, en primaire stroom meten van een server is niet bepaald standaard om te bepalen of deze vast is gelopen, maar ok.

echter vallen bitcoin miners doorgaans niet onder het pro segment met ups, generator backup, ruim berekende airco, brandblussysteem enz. die extra dingen welke een groot datacenter wel bevat beslaan wel een leuk bedragje.

waar rook was, werkt nu iets niet meer

Een rpi met 12-16 (?) Pinnen kan misschien direct op de reset jumper.

Anders met een opto of relais. Relais kan op 230V en per groep maar waarom zou je die moeite doen.

@testman
wat kosten 100 contactors -- ik zou relais nemen voor die stroom "per" server -- in een kast voor een bedrijf ? en neem er dan nog 1 hoofdcontacor bij = peanuts. Alle relais kunnen apart via smart of iphone in of uitgelegd worden en een algehele reset is de hoofdcontactor, dan gaan alle servers down en starten op zichzelf terug op. Als ge 1 iemand op een weekend een paar uren moet doen gaan kijken naar die servers is de kost al terug betaald. Zo goed als alle servers starten vanzelf op na een spanningsval. Via status kan je zien welke al dan niet opgestart zijn en dan nog kan je via internet (indien ter beschikking) gaan zien wat er fout loopt. Dan nog kan je indien wenselijk -- normaal niet omdat een andere server de data heeft overgenomen en zijn werk over neemt van diegene die faalt -- iemand ter plekke sturen. De ups is hier maar vandoen aan de bron en dat is het hart van de installatie. Als de spanning weg is is alles weg en de ups zal dat ook maar vast houden met de stroom die die kan leveren. Maar een spanningsval heden ten dage van uren en uren is ook al lang voorbij.

als je een paar keer moet komen om 1 server te resetten zal een zut relais en wat aansturing er na een tijdje wel uit zijn idd. hangt ervanaf hoe belangrijk dat is, een raid 5 schijf zal het ook weleens begeven, dan moet er ook iemand langskomen om die te wisselen, als de boel te warm wordt ( airco ) icm leeftijd van het gebruikte spul dan komen de datadragers ook met errors op den duur.

overigens kost een dergelijke installatie meer als een paar manuren, dergelijke bedragen zijn niet in een weekendje al eruit. als je het goed maakt iig, geen 10A relais van een vaag merk met spanlijnen van verdeelkast naar servers( zoals dat gemiddelde it'er dat maakt ) dan doe je er wel wat langer over. evengoed op de langere termijn wel interessant, zeker als je er steeds 100km voor moet rijden.

waar rook was, werkt nu iets niet meer

Je kan je ook afvragen of het met bitcoinminen überhaupt zin heeft om er speciale voorzieningen voor te treffen. Elke week rebooten met script, één keer per maand langs. Thats it. 100% of 97% cpu zal toch geen tientallen euro's per week kosten?

@testman
een "vaag" merk wordt niet gebruikt door een bedrijf die 100 servers of meer heeft.
Een raid systeem die nooit een upgrade krijgt krijgt zeker eens tegen zijn "k.....n" en dat heb ik al meegemaakt dat die allemaal binnen een korte tijdspanne kapot zijn -- dit in dezelfde kast. (en dat binnen een dag !!!)
De vraag is niet hoe belangrijk het is, de vraag is of het wel commercieel vatbaar is om daar iedere keer iemand naar toe te sturen. Het is zeker beter dat men die zaken vanop afstand kan bedienen en bij hoge nood kan men ter plekke gaan.
Stel een server lokaal van 100 servers elk zijn eigen relais + 1 hoofd contactor + de bediening via smartphone ? de prijs is de kost van 1 persoon die eens de verplaatsing moet doen en zich een paar uren moet bezig houden om er een paar te resetten.
Feit is dat ge vanop eender welke plek weet wat al dan niet werkt.
@K7Jz
soms kan je niet verder dan een reboot, dit soms op de meest onmogelijke uren.

maartenbakker

Golden Member

@K7Jz: De stroomkosten van 100% draaien zijn bijna die ordegrootte dus uitval kost minder, ervan uigaande dat de bitcoinkoers zich in dezelfde ordegrootte bevindt als de kosten van de mijnbouw.

Als je met CPU+GPU flink doorbuffelt op niet al te slechte hardware, dan schat ik het opgenomen vermogen ruwweg op 300W. Dat geeft 50,4kWh per week. Bij 0,25 euro per kWh kost dat 12,60. Ik weet niet of dat loont qua opbrengsten, zeker omdat hostingstroom vaak duurder is. Als je 3% van de tijd down bent zou dat nog best het verschil tussen winst en verlies kunnen zijn in een marginale businesscase.

Overigens bestaat er al sinds jaar en dag een beter systeem om gecrashte servers een trap te geven. Niet met inloggen op een stopcontact maar gewoon met een heartbeat en een draadje naar de resetknop. In de controllerwereld heet dat een watchdog. En afhankelijk van hoe hard de crash is, kun je softwarematig misschien nog aangeven of de server bij een kernel panic of blauw scherm nog probeert om zelf te rebooten.

"The mind is a funny thing. Sometimes it needs a good whack on the side of the head to jar things loose."

Ik denk dat ik zal kiezen voor een PLC systeem. Kwestie dat deze zeer breed programmeerbaar zijn. De monitoring, history data en bediening vanop afstand is goud waard kwa tijdsbesparing! Als er dan een server meerdere keren per week reboot, is dit makkelijk zichtbaar en weet je zo aan welke server er juist wat scheelt. Wekelijks 1 maal passeren en alle servers die te veel reboots in de history vertonen dan eens controleren. Perfect! Ik post wel nog eens als ik de boel klaargespeeld heb hoe ik het juist gedaan heb ;)

Tnx voor de tips!!!