Donnerstag, 23. Juni 2016

ELWIS-Controller hängen sich seit 02:53 Uhr in unregelmäßigen Abständen auf

Seit 02:53 Uhr hatten sich in unregelmäßigen Abständen die ELWIS-Controller einiger Cavities und eines Klystrons aufgehängt.  Um 10:46 Uhr wurde beschlossen den Betrieb beim nächsten Störfall zu unterbrechen und alle ELWIS-Controller mit neuen Updates zu bespielen und neu zu booten. Um 13:25 Uhr war es dann so weit. Der ELWIS-Controller SL_Kly1 hing sich auf. Die Update- & Reboot-Aktion wurde gestartet. Um 15:00 Uhr stellte sich heraus, dass sich die ELWIS-Controller von zwei Cavities nicht booten ließen. Ein Tunnelzugang wurde erforderlich. Ursache: Beide Controller defekt. Um 15:45 Uhr liefen kurzzeitig alle 26 Controller wieder, bis sich der Controller von SR_Kly2 aufhing. Bei diesem Kanditdaten war offensichtlich das Update nicht richtig durchgelaufen. Nach nochmaligem Update war auch er wieder im Spiel. Zwischenzeitlich hatte sich auch der Kontroll-ELWIS-Controller aufgehängt. Auch bei diesem Kandidaten war das Update offensichtlich nicht richtig durchgelaufen. Um 16:15 Uhr war der Spuk endlich vorbei. MHFe meldet die HF-Systeme wieder betriebsbereit.  
Die Ursache für die Probleme war zu diesem Zeitpunkt noch völlig unbekannt. Es war auch nicht sicher, ob die Probleme durch die Update- & Reboot-Aktion dauerhaft beseitigt worden waren.

Bilanz: Mehr als 5 Stunden Ausfallzeit und zwei defekte Controller

Im Kampf gegen die Zeit werden alle 26 ELWIS-Controller der PETRA HF-Systeme mit neuen Updates bespielt und neu gestartet.