stirbt zuletzt, dass die da bis min 4 zu Sehenden, nach dem Vortrag in ihrem Glauben..

Schwarze Löcher für blutige Anfänger, Steini


Ich wiederhole mich zwar, aber glücklicher sind immer die Nichtwissenden oder besser Nichtwissenwollenden, sie stellen keine Fragen und Glauben..

Aus dem Leben eines Agnostikers: bei einem Cloudanbieter läuft ein Überwachungssystem für die einzelnen Komponenten; das ganze nach eigener Strickart (dies ist aber auch bei gängigen Systemen ursächlich so), mit dem Zweck mögliche zukünftige Ausfälle frühzeitig zu erkkennen und damit ein Ticketsystem zu versorgen.

Mir wurde die Aufgabe übertragen auch ein Auge auf die SQL Instanzen zu werfen, so dass diese daraufhin von mir verschiedenen Checks unterzogen wurden, um ein Bild zu bekommen. Dabei wurden spezifische Paramter angepasst, welche zu, nach meiner objektiven Messung, positiven Veränderungen an dem Reaktionverhalten führten. So weit so gut. Nach einigen Tagen wurde das System für diese Instanzen Rot, welches mir mit einem Ticket mitgeteilt wurde. weiter wurde berichtet, dass man schon einmal alle Instanzen neu gestartet habe, was aber nur kurz Erfolg gebracht habe, deswegen nun das Ticket an mich weiterging. Dieses Neustarten war eine ganz und gar nicht gute Nachricht für das Etwas zwischen meinen Ohren. Die Überprüfung der Systeme ergab, dass diese ein hervorragendes Anwortverhalten an den Tag legten, alle Messungen brachten weiterhin die optimalen Ergebnisse. Woran lag nun das Rot, und was soll es aussagen?

Diese Frage wollte oder konnte niemand beantworten. Das Re-Engineering der Instanzen, worauf die Messgröße beruhen könnte brachte keinen Ansatzpunkt, nur war in der Historie aus dem Log zu ersehen, dass nun richtigerweise mit der optimalen Memory-Auslagerungsgröße gearbeitet wurde. Also kam meinerseits die Frage auf, ob das Rot damit in Zusammenhang zu bringen sei? Nach einigen Tagen gab es darauf eine positive Bestätigung. Nun wurde die Sache aber interessant - wie funktioniert die Kette hier? in den nächsten Wochen war immer Rot am Monitor angesagt aber keine Tickets mehr! Dies war überhaupt nicht in meinem Sinne, weil dadurch ein wirklicher Ausfall erst vom Kunden bemerkt wird, dies wäre richtig Pferdemist auf meinem Tisch, den ich nicht haben wollte. Also galt es herauszufinden, wer denn nun den Prüfparameter verändern könne? Darauf gab es wieder mal nicht sofort eine Antwort, worauf ich mich fragte weiß es niemand oder gibt es eine Order per Mufti, die diese Info an mich unterband? Der Mufti aber, sah das rot ja auch regelmäßig, und den damit verbundenen Aufwand - Neustarten der Instanzen?

Letzendlich stellte sich heraus, dass es wirklich einzig und Allein dieses Intensive benutzen der Auslagerungsdatei war, welches als Indikator für rot herangezogen wurde, kein anderen Parameter des SQL Service. Dies war eine herbe Enttäuschung für mich, auch fast zu erwarten, nachdem, was ich mir über die potenziellen Möglichkeiten der vage in Erfahrung gebrachten Werkzeuge angelesen hatte. Wir einigten uns darauf die Paramter pro Instanz so zu verändern, dass je nach physich zugeteiltem Arbeitsspeicher die rote Farbe nur benuzt wird, wenn mehr als 80% davon in der Auslagerung benutzt werden (das Hardware IO ist hier hervorragend). Das Signal war weg, aber die Bauchschmerzen blieben, um was man sich noch hätte kümmern müssen, um hier einen Quantensprung zu erleben. Ich gab weiter zu bedenken, dass es eventuell ferige Module für den SQL und das Überwachungssystem gäbe, welche realistischere Angaben brächten.. Andereseits merkte ich auch ganz offensichtlich, dass dieses Hinterfragen der Umgebung irgenwie zu allgemeinem Unwohlsein führte, auf der einen Seite ist dies verständlich, auf der anderen Seite zeigt es aber, dass allgemein nicht die Erkenntniss der absoluten Abfolge von FAIL and SUCCESS als Notwendigkeit für den Firmenerfolg erkannt worden war.

IT'ler sind im allgemeinen ja etwas mehr norddeutscher, wenn sie aber etwas gemeinsames haben, immer bereit dafür zu streiten, hier war dies nicht ansatzweise zu erkennen, die Arbeit ruht auf einzelnen Wenigen mit Überlast verbunden mit Hardware.Ressourcen.Mangel

Comments


Comments are closed