UPGREAT Blog

Ausfallzeiten in Unternehmen reduzieren – mit maschinellem Lernen?

Unternehmen sind heutzutage ohne Frage auf ihre IT angewiesen – selbst in klassischen Produktionsbranchen geht inzwischen ohne Computer und Netzwerk meist nichts mehr. Angesichts dieser Abhängigkeit können Störungen der IT-Infrastruktur Firmen in ernsthafte Schwierigkeiten bringen. Ein kurzzeitiger Ausfall hat vielleicht nur ein paar Anrufe von verärgerten Kunden zur Folge. Ist die Infrastruktur aber über Stunden oder sogar Tage nicht verfügbar, kann das Geschäftsziele unerreichbar machen.

Hinzu kommt, dass die IT-Abteilung bei einem Ausfall einen Grossteil ihrer Ressourcen auf die Lösung des Problems verwenden muss, anstatt produktiv für das Unternehmen tätig zu sein. Schlimmstenfalls kommen noch Schuldzuweisungen zwischen einzelnen Abteilungen auf, die zusätzliche Ressourcen kosten und das Betriebsklima beeinträchtigen. Da stellt sich natürlich die Frage, ob es nicht einen effektiveren und effizienteren Weg gibt, mit Ausfällen in der IT umzugehen und Ausfallzeiten zu reduzieren?

Wie kommt es zu Ausfällen?

Möchte man die Ausfallzeiten reduzieren, ist es nötig, zunächst einmal die Ursachen der Ausfälle zu analysieren. Grundlegend gehen die Probleme in der Regel auf die sogenannte „Anwendung-Daten-Lücke“ (englisch App-Data-Gap) zurück – über Anwendungen fordert der Nutzer Daten an, um mit ihnen zu arbeiten, die Infrastruktur kann diese Daten aber nicht oder nicht schnell genug bereitstellen. Einer der wichtigsten Gründe für diese Anwendung-Daten-Lücke ist die enorm hohe Komplexität von modernen IT-Infrastrukturen. Es müssen zahllose Komponenten und Anwendungen zusammen funktionieren, deren Kompatibilität im Normalfall nur unter „Laborbedingungen“, also in einem sehr begrenzten Umfang, getestet wurde. Es kann also sehr schnell passieren, dass zwei Komponenten nur unzureichend miteinander „harmonieren“ – und da die langsamste Komponente eines Systems die gesamte Geschwindigkeit bestimmt, kann ein einzelnes Problem die gesamte IT ausbremsen.

Bisher haben IT-Abteilungen versucht, dieses Problem auf folgende Weise zu lösen: Sie haben sich Wissen über sämtliche verwendeten Komponenten angeeignet und das Zusammenspiel mit einer Reihe von Tools überwacht. Das ist allerdings mit einem beträchtlichen – auch finanziellen – Aufwand verbunden. Ausserdem kann das IT-Team immer nur auf Probleme reagieren und versuchen, diese möglichst schnell zu beheben. Ausfallzeiten verhindern lassen sich auf diese Weise jedoch kaum. Es gibt jedoch einen neuen Ansatz, der bessere Ergebnisse bei geringerem Aufwand verspricht: maschinelles Lernen und Big Data.

Eine Maschine kann Probleme schneller entdecken und beheben

Durch maschinelles Lernen ist es möglich, Bereiche innerhalb der IT-Struktur zu identifizieren, die besonders effektiv arbeiten. Insbesondere dann, wenn eine breite Datengrundlage verfügbar ist: etwa die Daten einer Vielzahl von Kunden. So entstehen Vergleichswerte, mit deren Hilfe schwächere Bereiche der IT aufgedeckt und verbessert werden können. Durch die grosse Datenmenge können zudem mehr Vorfälle analysiert werden, was wiederum hilft, die Ursachen für auftretende Probleme schneller zu identifizieren.

Wurde ein Problem einmal erkannt, kann das System darüber hinaus verhindern, dass dieses an anderer Stelle erneut auftritt. Das ist vor allem dann sehr hilfreich, wenn ein Kunde ein Problem meldet, denn so können Sie diese Schwachstelle bei anderen Kunden sofort beheben, bevor sie sich verbreitet. 

Nimble: die praxisorientierte Lösung von HPE

Wollen Sie maschinelles Lernen nutzen, um die Ausfallzeiten in Ihrem Unternehmen zu reduzieren, steht mit HPE Nimble eine ausgereifte Lösung bereit. Sie kann auf Grundlage einer grossen Datenbasis potentielle Ursachen für Leistungseinbussen und Ausfallzeiten vorhersagen und diese automatisch beheben beziehungsweise verhindern. Statt also nur auf Probleme zu reagieren, wie es bisher üblich, können Sie systemische Unzulänglichkeiten ausschalten, noch bevor sie überhaupt zu einem Problem werden.

Und sollte Nimble tatsächlich einmal nicht in der Lage sein, ein Problem selbst zu lösen, liefert es der IT-Abteilung wertvolle Informationen für die Behebung. Ihre IT-Spezialisten müssen sich also nicht mehr durch Handbücher und Online-Foren kämpfen, sondern erhalten eine präzise Beschreibung des Problems. Das ist vor allem deshalb sehr hilfreich, da Nimble den gesamten IT-Stack überwacht und sich nicht, wie bisher gängig, auf die „üblichen Verdächtigen“ wie etwa den Speicher konzentriert.

Für den Kundendienst bedeutet Nimble ebenfalls eine enorme Entlastung, da in aller Regel nur noch einige Level-3-Supportmitarbeiter nötig sind, die sich mit dem entsprechenden Fachwissen um die wenigen Probleme kümmern, die Nimble nicht selbstständig lösen kann. Wollen Sie mehr über Nimble erfahren, laden Sie sich einfach das Whitepaper herunter.

WHITEPAPER HERUNTERLADEN

UPGREAT: Ihr Partner für alle IT-Fragen

Interessieren Sie sich für eine konkrete Implementierung in Ihrem Unternehmen oder sind Sie auf der Suche nach einem kompetenten Partner für sämtliche IT-Anliegen, dann sind Sie bei UPGREAT an der richtigen Adresse. Wir erarbeiten gemeinsam mit unseren Kunden individuelle Lösungen, die wir im Anschluss fach- und termingerecht umsetzen. Lassen auch Sie sich von unseren Leistungen und Services überzeugen!

Topics: Nimble Storage, Storage, Datenschutz, Automation, Rechenzentrum