COSY - Webseite | Anomalie Detektion

Die Identifikation von Anomalien in Datensätzen ist in zahlreichen Anwendungsszenarien von Interesse. Egal ob es um die Erkennung von Produktionsfehlern, Krankheitsbildern, ungewöhnlichem Traffic in Netzwerken oder, wie im hier beschriebenen Versuch, um Event-spezifische Veränderungen des Raumklimas geht, werden Techniken benötigt welche Anomalien in großen Datenmengen erkennen können. Dabei reicht es oftmals nicht aus isolierte Veränderungen einzelner Parameter zu betrachten, stattdessen muss das Zusammenspiel einer Vielzahl von Parametern ausgewertet werden.

Im hier beschriebenen Versuch werden exemplarisch anhand der Messwerte von Umweltdatensensoren Events in Form von geöffneten Fenstern und Türen in einem kleinen Raum detektiert. Die Messwerte werden in kurze Zeitintervalle unterteilt welche jeweils mittels maschinellem Lernen als Petri-Netz repräsentiert werden. Die beschreibenden Matrizen dieser Petri-Netze werden schließlich klassifiziert um entscheiden zu können ob in einem Zeitintervall ein Event aufgetreten ist oder nicht.

Teilbereiche

Bei den in diesem Versuch erfassten und betrachteten Messwerten handelt es sich um die Raumtemperatur, die Luftfeuchtigkeit und die Luftqualität. Um die Zusammenhänge zwischen diesen Daten über den zeitlichen Verlauf zu modellieren werden jeweils fünfminütige Intervalle als ein Petri-Netz abgebildet.

Petri-Netze sind eine mathematische Modellierungssprache zur Abbildung diskreter verteilter Systeme. Anwendung finden sie in diversen Bereichen, beispielsweise zur Modellierung von biologischen Systemen, Geschäftsprozessen, in der Logistik, im Maschinenbau oder in der Telematik. Grundlegend handelt es sich bei Petri-Netzen um Graphen die aus Stellen und Transitionen bestehen die durch gerichtete Kanten verbunden sind. Stellen enthalten Markierungen. Abhängig von der Markierung der verbundenen Stellen kann eine Transition feuern und damit die Markierung der verbundenen Stellen ändern. Damit lassen sich Zustandsänderungen im modellierten System darstellen. Eine detailliertere Erklärung zu Petri-Netzen gibt es im Versuch zur Systemidentifikation.

Beispiel für ein Petri-Netz

Zum Lernen der Topologie der Petri-Netze wird ein Gradientenabstieg-Algorithmus eingesetzt. Gradientenverfahren sind Techniken zur Lösung von Optimierungsproblemen bei denen Parameter einer Funktion schrittweise angepasst werden um das Ergebnis der Funktion an einen Zielwert anzunähern. Dabei werden die Parameter anhand des Gradienten der Fehlerfunktion und einer Änderungsrate angepasst. Eine genauere Betrachtung von Gradientenabstiegsverfahren erfolgt in den Versuchen zur Objekterkennung und Sequenzerkennung.

Zur Vereinfachung der Matrizen welche die Topologien der gelernten Petri-Netze beschreiben wird Hauptkomponentenanalyse angewandt. Dabei werden die Werte der mxn-Matrizen durch möglichst aussagekräftige Linearkombinationen genähert um stattdessen 1xn-Vektoren zu erhalten. Weitere Informationen zur Hauptkomponentenanalyse gibt es im Versuch ?.

Um die Datensamples in solche die Anomalien enthalten und solche die keine Anomalien enthalten unterscheiden zu können wird ein K-nächste-Nachbarn(KNN)-Klassifizierer verwendet. Dies erfolgt durch überwachtes Lernen in dem mit Samples mit Anomalien und ohne Anomalien ein Modell erstellt welches für unbekannte Samples entscheiden kann ob sie Anomalien enthalten oder nicht. Die Funktionsweise des KNN-Algorithmus wird im Versuch zur Schallbasierten Ortung erklärt.

Allgemeine Beschreibung

Teilbereiche

Überblick

Grundlagen

Versuchsaufbau

Anwendung