Glaubt man jemanden, der ewige Jugend und die Heilung von allen Krankheiten verspricht? Wir denken nicht. So alt dieser Marketing-Trick auch sein mag, er findet selbst im datengetriebenen 21. Jahrhundert Anwendung.

Die Zeiten sind vorbei, in denen fliegende Händler das Elixier der Jugend verkauften. Vielmehr haben die postfaktischen "Next-Gen" Antiviren Software Hersteller ihren Platz eingenommen. Diese werben mit mysteriöser künstlicher Intelligenz und dem Machine Learning ihrer Produkte.

Diese Technologien, so wird es erklärt, sollen Malware und andere Bedrohungen fernhalten – egal, ob die Bedrohungen zuvor schon einmal entdeckt wurden oder komplett neu sind(!) Aber natürlich sind die dahintersteckenden Anwendungen viel zu kompliziert, dass normale User sie verstehen könnten – Es ist einfach pure Magie.

Wieder auf dem Boden der Tatsachen angelangt, können wir jedem versichern, dass sich hinter künstlicher Intelligenz und Machine Learning keine Magie verbirgt. Ersterer Terminus ist bereits seit etwas mehr als sechzig Jahren populär und steht für das Ideal einer allgemein intelligenten Maschine, die selbstständig lernen und Entscheidungen treffen kann, welche allein auf Umgebungsvariablen basieren, ohne menschliche Überwachung.

Gehen wir ein paar Schritte zurück von diesem unerreichten Traum von künstlicher Intelligenz und widmen uns dem vorangestellten Machine Learning. Diese Technologie beschäftigt ein ganzes Feld in der Informatik. Durch Machine Learning eröffnet sich für Computer die Möglichkeit aus Unmengen von Daten Muster zu erkennen und Erkenntnisse daraus abzuleiten. Selbst wenn dieses Konzept neuer ist (als das der Künstlichen Intelligenz), wird es doch schon seit den 1990er Jahren in Antiviren Software eingesetzt.

Wer sich jetzt verloren fühlt, für den haben wir zwei kleine Beispiele parat. Wer kann sich nicht an die Gesichtserkennung von Facebook erinnern? – Die Funktionsweise dahinter basiert auf Machine Learning. Oder die Filmvorschläge bei Netflix? – Auch dafür ist Machine Learning zuständig.

“In der Cyber Security bezieht sich Machine Learning meistens auf eine Technologie innerhalb einer Antiviren Software, die dafür zuständig ist, den Unterschied zwischen sauberen und bösartigen Malwaresamples zu kennen.“

In der Cyber Security bezieht sich Machine Learning meistens auf eine Technologie, die auf einen riesigen Input an korrekt eingestuften sauberen und bösartigen Samples zurückgreifen kann. Eine Antiviren Software ist damit beispielsweise in der Lage, zwischen infizierten und nicht-infizierten Dateien zu unterscheiden. Dank dieses Trainings – auch bekannt als überwachtes Machine Learning– ist eine gute Antiviren Software in der Lage, die meisten potenziellen Bedrohungen zu analysieren, zu identifizieren und proaktiv zu handeln, damit Schaden vom User abgewendet wird.

Die Automatisierung dieses Prozesses macht die Sicherheitslösung schneller und hilft den Menschen, das exponentielle Wachstum in der Anzahl der täglich erscheinenden Malwaresamples zu bewältigen. Algorithmen, denen dieses Training fehlt und die in die Kategorie nicht-überwachtes Lernen fallen, sind in der Cyber Security fast unbrauchbar. Ein Grund ist das Sortieren der Daten in eigenwillige angelegte Kategorien. Dadurch könnten saubere Samples und bedrohliche Malware nicht korrekt voneinander unterschieden werden. Nicht-überwachtes Machine Learning ist besser geeignet, Anomalien in einem Datensatz zu finden, die für das menschliche Auge unsichtbar sind.

Bei ESET verwendet man beaufsichtigtes Machine Learning schon seit vielen Jahren. Dort heißt es „Automatische Erkennung“.

Hohe Erkennungsraten mit möglichst wenigen Falsch-Erkennungen erreichen Sicherheitslösungen nur dann, wenn auch erfahrene Experten (für den Algorithmus bzw. das Machine Learning) zu ähnliche Samples manuell einstufen. Damit werden Fallstricke bei der Entwicklung eines ausgefeilten Algorithmus vermieden; genauso wie Fehler, die im Zusammenspiel mit den anderen Schutzmechanismen einer Antiviren Software auftreten können. Machine Learning ist im Übrigen nur eine Schutztechnologie unter vielen in einer Antiviren Lösung.

Zusammengefasst können wir sagen, dass hinter Machine Learning keine Magie steckt. Es ist eine gut etablierte Technologie, die aber am besten durch menschliche Überwachung lernt, wie man bösartige Malware unter Unmengen von Daten herausfindet. Damit wird bereits Millionen ESET-Nutzern tagtäglich und weltweit geholfen, Bedrohungen aus dem Weg zu gehen.

Die Serie im Überblick:

  1. Prolog: Der Kampf um die Wahrheit in der Cyber Security
  2. Was ist Machine Learning und was künstliche Intelligenz?
  3. Häufige Missverständnisse bei Machine Learning und künstlicher Intelligenz
  4. Warum Machine Learning basierte Sicherheit intelligente Gegner nicht interessiert
  5. Warum eine Schutzschicht nicht genügt – auch wenn Machine Learning unterstützt
  6. Geister fangen: Die tatsächlichen Kosten der hohen Falsch-Positiv-Raten in der Cyber Security
  7. Wie Updates Antiviren Software stärkt
  8. Auch wir kennen Machine Learning und nutzen es seit Jahren

Mitwirkende: Jakub Debski & Peter Kosinar