Ist Deep Learning kompliziert?

Der Begriff Deep Learning ist derzeit in aller Munde, auch in der Werbung allgegenwärtig und ziert so manches Produkt. Ich möchte in diesem Beitrag etwas beleuchten was wirklich hinter dem Begriff steht, um auch einordnen zu können, ob die Bezeichnung richtig vergeben wird, und nicht nur ein “Buzzword” ist, das einfach schön klingt.

Das Grundprinzip ist einfach

Der renommierte Informatiker und Turing Prize Gewinner Judea Pearl hat einmal mit dem etwas überspitzt formulierten Zitat:

“Machine Learning is just glorified ‘curve fitting’ ”

versucht auszudrücken, dass die Mechanismen hinter dem Bereich Machine Learning in der Künstlichen Intelligenz, von dem Deep Learning ein Teilbereich ist, sehr einfach sind, aber üblicherweise glorifiziert werden. Er unterstreicht damit, dass hinter den gängigen Techniken vieler Deep Learning Anwendungen – zum Beispiel bei der Bilderkennung oder Sprachverarbeitung – dieselben Prinzipien wie bei der einfachen Aufgabe, eine Kurve durch eine gegebene Menge von Datenpunkten zu legen, steckten. Schon an dieser sehr einfachen Karikatur von Machine Learning Lösungen lassen sich aber nicht nur deren Grundprinzipien erkennen, sondern auch typische Gefahren im Umgang mit dieser Technologie diskutieren und erkennen.

In meinem Artikel unter https://towardsdatascience.com/watching-machine-learning-models-fitting-a-curve-c594fec4bbdb habe ich versucht dies mit Hilfe von Bildern und Animationen zu verdeutlichen.

Gefahr der Überanpassung

Die wichtigste Gefahr, die auch hier versucht wird aufzuzeigen, ist das sogenannte “Overfitting”, das man am besten mit Überanpassung übersetzen würde. Hier sieht eine KI-Anwendung in den Daten, die zur Erstellung des Modells verwendet werden, mehr Muster und Strukturen, als eigentlich in den Daten enthalten sind.  Dadurch entstehen dann Systeme, die schlecht generalisieren, d.h. neue Situationen schlecht erklären und falsche Entscheidungen treffen.

Zu viele Muster zu sehen ist nicht nur eine Eigenschaft von KI-Systemen, sondern auch eine sehr menschliche Schwäche. Unser Wahrnehmungsapparat, der zum Beispiel darauf trainiert ist, Gesichter zu erkennen, gaukelt uns auch in vielen anderen Objekten vor ein Gesicht zu sehen. Das bekannteste Beispiel ist der  sogenannte “Mann im Mond” (https://de.wikipedia.org/wiki/Mann_im_Mond),  aber auch sonst gibt es viele solcher Beispiele – etwa in folgendem Bild, das uns im Hamburger ein Gesicht erkennen lässt.

Was grenzt Deep Learning von anderen Machine Learning Techniken ab?

Die beschriebenen Prinzipien und Gefahren gelten für Machine Learning im Allgemeinen, aber besonders für das Teilgebiet Deep Learning, da hier sehr umfangreiche Modelle eingesetzt werden, die zwar einerseits komplexere Aufgaben lösen können, aber auch mehr zur Überanpassung neigen. Das “Deep” im Namen leitet sich dabei von der Tiefe der Modelle in dem Sinne ab, dass die hier üblicherweise verwendeten Neuronalen Netze (https://de.wikipedia.org/wiki/K%C3%BCnstliches_neuronales_Netz) aus vielen Schichten bestehen, also in diesem Sinne tief sind.

Fazit

Deep Learning ist zwar nicht erst in den letzten Jahren entstanden, aber durch die Erfolge, die auf dieser Technik basierende Anwendungen in den letzten Jahren erzielt haben, ist es in unseren Alltag eingedrungen – dies einerseits als Technologie, die beispielsweise unser Handy durch Gesichtserkennung entsperrt, aber auch als “Buzzword”, das zahlreiche Produkte, teils zu recht und teils zu unrecht, ziert.