Was ist SOTA im Bereich KI?

Wie so oft verbirgt sich hinter einem unverständlichen Wort, das in Großbuchstaben geschrieben wird, eine einfache Abkürzung, in diesem Fall State Of The Art. Ich möchte in diesem Beitrag kurz beschreiben, wie der derzeitige „Stand der Technik“ im Bereich Künstliche Intelligenz ist.

State Of The Art der Künstlichen Intelligenz

Sprachassistenten. Industrie-Roboter. Face ID.

Künstliche Intelligenz (KI) ist allgegenwärtig. Zahlreiche Technologien und Anwendungsgebiete werden mittlerweile unter dem Schlagwort Künstliche Intelligenz zusammengefasst. Wie können autonome Fahrzeuge Menschen erkennen? Wie und wo kann Künstliche Intelligenz im Online Marketing eingesetzt werden? Warum entwickelt sich das Forschungsgebiet so rasant weiter? Die Antworten auf diese elementaren Fragen habe ich in diesem Artikel zusammengefasst.

Wie Künstliche Intelligenz Bilder erkennt

In selbstfahrenden Autos wird computerunterstütztes Sehen („Computer Vision“) angewandt.

Die Grundlage dafür ist die Bildklassifikation.

Die Künstliche Intelligenz dahinter erkennt Objekte in Bildern und ordnet diese Objektklassen zu. Dadurch kann zum Beispiel ein Mensch von einem Tier unterschieden werden.

Die Bildklassifikation ist bereits ein sehr gut untersuchtes Aufgabenfeld.

Lösungsansätze werden mithilfe von Testaufgaben auf ihre Leistungsfähigkeit untersucht.

Die Datensätze für die Testaufgaben bestehen aus einer Vielzahl von Bildern unterschiedlichster Objekte.

Die Aufgabe für die Anwendung besteht darin, möglichst vielen dieser Bilder die richtige Objektklasse zuzuordnen.

Je mehr Bilder richtig zugeordnet werden, umso höher ist die Erfolgsrate der Künstlichen Intelligenz.

Ein solcher Datensatz ist beispielsweise Image-Net.

Er besteht aus Millionen von Bildern mit tausenden verschiedenen Objektkategorien. Teilweise sind Objekte sogar für Menschen nur schwer zu unterscheiden, wie beispielsweise bei Bildern von Hunderassen. Nichtsdestotrotz liegt die Erfolgsrate der Künstlichen Intelligenz bei „Image-Net“ bei 87,8 Prozent.

CIFAR-10 ist ein weiterer Datensatz für Testaufgaben in der Bildklassifikation. Dabei müssen lediglich zehn unterschiedliche Objekttypen unterschieden werden. Der Bestwert liegt hier sogar bei 99,3 Prozent.

Hirntumore im MRT-Bild eines Gehirns erkennen

Auch in der Medizin wird Künstliche Intelligenz eingesetzt.

Sie hilft zum Beispiel durch die Analyse von MRT-Bildern Tumore zu erkennen.

Die Fortschritte dieser Technologie sind durch Testergebnisse belegt. In den letzten vier Jahren stieg die Erkennungsrate beim „BRATS2013“-Test von 88 Prozent auf 92,5 Prozent.

Vorhersage von Klickraten auf Werbebanner

Künstliche Intelligenz wird auch im Online-Marketing eingesetzt.

Mithilfe von Künstlicher Intelligenz wird zum Beispiel versucht, die Click-Through-Rate von Inhalten vorherzusagen.

Gute Vorhersagen sollen dabei helfen, den Inhalt und die Platzierung zu optimieren. In den letzten vier Jahren kam es hierbei zu Leistungssteigerungen, wie sich an den Ergebnissen des CRITEO-Datensatzes zeigt.

Die Steigerungen sind in diesem Bereich jedoch nicht so deutlich, wie im Bereich der Bildverarbeitung. Das hier verwendete Qualitätsmaß „AOC“ wird im Artikel https://towardsdatascience.com/understanding-auc-roc-curve-68b2303cc9c5 näher beschrieben.

Weitere Aufgabenstellungen

Noch größere Fortschritte gelangen in den letzten 2-3 Jahren im Bereich der Sprachverarbeitung („Natural Language Processing – NLP“). Das automatische Übersetzen hat durch Dienste wie Google Translate oder DeepL eine Qualität erreicht, welche im täglichen Einsatz verwendet werden kann.

Neueste Ansätze bringen erstaunliche Resultate bei der Erzeugung digitaler Inhalte, wie Texte, Videos oder Bilder, hervor. Beispiele hierfür findet man unter anderem in meinen Blogbeiträgen „Website zur Texterzeugung“ oder „Erzeugung von Fake Videos“.

OFFENHEIT ALS ANTRIEB DER WISSENSCHAFT

Eine umfassende Auflistung der derzeitigen Forschungsgebiete und Problemstellungen der Künstlichen Intelligenz, mitsamt spannenden Ranglisten, ist unter Papers With Code zu finden.

Die Website liefert Zugriff auf die aktuellsten wissenschaftlichen Arbeiten („Papers“) und den Quellcode („Code“) hinter den Implementierungen.

So können die Ergebnisse von jedem nachvollzogen werden, oder die Technologie kann für eigene Lösungen und Produkte verwendet werden.

Fazit

Im Bereich Künstliche Intelligenz ist es durchaus üblich, nicht nur die Ergebnisse, sondern auch den Programmiercode offen zu legen. Diese Offenheit ist eine wichtige Voraussetzung für die schnelle Weiterentwicklung, die das Wissensgebiet derzeit erfährt.

Ich schreibe hier und auf meinem persönlichen Blog www.stoeckl.ai ab sofort zu den Themen Data Science, Künstliche Intelligenz und Machine Learning.