Skip to content

Was ist maschinelles Lernen?

Wie kann sich die KI von sich aus weiter entwickeln?

Maschinelles Lernen (engl.: machine learning) ist eine andere Art, Computer zu programmieren. Klassisch gibt ein Programmierer einem Computer einen festen Algorithmus vor, also eine Menge von Instruktionen, die zu einem Bestimmten Ergebnis führen. Dabei ist es die Aufgabe des Programmierers diese Instruktionen so zu wählen, dass das gewünschte Ergebnis produziert wird, auch wenn die Eingaben variieren oder nicht immer optimal sind. Hier alle möglichen Variationen zu bedenken und abzufangen ist zeitaufwändig und schwer.

Maschinelles Lernen hingegen erlaubt es, Computer durch Beispiele zu trainieren. Man gibt dem Computer genug positiv und negativ Beispiele vor, und er lernt mit der Zeit, wie er diese voneinander unterscheiden kann. Dabei baut er sich seine eigenen Instruktionen auf. Man testet diese Instruktionen, in dem man dem Computer bisher unbekannte Daten gibt und überprüft, wie viele er davon richtig einordnet. Ist das Ergebnis noch nicht zufriedenstellend, trainiert man weiter. Am Ende erhält man ein „ausgelerntes“ Modell, dass nun für die Aufgabe für die es trainiert wurde angewandt werde kann. Da das Training sehr aufwendig und zeitintensiv sein kann wird es oft auf sehr leistungsfähigen Computern ausgeführt. Das Endergebnis kann aber auch auf weniger leistungsfähigen Geräten, wie zum Beispiel Smartphones, genutzt werden.

Dieser Ansatz ist besonders interessant für eine Reihe von Aufgaben, die vorher nur schwer für Computer zu lösen waren, da es schwer für Programmierer war, die nötigen Instruktionen von Hand zu erstellen. So wird maschinelles Lernen zum Beispiel oft eingesetzt, wenn ein Computer in Bildern oder Videos bestimmte Objekte, wie zum Beispiel Autos, erkennen soll. Ein Programmiere müsste unzählige Regeln erstellen, um dem Computer beizubringen, dass ein Auto verschiedene Formen, Farben und Größen haben kann und sich deren aussehen auch noch je nach Perspektive und Beleuchtung ändert. Mit maschinellem Lernen kann er dies dem Computer durch Beispielbilder beibringen.

Damit Maschinelles Lernen funktioniert braucht es drei Dinge: Daten, Merkmale und Algorithmen. Daten, also zum Beispiel Bilder oder Videos, werden zum Trainieren und Testen benötigt. Dabei gilt in der Regel „je mehr, desto besser“, denn je mehr Proben man hat, desto leichter ist es relevante Muster in ihnen zu finden. Hier zeigt sich auch eine potenzielle Schwierigkeit des maschinellen Lernens: Es ist manchmal gar nicht so einfach genug Daten zu bekommen. Zum Beispiel können zehntausende Bilder von Autos zu wenig sein, wenn man bedenkt, wie viele unterschiedliche Autos es gibt und, dass der Datensatz auch Bilder ohne Autos enthalten muss und in der Regel nur ein Teil davon zum Trainieren und der Rest zum Testen verwendet wird. Datensätze enthalten deshalb manchmal Daten im zweistelligen Millionenbereich. Dazu kommt, dass diese Daten in der Regel auch eine Beschriftung benötigen. Sprich, ein Mensch muss zu jedem Bild oder Video angeben, was darin erkennbar ist. Sonst wird es für den Computer schwer, die gewünschten Objekte zu erlernen.

Die zweite Zutat für Maschinelles Lernen sind die Merkmale (engl.: features) auf die der Computer schauen soll um die gewünschten Objekte zu erkennen. Die Auswahl der richtigen Merkmale ist essenziell um Fehler zu vermeiden und zu minimieren. So könnten vier Räder ein Merkmal zur Erkennung von Autos sein. Allerdings würde dies Autos mit mehr oder weniger als vier Rädern ausschließen und andere Objekte, die ebenfalls vier Räder haben, auch als Autos erkennen. Bei manchen Arten von maschinellem Lernen müssen solche Merkmale im Vorhinein gefunden und definiert werden, andere Arten können dies selbst.

Als drittes wird ein Algorithmus benötigt, der Beschreibt, wie nun in den Daten die Merkmale erkannt werden können. Die Wahl des Algorithmus hat dabei große Auswirkungen auf die Genauigkeit und Geschwindigkeit und die Größe des Endmodells. Aber wenn die Daten von vorne herein schlecht sind kann auch der beste Algorithmus keine guten Ergebnisse liefern. Heutzutage lassen sich die wichtigsten Algorithmen in vier Klassen unterteilen: Das klassische maschinelle Lernen, das verstärkende Lernen, Ensemblemethoden und neuronale Netze. Das klassische maschinelle Lernen kann sowohl überwacht, als auch unüberwacht durchgeführt werden. Beim überwachten Lernen (engl.: supervised learning) sind die Trainingsdaten bereits beschriftet und die gewünschten Ergebnisse somit bekannt. Beim unüberwachten Lernen (engl.: unsupervised learning) fehlen diese Beschriftungen und der Computer muss selber versuchen Muster in den Daten zu finden. Beim verstärkenden Lernen (engl.: reinforcement learning) werden bestimmte Aktionen positiv oder negativ belohnt und der Computer lernt mit der Zeit eine Strategie, mit der er die positiven Belohnungen maximieren kann. Ensemblemethoden kombinieren verschiedene Lernalgorithmen, damit sich deren Schwächen gegenseitig ausgleichen und so insgesamt ein besseres Ergebnis erzielt wird. Neuronale Netze werden im nächsten Punkt genauer beschrieben.

Maschinelles Lernen wird heutzutage in vielen Bereichen angewandt und kann unter anderem genutzt werden für Objekterkennung in Bildern und Videos, Spracherkennung und –synthese, Bildbearbeitung, Stiltransfer, oder maschinelle Übersetzung.

Newsletter

AI Leaders – We invest in future Technology

Lassen Sie sich den Megatrend KI nicht entgehen!