Skip to content

Was ist maschinelles Sehen?

Die Wahrnehmung unserer Welt für KI

Maschinelles Sehen (engl.: computer vision) ist ein Forschungsgebiet, das sich mit der Frage auseinandersetzt, wie Computer digitale Bilder und Videos verstehen können. Diese Fähigkeit ist für KI als auch für andere Anwendungsgebiete wichtig. Ein Computer muss dafür mehrere Aufgaben beherrschen. Zum Beispiel muss er erkennen können, dass unterschiedliche Bildpunkte zu unterschiedlichen Objekten gehören. Er muss unterschiedliche Objekte klassifizieren können, zum Beispiel als Personen oder Tiere. Er muss unterschiedliche Objekte identifizieren können, zum Beispiel als Person A und Person B. Oder er muss die Position eines Objektes in einem Bild lokalisieren können. Selbst jungen Kinder können solche Aufgaben schon nach kurzer Zeit mit ihnen bekannten Objekten lösen. Für Computer sind diese Aufgabe allerdings bis heute sehr schwer und nicht komplett gelöst.

Dies hat mehrere Gründe. Zum einen ist die Funktionsweiße des menschlichen Sehvermögens bis heute noch nicht komplett verstanden und so fehlen Theorien, die auf maschinelles Sehen angewandt werden könnten. Zum anderen ist die visuelle Welt sehr komplex. Es gibt unzählige Objekte verschiedenster Art und selbst innerhalb einer Gruppe von Objekten können sich diese drastisch in Größe, Farbe, Form und Oberflächenbeschaffenheit unterscheiden. Dazu kommt, dass jedes Objekt, teilweise oder ganz, aus verschiedenen Richtungen und Entfernungen, sowie unter verschiedener Beleuchtung sichtbar sein kann.

Nichtsdestotrotz gab es in den letzten Jahren große Fortschritte in der Bilderkennung. So kommen KI-Techniken wie maschinelles Lernen und Deep Learning zum Einsatz, um neuronale Netze so zu trainieren, dass sie zuverlässig Handschrift oder bestimmte Objekte auf Bildern erkennen können. Diese Bilderkennungsfähigkeiten werden wiederum in anderen KI-Anwendungen genutzt, um unsere Welt für die KI wahrnehmbar zu machen.

Newsletter

AI Leaders – We invest in future Technology

Lassen Sie sich den Megatrend KI nicht entgehen!