Skip to main content

Die Grenzen der künstlichen Intelligenz

Warum KI in der Bildverarbeitung nicht ausreicht

KI-gestützte Bildverarbeitung hat sich für viele Anwendungen als wertvolles Werkzeug erwiesen, um Fehler zu detektieren, die mit dem menschlichen Auge zwar gut erkennbar sind, aber schwer mit einem IT-Regelwerk beschrieben werden können.

Derartige Aufgaben waren bisher nicht, oder nur mit sehr großem Aufwand lösbar. Zudem ermöglicht die KI-Technologie einige Aufgaben heute schneller und einfacher zu lösen, als dies mit regelbasierter Bildverarbeitung bisher der Fall war.

Künstliche Intelligenz (KI) in der Bildverarbeitung

Verwendung von KI zur Erkennung des Reifegrads von Tomaten

Künstliche Intelligenz ist ein Forschungsgebiet, das darauf abzielt, Maschinen zu entwickeln, die mithilfe intelligenter Algorithmen lernen, planen und Probleme lösen können.

Ein KI-basiertes System wird anhand einer großen Anzahl von Beispielen trainiert und versucht dann, das Gelernte auf neue Problemstellungen zu verallgemeinern, bei einem Einsatz im Bereich der industriellen Bildverarbeitung zum Beispiel auf die gesamte Varianz einer Produktion.

KI-basierte Fehlererkennung

Die Fähigkeit der KI, große Datenmengen schnell zu verarbeiten und aus früheren Erfahrungen zu lernen, macht sie zu einem wertvollen Werkzeug auch für die Bildverarbeitung. In der Praxis wird ein KI-System mit einer großen Anzahl an Bildern gefüttert, die sowohl Objekte als auch deren Umgebung enthalten. Das System ist dann in der Lage, die gesuchten Objekte zu identifizieren und die Umgebung zu ignorieren. Ein so trainiertes KI-System kann dann auf neue Bilder angewendet werden und die gewünschten Objekte mit hoher Genauigkeit identifizieren.

KI-basierte Brötchensortierung
KI-basierte Unterscheidung von Backwaren

Anwendungen und KI-Algorithmen in der Bildverarbeitung

Mit künstlicher Intelligenz können Bilder auf ihren Inhalt hin analysiert werden, beispielsweise um Fehler zu finden, Kanten zu extrahieren oder Objekte zu klassifizieren. KI findet hauptsächlich Einsatz in Anwendungen bei denen die Objekte sehr variabel sind und/oder unspezifische Merkmale oder Defekttypen aufweisen.

Klassifikation

Basierend auf vorher definierten Merkmalen werden Objekte einer Klasse zugeordnet.

Objekterkennung

Antrainierte Objekte werden lokalisiert und identifiziert, mit einem Rechteck umrahmt und beschriftet.

Semantische Segmentierung

Jedem Pixel in einem Bild wird eine Klasse zugewiesen. Trainierte Fehlerklassen können pixelgenau lokalisiert werden.

Anomalie Detektion

Bilder von fehlerfreien Objekten werden antrainiert, sämtliche Abweichungen werden detektiert.

Kantenextraktion

Ermöglicht das Extrahieren von Kanten die mit herkömmlichen Filtern nicht identifiziert werden können.

Instanz Segmentierung

Kombiniert Objektdetektion und semantische Segmentierung und ist besonders hilfreich, wenn Objekte nah nebeneinander liegen, sich berühren oder überlappen.

Deep OCR

Robuste Lokalisierung von Zeichen unabhängig von Ausrichtung, Schriftart und Polarität.


Die zusätzliche Verwendung von vortrainierten Netzwerken (CNNs = Convolutional Neural Networks und RNNs = Recurrent Neural Networks) ermöglicht es Anwendungen auch mit einer relativ geringen Anzahl an Trainingsbildern zu entwickeln, d.h. der Algorithmus anaysiert die antrainierten Bilder und lernt automatisch welche Merkmale zur Idenitifizierung verwendet werden können.

Die Grenzen der KI in der Bildverarbeitung

Die KI-Genauigkeit wird durch Faktoren wie Qualität des Bildes, Menge der im Bild enthaltenen Informationen, Bildauflösung und Beleuchtung beeinflusst. In der Praxis wird die KI auf eine bestimmte Bildauflösung trainiert und kann daher nur so gut sein, wie die Bilder, auf denen sie trainiert wurde. Ist die Bildqualität schlecht und die Auflösung niedrig, ist es für die KI schwierig, den Inhalt des Bildes genau zu analysieren. Dies kann auf einen Mangel an Details im Bild zurückzuführen sein, der es der KI erschwert, die Objekte im Bild zu erkennen, oder auf visuelles Rauschen, wie z. B. dunkle oder helle Flecken auf dem Bild, die eine Erkennung von Objekten behindern.

In der Bildverarbeitung ist es jedoch wichtig, zum Beispiel genau bei diesen „Flecken“ auf einem Bild anzusetzen, um festzustellen bei welchen davon es sich um Fehler handelt. Hier kommen dann aufwändige Trainingsprozesse ins Spiel bei denen diese „Flecken“ gerahmt werden müssen, einer Klasse zugewiesen werden müssen und sichergestellt werden muss, dass kein Bereich im Bild übersehen oder nicht markiert wird. Sollten nach diesem Training beispielsweise noch zwei Merkmale verwechselt werden, müssen weitere Bilder mit exakt diesen Merkmalen zum Trainieren verwendet werden und es ist extrem wichtig die jeweilige Klasse richtig zuzuordnen. Manchmal ist es auch notwendig Bilder die zu Verwechslungen führen wieder aus der Datenbank zu löschen. Dieses Training, notwendige Optimierungen und daraus resultierende Entscheidungen erfordern allerdings viel Erfahrung und einen hohen personellen Aufwand.

Auch schlechte Lichtverhältnisse machen einem KI-basierten Ansatz häufig Probleme und die Analyse von schlecht beleuchteten Bildern ist extrem schwierig. Auch bei Fehlern, die nicht sehr deutlich erkennbar sind, ist es nur nach aufwändigem Training möglich, zwischen Produktionsvarianz und eigentlichen Fehlern zu unterscheiden.

In unserem Markt gibt es jedoch keine andere Möglichkeit, als genauso vorzugehen. Die Ausnahme ist die Nutzung der sogenannte Anomaly Detection, einer Methode bei der nicht erkannt wird welcher Fehler vorliegt, sondern nur, dass eine Produktionsvarianz vorliegt. Hier kann es sich um einen Fehler handeln, oder auch nicht.

Genau hier kommt der Mensch wieder ins Spiel. Handelt es sich tatsächlich um einen Fehler, benötigt man keine weiteren „manuellen Eingaben“. In allen anderen Fällen muss jedoch nachtrainiert werden. Diese Vorgehensweise erfordert wiederum viel Erfahrung und Sorgfalt und macht den Einsatz von KI meist relativ teuer. Der Vorteil besteht jedoch darin, dass keine speziellen Programmierkenntnisse benötigt werden, was den Kreis der Anwender deutlich vergrößert.

In Kombination mit klassischen Bildverarbeitungsalgorithmen und einer geschickten Anwendung von trainierten Daten, lassen sich aber sehr gut halbautomatische Trainings generieren, die Zeit und Geld sparen.

Vorteile der Kombination von KI und menschlichem Fachwissen

Durch die Kombination von künstlicher Intelligenz und menschlichem Fachwissen können Bilder genauer und schneller analysiert werden, als dies bei einer manuellen Analyse der Fall wäre. Dies kann Unternehmen helfen, alle Bilder zu analysieren, auch solche mit schlechter Auflösung oder Qualität, um besser informierte Entscheidungen zu treffen. KI kann auch gut zur schnellen Analyse einer großen Anzahl von Bildern eingesetzt werden und dem Anwender Zeit sparen.

Illustration Kombination KI und menschliches Fachwissen

Die KI-Technologie ist sicher ein leistungsfähiges Werkzeug, reicht aber allein nicht aus, um eine zuverlässige Bildverarbeitung zu gewährleisten. Zum einen kann KI nicht messen, daher wird es weiter notwendig sein, KI-Technologie mit klassischer Technologie zu verbinden. Zum anderen ist die KI auch immer nur so gut, wie die ihr zur Verfügung stehenden Daten und benötigt eine ausreichende Menge an Bilddaten für das Training, die richtig gelabelt sein müssen.

Um eine genaue und zuverlässige Bildverarbeitung zu gewährleisten, muss KI unserer Meinung nach in Verbindung mit anderen Methoden wie der manuellen Dateneingabe und der Analyse durch menschliche Experten eingesetzt werden. Diese Kombination ist dann eine leistungsstarke Methode für die Bildanalyse, die es Unternehmen ermöglicht, Bilder schnell und genau zu analysieren, Abläufe effizienter zu automatisieren, und die Qualitätskontrolle zu verbessern.

Sie möchten wissen, ob sich Ihre Aufgaben mit KI lösen lassen?

Gerne besprechen wir Ihre Ideen und Anforderungen im Detail und entwickeln gemeinsam mit Ihnen eine spezialisierte Lösung, zugeschnitten auf Ihre individuellen Bedürfnisse.

Rufen Sie uns unter +49 89 125094350 an, oder nutzen Sie unser Kontaktformular. Wir melden uns zeitnah bei Ihnen.