30.05.2017
Von: Ingmar Jahr

Mit anderen Augen - welche Faktoren beeinflussen die Bildverarbeitung

Wenn zwei dasselbe sehen, nehmen sie nicht immer das gleiche wahr. Machine Vision funktioniert anders als der Mensch, der in seiner speziellen subjektiven Wahrnehmung gefangen ist. Es lohnt sich also, einmal genauer hinzuschauen, wie sich Mensch und Maschine hinsichtlich ihrer visuellen Wahrnehmung unterscheiden.

Menschliches Sehen ist eine über Jahrmillionen optimierte Leistung der Evolution. Es ist dafür ausgelegt, Situationen schnell zu erfassen, komplexe Informationen auf das Wesentliche zu reduzieren. Dafür sind die Augen des Menschen an einen Bildverarbeitungsprozessor der besonderen Art angeschlossen: das menschliche Gehirn. Dorthin sind tausende parallel arbeitende Sehnerven so verknüpft, dass sie Muster in den Signalen bereits bei der Übertragung ins Gehirn erkennen können. Eine besondere Fähigkeit, die blitzschnell zu Resultaten führt.

Unser Sehsinn fasziniert und nutzt einmalige Features, ist aber keineswegs unfehlbar. Er hat auch Macken und Mängel. Allerdings ist für das menschliche Auge nicht immer alles sichtbar, und es lässt sich zudem optisch täuschen.

So sehr sich Mensch und Maschine auch unterscheiden, es gibt trotzdem Ähnlichkeiten: Die Vorgänge "Sehen", "Erkennen", "Entscheiden" und "Ausführen" ähneln sich nicht ohne Grund. Denn aus seinen Erkenntnissen heraus, versucht der Mensch den Sehsinn mit technischen Mitteln nachzubilden. Und weil Technik anderen Wirkprinzipien folgt und andere Eigenschaften hat als der Mensch und zudem von anderen Parametern bestimmt wird, ergeben sich unterschiedliche Erkennungsergebnisse.

Wenn der Mensch an einem Werkstück Fehler sieht oder nach Fehlern sucht, sind das komplexeste Regelungsvorgänge, die nacheinander wie folgt ablaufen:

  • Werkstück positionieren (in die Hand nehmen und bewegen),
  • optimale Lichtverhältnisse herstellen (sich zu einer Lichtquelle bewegen und das Teil ins Licht bringen),
  • den Körper und die Hände ständig so in Position und Drehung auszurichten, dass stets optimale Lichtverhältnisse erreicht werden (ständiges Optimieren der Aufnahmesituation),
  • das Bauteil drehen und verschieben, um das gesamte Objekt bewerten zu können (Koordination Hand - Auge),
  • Entscheidungen kontinuierlich abgleichen: ist das Gesehene ein Fehler oder doch keiner? (permanenter Vergleich mit der individuellen, jedoch nicht konstanten Fehlerschwelle),

Und ganz wichtig:

  • Auch bei neuen, bislang noch nie gesehenen Merkmalen oder Fehlern das Bauteil entweder als Ausschuss oder als Gut-Teil bewerten.

Und was kann die Maschine dem dagegensetzen?

  • Eine Zusammenstellung von Bildverarbeitungs- und Maschinenkomponenten (die häufig kein Optimum zur Lösung der Aufgabe darstellt),
  • Ein heutzutage meist noch starres bildverarbeitendes Programm (von einer fachfremden Person nach deren Kenntnisstand geschrieben und stark von Licht- und Umweltverhältnissen abhängig,
  • ein begrenzt bewegliches Handhabungssystem,
  • fixe Leistungsdaten,
  • Erkennung von bekannten Fehlern, die in einem Fehlerkatalog abgelegt sind oder mathematisch genau definiert sind hinsichtlich Farbe, Größe, Form,
  • ein Gesamtkonzept, das den per Pflichtenheft mitgeteilten Kenntnisstand einer Person oder eines Teams widerspiegelt,

Gemeinsam ist beiden Prüfern, dem menschlichen sowie dem maschinellen, dass sie jeweils auf ihre Weise versuchen, unzulängliche Umgebungsbedingungen auszugleichen.

Der Mensch bleibt flexibel, die Maschine kennt nur ihre fixen Parameter.

Der Mensch setzt dabei auf sein schnell lernendes, fehlertolerantes flexibles Sehsystem zusammen mit erfahrungsbedingtem kognitivem Sehen. Dabei nutzt er geschickt und intuitiv seine Hände mit naturgegebenen 6 Freiheitsgraden der Beweglichkeit. So kann der Mensch für einzeln auftretende unterschiedlichste Prüfaufgaben und Prüfobjekte Unzulänglichkeiten äußerst flexibel kompensieren. Und wenn eine Entscheidung fraglich erscheint, wird das Teil noch einmal inspiziert und danach die Entscheidung nach ganz eigenen Kriterien noch einmal abgewogen.

Ganz anders die Maschine: Sie kann nur begrenzt ausgleichen, da zeitliche und wirtschaftliche Begrenzungen eine Rolle spielen. Sie arbeitet mit einem starren, spezialisierten Programm, dessen Ergebnisse zusätzlich stark von den Beleuchtungsbedingungen abhängen. Die Handhabung ist häufig auf weniger als 6 Freiheitsgrade beschränkt und die Flexibilität programmbedingt eingegrenzt. Da alles auf Schnelligkeit und auf massenhaft durchlaufende gleichartige Teile optimiert ist, bleibt kaum Zeit flexibel zu reagieren.

Dieser Vergleich zeigt, dass die Stärken des Menschen in seiner Flexibilität, seiner Spontanität und Kreativität liegen. Wohingegen die Maschine für Zuverlässigkeit, Genauigkeit und Schnelligkeit steht.

Ermüdende und sich ständig wiederholende Prüfarbeiten belasten den Menschen. Solange bei der Mechanisierung, Industriealisierung und Automatisierung keine geeigneten Prüfmittel zur Verfügung standen, war diese Belastung ein notwendiges Übel. Hier brachte die Bildverarbeitung dem Menschen erhebliche Erleichterungen.

Hürden erkennen

In der Praxis sind die Erwartungen an die Bildverarbeitung sehr hoch. Oft bleiben gerade die besonders ausgeklügelten und hochpreisigen High-End-Anwendungen mit ihren technischen Eckdaten im Gedächtnis der potentiellen Anwender haften. Sie werden dann schnell, aber zu Unrecht als technischer Leistungsstandard gehandelt.

Aber die Bildverarbeitung arbeitet nicht immer so schnell, wie der Nutzer es gern hätte. Sie funktioniert auch nicht grundsätzlich verschleißfrei und ist oft umständlich zu bedienen. Das alles hat verschiedenste Ursachen. Da jedoch technisch vieles machbar erscheint, werden Aufgabenstellungen gern überfrachtet und nicht selten mutiert die dann installierte Bildverarbeitung zur berüchtigten "Eierlegenden Wollmilchsau", die alle Probleme lösen soll.

In den Unternehmen gehen die Einschätzungen dazu oft auseinander. Von der einen Seite wird die Meinung vertreten, dass die Bildverarbeitung nahezu alles leisten kann. Die andere Seite hat aufgrund schlechter Erfahrungen das Vertrauen in die Leistungsfähigkeit der Bildverarbeitung weitgehend verloren.

Bei den sich daraus ergebenden Diskussionen werden bestimmte Risiken des Technologieeinsatzes, wie überfrachtete und ungenaue Aufgabenstellungen, nicht zur eingesetzten Technologie passende technische Anforderungen oder fehlende Kenntnisse bei den Ausführenden gern ignoriert.

Kritische Fehlerfortpflanzung

In kaum einer anderen Technologie wirkt sich die Fehlerfortpflanzung so stark aus wie bei der Bildverarbeitung. Angefangen beim Prüfobjekt, über die Beleuchtung, die Optik, den Bildsensor, die signalwandelnde, -leitende und -verarbeitende Elektronik bis hin zur Software werden auftretende Fehler weitergegeben und aufsummiert. Besonders kritisch wird dies beim Arbeiten in physikalischen Grenzbereichen, in denen die gewünschte Auflösung oft nur mit Hilfe statistischer Verfahren zu erreichen ist. Und wie verlässlich ist dann ein Gesamtergebnis, das aus einer Folge verschiedenster mathematischer Korrekturen gewonnen wurde? Konkret gesagt: Basiert das Ergebnis auf einer Abfolge von Shadingkorrektur, Verzeichnungskorrektur und Farbkorrektur gilt es, die Ergebnisaussage auf Verlässlichkeit zu prüfen. Der alte Ingenieursgrundsatz: "Fehlervermeidung vor Fehlerkompensation" ist in diesem Zusammenhang nicht hoch genug einzuschätzen.

Hochleistung hat ihren Preis

Was der Mensch in kürzester Zeit erfassen kann, erfasst die Bildverarbeitung nur mittels extrem hoher Rechenleistung. Dabei ist die Taktzeit der Maschine der Schrittmacher für die Verarbeitung der Bilddaten. Und die Transportgeschwindigkeit der Werkstücke bestimmt die Zeitspanne, die für die Bildaufnahme zur Verfügung steht.

Bildverarbeitungsaugen sehen anders als die des Menschen: verschiedene Empfänger für verschiedene Wellenlängenbereiche, unterschiedliche Helligkeitswahrnehmung sowie aufgabengerechte Beleuchtung.

Allgemein sind die Algorithmen zur Verarbeitung von Bilddaten wesentlich schneller als die ablaufenden mechanischen Prozesse. Typische Werte liegen bei 500 µs für eine Blobanalyse im gesamten Bild (4 MPixel) sowie 10 ms zum subpixelgenauen Ermitteln eines Kantenorts. Eine Mustersuche kann je nach Größe und Art des Musters sowie Größe des zu durchsuchenden Bildes durchaus auch im dreistelligen Millisekundenbereich liegen.

Das Abarbeiten eines aus vielen Funktionen bestehenden Prüfprogramms benötigt eine gewisse Zeit! Und je höher die kameragegebene Auflösung ist, desto mehr Daten müssen verarbeitet werden. Dann wird entweder mehr Zeit oder mehr Rechenpower benötigt. Damit erhöhen sich aber auch die erforderlichen wirtschaftlichen Anstrengungen.

Hinzu kommt, dass es grundsätzlich nicht nur "die eine" alles könnende Bildverarbeitungslösung gibt. Viele Wege führen zum Ziel. Angefangen von der schnellen, sicheren Lösung, die alle wollen bis hin zur langsamen und unsicheren, die keiner haben möchte. Zu welcher Kategorie die eigene Lösung zählt, zeigt die Praxis. Denn neben den materiellen Faktoren, die für Höchstleistungen erforderlich sind, bestimmen auch die fachliche Kompetenz und die Erfahrung der Anwender die Leistungsfähigkeit und Zuverlässigkeit von Bildverarbeitungslösungen.

Ganz grob kann man es auch wie folgt formulieren: Der Erfolg einer BV-Lösung hängt zur Hälfte von einer gekonnten Systematik, zu einem Viertel von gesammelten Erfahrungen und einem weiteren Viertel von zielgerichteten Versuchen ab.

Auch die Umgebung macht ihren Einfluss geltend

Fremdlicht, Schwingungen, Temperatur, Staub und Schmutz sowie aggressive Umgebungen sind kritische Punkte, die sich auf das, was von der BV gesehen werden kann und damit auf die Ergebnisse auswirkt. Aber nicht nur die physikalische Umgebung am Verwendungsort, sondern auch der Faktor Mensch beeinflusst die Endergebnisse durch seine Interaktion mit dem System vor, während und nach dem Projekt.

Es wäre also ein Irrtum zu glauben, eine gute Organisation und eine perfekte Technik lösten bereits alle Probleme. Menschen, die mit der Bildverarbeitung arbeiten und diese dauerhaft in ihre individuellen Arbeitsprozesse integrieren sollen, müssen "mitgenommen" werden. Die Technologie der Bildverarbeitung optimiert sich und die relevanten Prozesse nicht von alleine. Sie benötigt noch oft einen Experten mit fundiertem Wissen als Kümmerer und braucht darüber hinaus durch Schulungen gut ausgebildete und für neue Herausforderungen fitgemachte Mitarbeiter.

erschienen in: inspect 2_2017