webentwicklung-frage-antwort-db.com.de

Bildverarbeitung: Was sind Okklusionen?

Ich entwickle ein Bildverarbeitungsprojekt und stoße auf das Wortocclusion. Was bedeuten Okklusionen in vielen wissenschaftlichen Arbeiten im Kontext der Bildverarbeitung? Das Wörterbuch gibt nur eine allgemeine Definition. Kann jemand sie mit einem Bild als Kontext beschreiben?

58

Okklusion bedeutet, dass Sie etwas sehen möchten, dies jedoch aufgrund einer Eigenschaft Ihres Sensor-Setups oder eines Ereignisses nicht möglich ist. Genau wie es sich manifestiert oder wie Sie mit dem Problem umgehen , hängt vom jeweiligen Problem ab .

Einige Beispiele:

Wenn Sie ein System entwickeln, das Objekte verfolgt (Personen, Autos, ...), tritt eine Okklusion auf, wenn ein Objekt, das Sie verfolgen, von einem anderen Objekt verborgen (verdeckt) wird. Wie zwei Personen, die aneinander vorbeigehen oder ein Auto, das unter einer Brücke fährt. Das Problem in diesem Fall ist, was Sie tun, wenn ein Objekt verschwindet und wieder erscheint.

Wenn Sie eine Entfernungskamera verwenden, handelt es sich bei der Okklusion um Bereiche, in denen Sie keine Informationen haben. Bei einigen Laser-Entfernungskameras wird ein Laserstrahl auf die zu untersuchende Oberfläche übertragen und anschließend ein Kamera-Setup erstellt, das den Auftreffpunkt dieses Lasers im resultierenden Bild identifiziert. Das gibt die 3D-Koordinaten dieses Punktes. Da die Kamera und der Laser jedoch nicht unbedingt ausgerichtet sind, kann es auf der untersuchten Oberfläche Punkte geben, die die Kamera sehen kann, die der Laser jedoch nicht treffen kann (Okklusion). Das Problem ist hier eher eine Frage der Sensoreinrichtung.

Das gleiche kann bei Stereo-Bildgebung auftreten, wenn es Teile der Szene gibt, die nur von einer der beiden Kameras gesehen werden. An diesen Punkten können offensichtlich keine Entfernungsdaten gesammelt werden.

Es gibt wahrscheinlich mehr Beispiele.

Wenn Sie Ihr Problem spezifizieren, können wir vielleicht definieren, welche Okklusion in diesem Fall vorliegt und welche Probleme damit verbunden sind

107
Hannes Ovrén

Das Problem der Okklusion ist einer der Hauptgründe, warum Computervision im Allgemeinen schwierig ist. Insbesondere bei Object Tracking ist dies viel problematischer. Siehe die folgenden Abbildungen:

 enter image description here

Beachten Sie, wie das Gesicht der Dame nicht vollständig sichtbar in Frames 0519 & 0835 ist, im Gegensatz zu dem Gesicht in Frame 0005.


Und hier ist noch ein Bild, in dem das Gesicht des Mannes in allen drei Bildern teilweise versteckt ist.

 partial occlusion


Beachten Sie in der Abbildung unten, wie die Nachführung des Paares in einem roten und grünen Begrenzungsrahmen verloren im mittleren Bild aufgrund von Okklusion (dh teilweise von einer anderen Person vor ihnen verborgen), im letzten Bild jedoch korrekt nachverfolgt wird Frame, wenn sie (fast) vollständig sichtbar werden.

 enter image description here

Mit freundlicher Genehmigung: Stanford, USC

14
kmario23

Okklusion ist derjenige, der unsere Sicht versperrt. In dem hier gezeigten Bild können wir die Personen in der ersten Reihe leicht erkennen. Die zweite Reihe ist jedoch teilweise sichtbar und die dritte Reihe ist viel weniger sichtbar. Hier sagen wir, dass die zweite Reihe durch die erste Reihe teilweise verdeckt ist und die dritte Reihe durch die erste und zweite Reihe verdeckt ist. Wir sehen solche Verstopfungen in Klassenräumen (Schüler sitzen in Reihen), Verkehrsknotenpunkten (auf Signal wartende Fahrzeuge), Wälder (Bäume und Pflanzen) usw., wenn sich viele Objekte befinden.  enter image description here

6
Arun Sooraj

Da die anderen Antworten die Okklusion gut erklärt haben, möchte ich nur hinzufügen. Grundsätzlich besteht zwischen uns und den Computern eine semantische Lücke.

Computer sehen tatsächlich jedes Bild als Folge von Werten, normalerweise im Bereich von 0 bis 255 für jede Farbe in RGB-Bildern. Diese Werte werden für jeden Punkt im Bild in der Form (Zeile, Spalte) indiziert. Wenn also die Objekte ihre Position gegenüber der Kamera ändern, an der sich ein Teil des Objekts versteckt (die Hände einer Person werden nicht angezeigt), werden dem Computer unterschiedliche Zahlen (oder Kanten oder andere Merkmale) angezeigt, sodass sich dies für den Computeralgorithmus ändert Objekt erkennen, erkennen oder verfolgen.

1
altaf ur Rahman