top of page

"Monokular-2D zu 3D-Effekt"-Theorie

Der „Monokular-3D-Effekt bei Betrachtung zweidimensionaler Abbildungen" – ohne spezielle Brille. Drücken wir doch mal ein Auge zu!

Autor: Dipl. Musikpäd. Mag. art. Damir Sertić PhD

Das Sehzentrum unseres Gehirns ist erstaunlich flexibel. Ist es noch anpassungsfähiger als wir bislang dachten? 

Seit Jahrzehnten starrt der Mensch in den Fernsehbildschirm und weiß wohl nicht, dass er eigentlich schon längst alle Ausstrahlungen mit einem einfachen Mittel in 3D bestaunen könnte. Es würde nur ein wenig Konzentration kosten. 

 

Früh schon, nach der Geburt, lernt unser Gehirn die Informationen des von den Netzhäuten aufgefangenen Lichtes zu brauchbaren Bildern zu verarbeiten, um sich besser in der Welt zurechtfinden und orientieren zu können. Die Augen entwickeln sich mittels der Verarbeitung des Gehirns in kürzester Zeit zu unseren wohl wichtigsten Sinnesorganen. 

Man geht z.B. davon aus, dass Säuglinge alles zuerst auf dem Kopf stehend sehen, da das Gehirn die Lichtreize, die durch die Linse falsch herum auf die Netzhaut auftreffen, noch nicht umzudrehen vermag. Die Entwicklung des Farbensehens und der Tiefen-Wahrnehmung benötigt im Kleinkindesalter sogar noch etwas mehr Zeit und Erfahrung. Aber wir lernen auch ziemlich schnell, dank unseres Gehirns und beider Augen, d.h. zweier Linsen, oder auch anders gesagt „binokular“, die Welt um uns herum dreidimensional zu erleben, denn ...

          „Die Evolution des Menschen fand in einer dreidimensionalen Welt statt. Um in dieser räumlichen Welt bestehen zu können entwickelte der Mensch ein Sehsystem mit zwei Augen. Die beiden Augen bilden zusammen mit dem betrachteten Objekt ein Dreieck. Bedingt durch diese Tatsache, betrachten die beiden Augen das Objekt unter unterschiedlichen Winkeln, was uns die Möglichkeit der dreidimensionalen Wahrnehmung ermöglicht. Räumliche Wahrnehmung und das Abschätzen von Entfernungen bis zu einer Entfernung von etwa 30m wird durch zwei Augen ermöglicht, - eine Form der Tiefenwahrnehmung die als Binokulares oder Stereo Sehen bezeichnet wird.“ (Reitsamer – Fortsetzung unten)

Diese binokulare Tiefenwahrnehmung beruht auf:

 

  • Konvergenz

Betrachtet der Mensch einen Punkt im Raum, so richten sich die Sehachsen auf diesen Punkt aus, sie neigen sich zueinander. Je kürzer der Abstand zum Objekt ist, desto stärker ist die Neigung. Mit zunehmender Neigung erhöht sich die Spannung der Sehmuskeln. Aus der Spannung der Sehmuskeln errechnet das Gehirn den jeweiligen Abstand eines Objekts. Blicken wir zum Horizont, verlaufen die Sehachsen parallel. Die Sehmuskeln sind entspannt.

 

  • Querdisparation

Als Querdisparation bezeichnet man die Verschiedenheit der Bildlage auf der rechten und der linken Netzhaut, die durch den Augenabstand (beim Menschen etwa 6 cm) entsteht. Die Abstandsunterschiede zwischen dem linken und dem rechten Bild auf der Netzhaut werden als binokulare Disparität bezeichnet. Das menschliche Gehirn ist in der Lage, binokulare Disparitäten zu interpretieren und für die räumliche Wahrnehmung zu nutzen.

 

  • Horopter

Aufgrund des geringen Augenabstands ist eine binokulare Wahrnehmung nur begrenzt möglich. Im Prinzip ist diese auf den unmittelbaren menschlichen Handlungsbereich beschränkt und endet bei einer Entfernung von 6 bis 10 Metern. Treffen Bildinformationen auf korrespondierende Stellen der Netzhäute ist auch keine binokulare Wahrnehmung möglich.

Seit den 1950er Jahren gelingt es Technikern immer besser unser zweidimensionales, flaches Fernseh- und Kinoerlebnis zu revolutionieren, indem sie zwei Bildaufnahmen Desselben so übereinanderlegen, dass man es mit speziellen Brillen ebenfalls, wie auch unsere Welt um uns herum in 3D erleben kann. Mit Hilfe der anfänglichen anaglyphen Rot-grün-Technik bis zur heutigen Stereoskopie mit Stereokameras, bei der seit einigen Jahren mit zwei Linsen aus zwei leicht unterschiedlichen Perspektiven aufgenommen wird, können zwei von unseren Augenlinsen übereinandergelegte Bilder in unserem bereits trainierten Gehirn wieder zu einer 3D-Abbildung zusammengefügt, verarbeitet und 3D wahrgenommen werden.

 

Durch Biophilia, ein multimediales Musikalbum in Form einer Smartphone-Applikation, der extravaganten isländischen „Pop“-Künstlerin Björk, die ich seit vielen Jahren in erster Linie als Komponistin verehre und die wegen ihrer Originalität nicht einzuordnen ist, behaupte ich nun ein bisher unbekanntes Wahrnehmungsphänomen entdeckt zu haben, welches ich den „Mmonokular-3D-Effekt beim Betrachten von zweidimensionalen Abbildungen“, abgekürzt "Monokular-2D zu 3D-Effekt" nennen möchte. 

(Wie alle von Björks Alben, ist auch dieses für sich ein einzigartiges Gesamtkunstwerk. Björk verbindet darin Musik, Technologie und natürliche Phänomene. Diese Applikation erlaubt es dem Hörer selbst, sozusagen als pädagogisches Konzept, Björks Musik mit einfachen Mitteln durch Touch Screen spielerisch zu verändern und verändert wiederzugeben bzw. ihren kreierenden Spuren zu folgen. Dafür hat die Künstlerin 2011 sogar den Digital-Genious-Preis erhalten.)

Entdeckt habe ich den Effekt bereits vor über zehn Jahren, als ich beim Betrachten der  Startseite von Björks Biophilia Applikation (inzwischen auf YouTube einsehbar) mit dem rotierenden Song-Universum zufällig ein Auge zuhielt, da ich müde war. Dadurch bemerkte ich, dass dieses auf dem Bildschirm zweidimensional abgebildete Universum plötzlich mehr Tiefe erlangte – ich es mit einem Mal eigentlich dreidimensional wahrnahm. Zuerst dachte ich, das müsse mit dem starken Schwarz-Weiß-Kontrast der sich bewegenden Abbildung zu tun haben, und ich vergas dann bald ein wenig darauf. Ein paar Monate später – im Halbschlaf – überlegte ich: was, wenn das mit allen Abbildungen auf scharfen Smartphone- oder Tablet-Screens funktioniert? ... und testete es aus. – Und tatsächlich! 

Könnte es sein, dass, wenn bereits eine Foto- oder Kameralinse eigentlich das selbe Licht-Bild, zusammen mit der dazugehörigen Tiefeninformation, aufnimmt – wie es auch bei zwei Stereo-Linsen der Fall ist – wir nicht auch mit nur einem Auge, also monokular, in der Lage sein sollten zweidimensionale Abbildungen dreidimensional wahrnehmen zu können?

Einfach gesagt: 

Zwei Aufnahmelinsen, zwei Augen = 3D-Effekt.

Eine Aufnahmelinse, ein Auge = ebenfalls ein 3D-Effekt.

 

Wenn wir unsere reale räumliche Umgebung mit nur einem Auge betrachten, nehmen wir sie bekanntlich (trotz der mittels Grunderfahrungen antrainierten und errechenbaren Faktoren der sogenannten monokularen 3D-Wahrnehung [siehe letzten Abschnitt]) nur zweidimensional wahr. Und eigentlich nehmen wir zweidimensionale Abbildungen auf Bildschirmen und auf scharfen Fotos genauso flach wahr, wie wenn wir unsere reale Umgebung nur mit einem Auge betrachten. Warum passiert aber nun ein natürlicher dreidimensionaler Effekt beim Betrachten zweidimensionaler Abbildungen, wenn man ein Auge schließt? Was unterscheidet den einen Vorgang der visuellen Wahrnehmung mit einem Auge in der reellen Umgebung von dem anderen der visuellen Wahrnehmung mit einem Auge bei (scharfen) zweidimensionalen Abbildungen?  

Meiner Theorie nach passiert hier bei monokularem Betrachten zweidimensionaler Abbildungen eine natürliche Umkehrung: 

Im dreidimensionalen reellen Raum, wo das Licht von Objekten verschiedenster Entfernungen (bis zu 30 m) aus reflektiert wird und auf unsere Netzhaut trifft, kann das Gehirn die Lichtinformation einäugig bzw. monokular nicht dreidimensional umdeuten, im Gegensatz zum Betrachten zweidimensionaler Abbildungen. In diesem Fall ist unser Gehirn dann doch dazu fähig, da die gesamte Licht- und Tiefeninformation von ein und demselben Abstand aus reflektiert auf unsere Netzhaut trifft. Und umgekehrt, sind unserem Gehirn beim Betrachten zweidimensionaler Abbildungen zwei Augen prinzipiell hinderlich, im Gegensatz zu unserer realen Umgebung, für die beide Augen gemacht sind. 

Zur besseren Verdeutlichung entwickelte ich einen einfachen Test:

Diesen Test kann jeder selbst leicht ausführen, indem er eines oder mehrere Objekte nebeneinander in unmittelbarer Nähe in reeller Umgebung zuerst mit einem geschlossenen Auge betrachtet. Noch besser bestätigt sich die Theorie, wenn man das Objekt sogar nah vor das Gesicht hält. Es macht keinen Unterschied. In der Regel sollte man das Betrachtete dann zweidimensional erleben. Daraufhin nimmt man mit z.B. seinem Smartphone eine Photographie desselben Objekts bzw. derselben Objekte aus dem gleichen Betrachtungswinkel und der gleichen Entfernung auf. (Man sollte, wie üblich beim Fotografieren, auf gute Belichtung achten.) 

Wenn man die zweidimensionale Abbildung nun auf dem Bildschirm mit einem geschlossenen Auge betrachtet, nimmt man (mit eventuell nötiger Übung und Konzentration) die gleichen Objekte bzw. die abgebildete Räumlichkeit wieder dreidimensional wahr, - obwohl jetzt eines der Augen geschlossen ist. 

Ich erkläre mir die Tatsache, dass dies bisher anscheinend noch niemandem so richtig aufgefallen ist damit, weil wir eigentlich erst seit ziemlich kurzer Zeit (ca. seit 2006) in den Genuss von sehr hohen Bildschirmauflösungen kommen. Diese erleichtern es dem Auge bzw. unserem Gehirn das mit einem Auge Gesehene besser in 3D wahrzunehmen.

Viele Leute glauben mir zuerst nicht und ihr gewohntes Wissen über dreidimensionales Sehen und der Zweifel hindert sie anfangs daran, sich beim Erstversuch richtig zu konzentrieren. Ich habe auch die Erfahrung gemacht, dass, wie es auch bei unseren Armen und Beinen der Fall ist, man auch bei den Augen eine "Schokoladen"-Seite hat mit der es besser funktioniert. Ein besonders guter Effekt ergibt sich auf Smartphones, Tablets oder Notebooks. - Nicht nur wegen der sehr hochaufgelösten Displays, sondern auch, weil man sich diese Mediengeräte besonders einfach in die richtige Position zum Auge hinhalten kann. Das Bild sollte in einem bestimmten Abstand zum Auge stehen. Bei Smartphones eignet sich ein Abstand von ungefähr 20-30 cm besonders gut. Es funktioniert allerdings auch mit hochauflösenden Fernsehern. Der Abstand sollte verhältnismäßig zur Größe des jeweiligen Bildschirms angepasst sein. Im Grunde hat jede zweidimensionale Darstellung das Potenzial mittels eines Auges dreidimensional wahrgenommen zu werden, aber je höher die Auflösung der Abbildung oder des Bildschirms, und je besser die Belichtung, desto besser der Effekt. Mit hochaufgelösten physischen Fotos mit guter Belichtung funktioniert es ebenfalls.

Einfach ausprobieren! 

Man nehme sich am besten sein liebstes Musikvideo oder Landskape auf seinem Smartphone als Versuchsobjekt heran und verdeckt das eine Auge mit der Hand oder drückt es zu. Ersteres sorgt dafür, dass beide Augen beim Versuch entspannter bleiben. Den Blick nun an den etwas größer wirkenden Bildschirm gewöhnen lassen und auf die Tiefe im Bild konzentrieren. Et voilà! Man bekommt nach und nach sogar das Gefühl, in den Bildschirm hineinsteigen zu können. - Etwas zum Unterschied zu den 3D-Kinofilmen, wo mit Techniken dafür gesorgt wird, dass die Objekte quasi eher aus der Leinwand herausstechen. Wie man merkt, kann dieses Betrachten auf Dauer zwar anstrengend für das eine aktive Auge sein, - Tatsache ist jedoch: Ihr Display wie auch Ihre Filme oder Bilder gewinnen in diesen Momenten an neuer Dimension, - und zwar ganz ohne Spezialbrille und sehr natürlich wirkend. 

Als ich ca. 2012 meine Entdeckung machte, brauchte es seine Zeit diese Theorie aufzubauen. Als ich mir sicher war, dass es darüber nichts in Büchern oder im Internet zu finden gibt, kontaktierte ich einen Spezialisten der Paracelsus Medizinischen Privatuniversität in Salzburg - Univ.-Prof.  Dr. Herbert Reitsamer. Ich erwartete mir bei einem Treffen mit Dr. Reitsamer eine unter Augenmedizinern und Optikern bekannte Erklärung dieses Phänomens. Er ergänzte meine Theorie jedoch vorerst nur mit einer gängigen Erklärung das „monokulare dreidimensionale“ Sehen betreffend, welche zwar mittels unten genannter Faktoren beim monokularen betrachten in der reellen Umwelt zuständig ist, jedoch mit der monokularen räumlichen dreidimensionalen Wahrnehmung bei Betrachtung zweidimensionaler Abbildungen meiner Meinung nach wenig zu tun haben kann, da diese erlebte monokular-visuelle Wahrnehmung bei 2D-Abilungen sich von der Qualität der monokular-visuellen Wahrnehmung in der reellen dreidimensionalen Umgebung deutlich unterscheidet. 

Als Dr. Reitsamer und ich uns am 3. März 2016 erneut trafen, konnte ich ihm meine Theorie mittels meines eigens entwickelten Tests sogar beweisen. Damals bejahte Dr. Reitsamer dann, dass dieses Phänomen nicht auf seiner ursprünglichen Erklärung beruhen kann, welche ich im Folgenden trotzdem weiter aufführen möchte, und er schlug damals vor, dass er ein Team zur Forschung zusammentrommeln würde, um dies zu erforschen. Leider habe ich seitdem jedoch immer noch nichts von Dr. Reitsamer gehört. 

 

Erster Entwurf der Theorie zum „One-Lens-3D-Effekt - OL3DE“: Salzburg, am 27.10.2013, dann Zagreb, am 22.12.2013. 

Revidierter Artikel mit dem Namen "Umgekehrter monokularer 3D-Effekt beim Betrachten von 2D-Abbildungen" als Zweitthema beim Rigorosum D zur Verteidigung meiner Doktorarbeit and der Universität Mozarteum in Salzburg, vorgenommen am 20.11.2018.

Aktuelle schriftliche Bearbeitung des Artikels: 30.03.2024, unter neuem abgekürztem Namen.

Fortsetzung der (meiner Meinung nach, damals nicht zutreffenden) Erklärung von Dr. Reitsamer:

 

          "Unsere Umwelt ist jedoch bedeutend grösser, und für Entfernungen über 30m ist der Abstand zwischen den Augen zu klein um binokulare Tiefenwahrnehmung zu ermöglichen. Dennoch können wir einschätzen ob ein Kreuzschiff am Meer näher oder ferner ist als das kleine Motorboot und das obwohl diese mehrere hundert Meter von uns entfernt sein können. Der Grund liegt in der Erfahrung der relativen Größe von Objekten zueinander. Wenn ein Objekt in Relation zum anderen Objekt zu groß erscheint, so muss es wohl näher als dieses sein. Diese Unterscheidung kann nur erfolgen, wenn die wahre Größe der Objekte bekannt ist und beruht daher auf Erfahrung. Je nach Alter macht der Mensch Erfahrungen, mit denen er lernt Entfernungen besser einzuschätzen. Ob es die Erfahrung der unmittelbaren gesichtsnahen Umgebung des Säuglings ist, die Erweiterung der Raumerfahrung durch Krabbeln und Gehen des Kleinkindes oder das Ballspiel der Kinder und Erwachsenen. Körperliche Erfahrung durch Körpersinn, Tastsinn, Temperatursinn und Gehör werden während der Individualentwicklung mit dem Sehsinn korreliert und somit Das Abschätzen von Entfernungen erlernt. Da bei Entfernungen über 30m die Bilder in beiden Augen unter sehr ähnlichen Einfallswinkeln abgebildet werden findet diese 3D Wahrnehmung nicht binokular, sondern monokular statt. Zusätzlich gibt es noch andere Mechanismen zur monokularen Tiefenwahrnehmung wie zum Beispiel den Paralaxen Effekt, den man beim Blick aus dem fahrenden Zug feststellen kann. Nahe Objekte bewegen sich schneller vorbei, ferne Objekte bewegen sich langsamer vorbei. Perspektivisches Zusammenlaufen von Linien wie bei Eisenbahnschienen und das Verdecken des fernen Objekts durch das nahe Objekt sind Effekte, die Tiefe in der Wahrnehmung vermitteln.

Was geschieht nun, wenn man ein Bild betrachtet, auf dem eine dreidimensionale Szenerie abgebildet ist – wie zum Beispiel auf einem Bildschirm, einem Foto oder einem Gemälde?

Hier kommt es zur Konkurrenz zwischen der binokularen und der monokularen Tiefenwahrnehmung. Zum einen sagen uns monokular wahrgenommene Perspektiven, Größenverhältnisse, Verdeckungen etc., dass in diesem Bild die Umwelt dreidimensional dargestellt ist. Das binokulare Sehen sagt uns jedoch, dass es sich um eine flache Darstellung der Umwelt ohne Tiefe handelt. Die Resultierende monokulare Tiefenwahrnehmung wird daher durch die binokulare Information einer flachen Darstellung gehemmt und man kann dies umgehen indem man ein Auge schließt.

Betrachtet man ein Bild mit einem Auge kommt die vom Künstler festgehaltene Tiefe deutlich besser zur Geltung als wenn man das Bild mit beiden Augen betrachtet. Der 3D Effekt monokularer Wahrnehmung kann so ungehemmt zur Geltung kommen."

Univ.-Prof. Dr. Herbert Reitsamer am 10.06.2014

Universitätsklinik für Augenheilkunde und Optometrie der Paracelsus Medizinischen Privatuniversität Salzburg

Oberarzt Habil. Physiologe

Forschungsprofessur der PMU

Leiter der Glaukomambulanz, Leiter des Fuchs-Labors

Mehr über das gängige, sogenannte „monokulare dreidimensionale“ Sehen bei Betrachtung der reellen Umgebung

 

Das sogenannte „monokulare dreidimensionale“ Sehen beruht auf denselben erlernten Grunderfahrungen, dank Konvergenz und Querdisparation beider Augen. Schließt man eines der Augen, rechnet das Gehirn die Informationen anhand seiner schon gesammelten Erfahrungen um, und man hat mit etwas Konzentration den falschen Eindrucktrotzdem dreidimensional zu sehen. 

Dies wird durch mehrere Faktoren ermöglicht:

 

  • Relative Größe

Wenn die Größe eines Objekts dem Betrachter bekannt ist, kann dieser Rückschlüsse auf die Entfernung ziehen. Dabei verhalten sich Entfernung und Größe reziprok proportional zueinander. Erscheint ein Objekt groß, dann liegt es in geringer Entfernung, erscheint es klein, dann ist die Entfernung größer.

 

  • Perspektivische Konvergenz

Parallele Linien werden auf der Netzhaut nicht parallel abgebildet. Sie konvergieren zu einem Fluchtpunkt. Wir erleben dieses Phänomen beispielsweise bei Schienen oder Straßen, deren Ränder sich am Horizont scheinbar treffen. Da wir wissen, dass sich der Abstand der Schienen und die Breite der Straßen nicht ändern, interpretiert das Gehirn die Netzhautabbildung als Tiefenhinweis.

 

  • Verdeckung und Überlappung oder auch Okkasion und Interposition

Wird ein Objekt von einem anderen teilweise verdeckt, so interpretiert das Gehirn dies als Tiefenhinweis zur Anordnung der Objekte. Das verdeckte Objekt liegt perspektivisch hinter dem anderen Objekt.

 

  • Bewegungsparallaxe

Eine Bewegungsparallaxe (gr. Parallagé „Veränderung“, „Abweichung“) entsteht bei Bewegung des Betrachters oder seines Umfelds. Abstand und Geschwindigkeit der Bewegung verhalten sich reziprok proportional zueinander. Ein nahes Objekt zieht schneller am Betrachter vorbei als ein entferntes. Schauen wir aus einem fahrenden Zug, ziehen durchfahrene Bahnhöfe schneller an uns vorbei als Objekte in weiter Entfernung.

 

  • Texturgradient

Je näher wir uns zu einem Objekt befinden, desto detaillierter nehmen wir dessen Oberflächenstruktur wahr. Mit zunehmendem Abstand wird diese Struktur homogener.

 

  • Nebel und Dunst bzw. atmosphärische Perspektive

meint den Einfluss, den eine nach Dichte und Zusammensetzung spezifische Atmosphäre auf die wahrgenommene Erscheinung eines von weitem betrachteten Objektes hat. Zum Beispiel nimmt der Kontrast zwischen Objekt und Hintergrund ab, oder die Farbtönung verändert sich. Nebel und Dunst lassen entfernte Objekte matter erscheinen und geben dadurch einen Hinweis auf die Entfernung. Diese Tatsache ist bei der Erzeugung stereoskopischer Bilder von Bedeutung.

  • Licht und Schattenwurf

Die Art, in der Licht auf eine bestimmte Objektoberfläche fällt und die dadurch hervorgerufenen Reflektionen und Schatten des Lichts, erzeugen einen wirkungsvollen Reiz für das Gehirn, um die räumliche Form des Objekts und dessen Lage im Raum zu bestimmen.

 

  • Akkomodation (Sehschärfe)

Akkommodation ist ein okulomotorischer Reiz, also ein Reiz, der die Beweglichkeit des Auges betrifft. Die Augenlinse stellt sich auf verschiedene Entfernungen durch Brechkraftzuwachs oder Brechkraftabnahme ein. Zum Fokussieren des Auges auf eine bestimmte Entfernung wird die Linse durch Anspannung des Ziliarmuskels verformt. Je näher die Objekte, desto größer die Anspannung. Fokussieren wir den Horizont, ist der Ziliarmuskel entspannt. Die Akkommodation ist mit der Konvergenz gekoppelt, einem binokularen Tiefenhinweis.*

*

http://www.awater3d.com/faq/faq-uebersicht/raeumliches-sehen

[zugegriffen Juni 2014]

 

und 

 

https://gestfus.files.wordpress.com/2015/05/gestfus-m2-wahrnehmungspschychologische-grundlagen-fuer-3d-bilder4.pdf

[zugegriffen März 2024]

bottom of page