¿Cómo podemos ver objetos 3D cuando nuestra retina es solo una pantalla 2D?

El cerebro ve el mundo en algo que a veces se llama “2½D”, es decir, profundidad más 2D.

Los dos ojos envían un par de imágenes 2D al cerebro. A partir de eso, el cerebro construye un modelo 2D + profundidad del campo visual. Lo que vemos no es luz, sino más bien superficies, objetos y estructuras que están dispuestos en 3 espacios con profundidad.

La razón por la que nuestra percepción visual no se llamaría 3D completo se debe a que no podemos ver detrás de los objetos o dentro de sus interiores, por lo que no tenemos acceso completo a la información 3D que tenemos delante. Solo podemos ver aquellas superficies 2D que no están cubiertas (ocluidas) por otra cosa.

También podemos razonar sobre objetos 3D que podemos sostener y manipular en nuestras manos. Sin embargo, desde la perspectiva de nuestro cerebro, se trata de algo que se aproxima a las superficies 2D envueltas alrededor de una esfera con indentaciones y protuberancias. Al rotar el objeto en nuestra mano, solo podemos ver sus superficies visibles. cuanto más complejo es el objeto, más difícil nos resulta razonar sobre lo que estamos viendo.

Los científicos todavía están aprendiendo cómo el cerebro modela y procesa el mundo 3D, por lo que esto es solo una simplificación basada en lo que se conoce.

El concepto detrás de la visión 3D se llama disparidad retinal.
Debido a que nuestros ojos están separados por una distancia, cada ojo ve una versión ligeramente diferente de una imagen

Para fijarse en un objeto en particular, sus ojos convergen. Su cerebro “conoce” el ángulo de convergencia y el grado de disparidad involucrado en su visión de esa imagen.
Los productores de películas que desean crear un efecto 3D imitan la cantidad de disparidad (de modo que un ojo usa un filtro verde y ve solo el círculo rojo abajo, y el otro ojo usa un filtro rojo y ve solo el círculo verde a continuación)

El cerebro calcula la distancia que se asociaría con esta cantidad de disparidad y percibe que el objeto está allí.

Si miraras la imagen a continuación con gafas 3D (filtros rojo-verde), cada ojo vería una imagen diferente. Se te ocurriría que tienes profundidad

La tecnología de hoy es HD (alta definición), mañana será 3D.

Encontraremos una amplia gama de aplicaciones como películas 3D, juegos 3D, televisión 3D, monitores 3D, gafas 3D y mucho más.

3D es un modelo estereoscópico que transmite imágenes alternativamente a nuestro ojo izquierdo y derecho, almacenadas en los campos pares e impares de una señal de video. Las gafas 3D que usamos cierran alternativamente cada ojo, para que podamos ver la transmisión de video destinada a él.

Nuestro cerebro luego sigue su proceso natural de fusión de las dos corrientes de datos, presentando una vista 3D al usuario, del mismo modo que fusiona las vistas del ojo derecho y el izquierdo, cuando lo vemos normalmente.

En un futuro cercano, podemos encontrarnos con modelos Autoestereoscópicos , que no requieren gafas.

No “vemos tres objetos D” en absoluto.

Percibimos un espacio 3D. Esto se basa en indicaciones visuales que nuestro sistema nervioso interpreta para nosotros y que incluyen:

Visión estéreo-escópica
Oscuridad
Movimiento paralaje
Tamaño y posición relativa

Déjame googlear eso por ti

editar: Por cierto, es bastante fácil engañar a este sistema. Aquí hay un ejemplo clásico:

Los dos ojos ven cada objeto en un ángulo ligeramente diferente. Nuestro cerebro aprende a entender esta diferencia y a usarla al construir la imagen tridimensional de la realidad. Lo mismo para la película 3D. Las imágenes se toman con 2 cámaras una al lado de la otra y luego se proyectan hacia los ojos derecho e izquierdo, respectivamente, creando una imagen estéreo.
Sin embargo, la mayor parte de nuestra percepción estéreo depende de pistas monoculares. Es bastante fácil entender la estructura tridimensional mirando solo con un ojo, usando las pistas que provienen de la perspectiva, la iluminación, la sombra y nuestro conocimiento general de la realidad. Por lo tanto, no estamos confundidos acerca de las estructuras tridimensionales cuando vemos una película normal en una pantalla plana.

Nuestros ojos perciben el mundo que nos rodea como una imagen tridimensional (3D). Por imagen 3D, queremos decir que vemos anchos, alturas y profundidades. En un programa de TV o una película de cine, también percibimos la profundidad de estas imágenes, aunque se representa en una pantalla bidimensional (2D) (solo ancho y alto).

¿Cómo es posible que veamos el mundo 3D en superficies 2D como la pantalla de la computadora, el cine o los monitores de TV? En otras palabras, ¿cómo se interpretan las profundidades en una pantalla?

De hecho, hay muchas señales de profundidad que nosotros, como humanos, percibimos las tres dimensiones del mundo físico. Cada uno de nuestros ojos tiene una retina bidimensional en la que se perciben imágenes del mundo tridimensional. Nuestro cerebro luego sigue su proceso natural de fusión de las dos corrientes de datos, presentando una vista 3D al usuario, del mismo modo que fusiona las vistas del ojo derecho y el izquierdo, cuando lo vemos normalmente.

Las otras respuestas son fascinantes para mí, ya que son lo suficientemente complejas como para presentar aspectos que no había visto o considerado antes.

Pero la respuesta simple es que solo reunimos 2 datos D. Pero recopilamos suficientes datos en 2 D que podemos ensamblar en una imagen 3 D (o una imagen D 2-1 / 2 y un mapa 3 D) que se refina a medida que avanzamos, reunimos incluso mejores vistas estereoscópicas: mire una pequeña Ave de presa: una con los ojos bien abiertos, intente desarrollar información de profundidad para una imagen un tanto tridimensional. Él mueve su cabeza hacia adelante y hacia atrás para obtener múltiples imágenes, como las que obtenemos (o se obtiene un halcón) todas a la vez.

Vemos 2-D y construimos el reinicio.

Porque tenemos dos ojos espaciados adecuadamente