¿Qué información adicional se almacena en una foto RAW o DNG en comparación con una JPEG, y cómo se registra esta información?

Un sensor de cámara se basa en fotodiodos, pequeños dispositivos que cambian su corriente en función de la exposición a los fotones. Originalmente, los chips para estos fotodiodos formados en la capa inferior y corrían alrededor de la electrónica, dejando una abertura pero limitando la luz que puede pasar. Los sensores más modernos se denominan sensores “iluminados en la parte trasera”, ya que la matriz de fotodiodos está construida en la parte inferior, la electrónica en capas en la parte superior, luego el chip se voltea, de modo que la parte inferior anterior del chip ahora está pulida y expuesta.

Los fotodiodos son naturalmente sensibles a un amplio espectro de luz, por lo que la mayoría de las cámaras incluyen una serie de filtros de colores sobre la matriz de fotodiodos, uno por píxel. Y sí, esto significa que cada píxel mide la luz roja, verde o azul. Esta configuración fue inventada por Bryce E. Bayer en Kodak, por lo que se ha denominado el sensor Bayer.

En capas sobre el filtro de color hay una serie de microlentes, que sirven para concentrar mejor la luz en cada fotodiodo.

Cuando toma una foto, la cámara lee esta matriz de píxeles RGB como datos digitales. Los fotones que golpean un fotodiodo acumulan una carga en un “pozo de carga”, uno por píxel. En un sensor CMOS moderno, esta carga se convierte en un voltaje, ese voltaje se ejecuta a través de un bloque de ganancia (el bloque AGC en el diagrama) y en un convertidor analógico a digital (ADC). En la mayoría de las cámaras profesionales, ese ADC tiene una precisión de entre 12 y 14 bits, pero en un teléfono inteligente u otra cámara pequeña, puede tener solo 12 bits.

Ahora, si está tomando una foto sin procesar, el archivo de imagen sin procesar es básicamente solo esta matriz de 12 bits por píxel o de 14 bits por píxel. Habrá varios bits de datos sobre la exposición, etc., escritos junto con esos datos sin procesar, generalmente en formato de etiqueta EXIF, lo que significa que puede leer eso en aplicaciones como Adobe LightRoom. Los archivos sin formato son propulares porque son eficientes en el almacenamiento, pero aún contienen toda la información de su toma. Y dado que se basan en el diseño específico del sensor de su cámara, los archivos sin formato son específicos de la cámara, no realmente un estándar. Cada archivo RAW tiene un lector específico de cámara para su contenido … Adobe empaqueta todo esto en una biblioteca llamada Camera Raw, que se actualizan regularmente con el lanzamiento de nuevas cámaras.

Un archivo DNG (Digital Negative – Wikipedia) contiene la misma información, pero en un formato más estandarizado. Adobe estuvo trabajando con la decodificación en bruto durante más de una década cuando decidieron que sería útil tener una alternativa más estándar a los archivos en bruto. Cada nueva cámara sin espejo o DSLR que sale necesita un nuevo soporte para sus archivos sin formato, porque, por supuesto, el contenido del archivo sin formato es único para esa cámara específica, a pesar de que todos contienen información similar. Pero casi todos los teléfonos inteligentes Android usan DNG, por lo que los teléfonos nuevos generalmente solo funcionan con herramientas estándar. DNG, como algunos archivos sin procesar propietarios, se basa en el estándar de archivo TIFF / EP para el almacenamiento de fotos sin pérdidas.

Cuando haces un JPEG, solo entonces es hora de comenzar a tirar información. Lo primero que hacemos es “DeBayer” o “demosaic”. Ese conjunto de colores RGB, como se mencionó, le proporciona píxeles de colores individuales. El genio de este patten es que cada píxel está cerca de los de los otros dos colores. Entonces tienes un píxel rojo … hay píxeles verdes vertical y horizontalmente, píxeles azules a lo largo de la diagonal. La interpolación entre los píxeles circundantes ofrece una suposición bastante buena sobre el color que falta para ese píxel específico. Una vez que esto se completa, hay una imagen a 30, 36, incluso 42 bits por píxel.

Para hacer el JPEG, esto se convierte de la imagen interpolada de 42 bits o lo que sea a una imagen YCrCb (Y es una señal de luminancia, Cr y Cb representan componentes de color), el formato utilizado para JPEG. Esto se submuestrea, lo que significa que se tiran cada dos (4: 2: 2) o tres de cada cuatro (4: 2: 0) muestras de color.

Luego viene la transformada discreta del coseno , una operación que convierte bloques de 8 × 8 de datos de píxeles en bloques de 8 × 8 de datos de espectro de frecuencia espacial, similar a una Transformada de Fourier . Aquí hay una pequeña pérdida de redondeo, pero la operación es esencialmente reversible. Sin embargo, a continuación, hay otra operación con pérdidas. Según los parámetros JPEG, una parte de cada bloque de 8 × 8 píxeles se pone a cero, lo que, gracias a que ahora es información basada en la frecuencia, es la misma idea que ejecutar una operación de filtro de paso bajo. Y finalmente, las restantes celdas 8 × 8 se comprimen usando una codificación de entropía sin pérdidas basada en la codificación de Huffmann.

La relación de compresión real no se establece directamente. Al codificar un JPEG, la configuración Q (calidad) determina qué tan agresivas se filtran las celdas DCT, lo que tiene el mayor efecto en el tamaño comprimido, pero la relación real también depende del contenido de la imagen. Algunas personas en Graphics Mill Image Processing hicieron un análisis de las relaciones de compresión sobre sesenta fotos, y encontraron un promedio de 5.27: 1 en Q = 100, 26.0: 1 en Q = 75, y 43.27: 1 en Q = 55 … compresión bastante sustancial en ese punto.

No mucho más de lo que mencionas, un nivel más fino de intensidades en cada nivel. Los formatos sin formato almacenan cada píxel rojo, azul o verde en 12 a 14 bits (los valores más comunes, que yo sepa), mientras que JPG está limitado a 8 bits. Eso es un factor de 16 a 64 a favor de RAW vs JPG. Esto realmente es lo principal. Además de eso, la información sobre cómo surgió la imagen (conocida como EXIF) se almacena de manera similar a los archivos JPEG.

Tenga en cuenta que hay una diferencia, no solo en cuántos niveles diferentes de intensidad se pueden almacenar en cada píxel, sino también en cómo se distribuyen los niveles. Es un poco difícil de explicar, pero el sensor de la cámara percibe la luz de forma lineal, mientras que nuestros ojos la reciben de una forma logarítmica. Para pasar de datos RAW a imágenes visibles, los valores de píxeles se traducen mediante una curva de corrección. En la imagen que podemos ver, los aspectos más destacados corresponden a un rango de intensidades de píxeles que en los datos RAW es mucho más amplio que las sombras. Datos ficticios para ilustrar: suponiendo que su sensor pueda “ver” 10000 niveles de luz (¡puede ver muchos más en realidad!), Podría terminar (y esta no es la curva real, es solo un ejemplo) con la siguiente traducción en la imagen visualizable que consta de, digamos, 1000 niveles. Los niveles iniciales de sombras de 2000 representarán el rango de 0-500 en su JPG; el rango 2000-5000 se asignará al rango 500-800 en el JPG; y el rango 5000-10000 se asignará a 800-1000.

Esta es la razón por la cual muchas personas aconsejan “exponer a la derecha”, lo que significa exponer su imagen para que sea lo más “brillante” posible sin quemarla, porque los reflejos pueden manipularse mucho más sin dañar la imagen. (ya que contienen muchos más “subniveles” en el archivo RAW).

También tenga en cuenta que algunas cámaras usan compresión RAW con pérdida, al reducir el rango (normalmente infrautilizado) de niveles altos, afectando la calidad de la imagen solo si la tortura más tarde en el procesamiento posterior, pero por lo demás no se nota. (También existe una compresión RAW sin pérdidas sin ningún impacto en la restitución de la imagen).

Además de lo que dicen los otros encuestados, una imagen sin formato también suele contener una imagen en “miniatura” JPEG. En el caso de mis cámaras Olympus, es de 1600 × 1200, de hecho, es una imagen bastante grande. Esto se utiliza para mostrar antes de que la imagen real se haya convertido.

Las imágenes DNG con frecuencia pueden contener la imagen en bruto original completa , duplicando aproximadamente el tamaño total. No uso DNG (el tamaño y la compatibilidad son problemas), pero creo que esto se puede desactivar, lo que hace que el formato sea aún menos compatible.

DNG o RAW no almacena ninguna información de imagen EXTRA que la que ve el sensor. (aparte de los metadatos Exif). Pero tiene un tamaño de archivo más grande en comparación con un Jpeg porque Jpeg ELIMINA información mientras comprime la imagen. Una imagen RAW o de mapa de bits sin comprimir contiene gran cantidad de información de color y brillo que los ojos humanos no pueden distinguir fácilmente, pero ocupa el almacenamiento. Algoritmos inteligentes identifican información de color y redundancias en una imagen y los graban en lugar de cada valor de píxel. Las técnicas DSP como la Transformación discreta de coseno se emplean en el proceso. Los píxeles de la imagen se reconstruyen posteriormente a partir de esta información. Más de 2/3 de la información original se pierden en el proceso. Pero la pérdida de fidelidad no es visible para el ojo humano normal.

Cada formato tiene un programa completo para trabajar, así que cuando comience, asegúrese de desde qué programa desea qué efecto embellecerá su imagen.