divendres, 26 d’agost del 2011

PERQUÈ 'DRETEJAR'

Cada cop és més conegut el consell d'exposar 'tirant l'histograma cap a la dreta' o, en un llenguatge més planer, exposar el màxim de clar sense arribar a cremar res. Aquesta tècnica d'exposició ens garanteix una òptima qualitat de les imatges capturades. Pot ser que molta gent ho utilitzi sense saber massa el perquè però, per altra banda, el fet que algunes vegades aquest mètode ens porti a resultats més clars de l'aparença real fa que s'opti per deixar-lo d'utilitzar. A més, aquest procediment d'exposició només té sentit si hi ha una edició posterior de les imatges, cosa totalment recomanable.

Per entendre el benefici de 'dretejar' hem de començar entenent com captura la informació el sensor de la nostra càmera. La visió humana no fa una lectura lineal de la llum que rep sinó que és exponencial, de la mateixa manera que es regeixen els valors d'exposició (EV) que estem acostumats a manipular amb les nostres càmeres. Això és el que representa la figura A, on cada salt correspon a un increment d'1EV, la qual cosa vol dir que cada graó té el doble d'exposició que l'anterior i la meitat que el següent. Recordem que 1EV equival al desplaçament d'un punt de diafragma o de temps d'exposició.




figura A


Però el sensor de la càmera treballa de forma totalment lineal. Si considerem una càmera de 12 bits, com solen tenir la majoria de models actuals, vol dir que utilitza 12 bits per cada canal RGB per tal de definir la imatge capturada. Així tenim que cada canal disposarà de 4096 (2 elevat a 12) tons o valors numèrics. I, seguint la resposta lineal, els salts EV es distribueixen tal i com mostra la figura B. El sensor comença a assignar valors a partir del seu punt de saturació (exposició que provoca el blanc absolut), de tal manera que el nivell més clar (I) disposa de 2048 valors o tons per definir aquest pas, la meitat del total que ens ofereix la càmera. El nivell II correspon a -1EV respecte el nivell I i, seguint la resposta lineal del sensor, disposa de 1024 tons (la meitat de 2048). I així successivament aniríem baixant de valors d'exposició disposant respectivament a cada següent salt de 512, 256, 128, 64, 32, 16, 8, 4, 2 i 1. Si sumem tots aquests salts ens dóna 4095, però hi hem de sumar un valor més que correspon al 0, que també és utilitzat, i llavors ja tenim els 4096 tons totals per canal d'una càmera de 12 bits. Un cop capturada la imatge de forma lineal, se li aplica una corba gamma per tal que aquesta agafi una aparença semblant a la percepció exponencial dels nostres ulls.



figura B


Tot això comporta que les parts més clares de les nostres imatges disposin de més tons per ser definides que no pas les parts més fosques. I com menys tons o valors disponibles té un nivell per ser definit, més soroll aquest presentarà, la qual cosa va estretament lligada a la pèrdua de qualitat. Per això és preferible que una imatge sigui capturada més clara (sense cremar) de la seva aparença real i posteriorment enfosquir-la amb l'edició posterior, ja que a l'enfosquir en la fase d'edició s'afecten proporcionalment tots els valors disponibles de la captura. Dit d'una altra manera, si nosaltres capturem una escena tota ella encabida al nivell III tindrem una imatge definida amb 512 tons per canal, i si la capturem al nivell I i posteriorment l'editem subexposant-la -2EV obtindrem la mateix escena, també amb una aparença de llum semblant a la realitat, però definida amb 2048 tons per canal. Tot això disminueix la presència de soroll i suavitza les gradacions tonals.
Anem a comprovar-ho amb un exemple. La figura C mostra tres captures d'una mateixa escena. La imatge central correspon a l'exposició aconsellada per l'exposímetre de la càmera i ens dóna una sensació de lluminositat molt fidel a la realitat. La imatge de l'esquerra correspon a una subexposició de càmera de -2EV i la de la dreta a una sobreexposició de +2EV.


figura C

Per tant, a priori podríem pensar que l'exposició correcta és la central amb un aspecte molt més natural, però amb el que s'ha explicat en aquest article s'entén que la imatge amb més informació ha de ser la de la dreta, la qual ocupa la part més clara del sensor, que disposa de més valors d'informació, sense arribar a cremar res. Un cop entès que aquesta captura de la dreta és la de més qualitat informativa només ens resta enfosquir-la -2EV amb l'edició posterior per tal de tenir una aparença de lluminositat més semblant a la realitat. Amb aquest propòsit també podríem aclarir +2EV la captura de l'esquerra de la figura C, però la pèrdua de qualitat seria important. Per comprovar això la figura D mostra un mateix retall augmentat de les tres captures un cop corregida la lluminositat per tal que siguin semblants. Fixeu-vos amb el nivell de soroll i la qualitat de la suavitat en les degradacions tonals.



figura D

És evident que l'opció d'enfosquir -2EV la captura sobreexposada +2EV (figura D, retall inferior) és la millor, mentre que l'opció d'aclarir +2EV la captura subexposada -2EV (figura D, retall superior) és la pitjor. El retall central de la figura D correspon a la captura amb l'exposició aconsellada per l'exposímetre de la càmera, i és el resultat intermig a nivell de qualitat final de la imatge. I, per altra banda, aquestes conclusions també venen avalades per la mida dels arxius RAW originals. La captura subexposada -2EV (figura C, esquerra) té una mida de 12,4 MB, la captura amb l'exposició aconsellada per l'exposímetre de la càmera (figura C, centre) té una mida de 12,8 MB i la captura sobreexposada +2EV (figura C, dreta) té una mida de 13,6 MB. 



3 comentaris:

  1. Fantàstic article Ed. Molt aclaridor i gràfic. Molt bé l'exemple que hi has posat.

    ResponElimina
  2. Genial! De fet, jo mai no "dretejava" perquè em sonava a llegenda urbana... Moltes gràcies!

    ResponElimina
  3. Una explicaciò molt clara, que és el que interessa per aprendre. Enhorabona!

    ResponElimina