Just My Life & My Work

研究Adaptive Logarithmic Mapping For Displaying High Contrast Scenes (2003)。被引用193次。發表在EUROGRAPHICS 2003。

有跟下列在SIGGRAPH 2002發表的論文做比較:

  • Fast Bilateral Filtering for the Display of High-Dynamic-Range Images
  • Gradient Domain High Dynamic Range Compression
  • Photographic Tone Reproduction for Digital Images

1997年A Visibility Matching Tone Reproduction Operator for High Dynamic Range Scenes的Histogram Equalization技術與本篇Adaptive Logmapping技術。

l   Abstract:此篇論文提出了一個快速且有效的tone mapping技術,使得在高動態範圍下,高對比的影像也可以有效的被顯示出來。這裡的方法是建立在壓縮的基礎上,而此壓縮則是對logarithm domain下的luminance value,因為在此domain下的數值運算較接近於人類對於光的反應。除此之外,這裡特別用到一個bias function,其目的是為了使得logarithm得base能夠隨著條件的不同而有適應性的變化,使得經過tone mapping之後可以得到較佳的對比和較詳盡的細節。

l   Introduction:日本的富士影像(Fuji)發展出的Super CCD SR技術,應用在他的數位像機上,透過專有的Super CCDSR技術,利用S-pixels負責高感光的範圍,以及利用R-pixels來負責低感光的範圍,當結合這兩種不同的單元並且同時負責一個pixel的感光工作時,便能延展出更大的動態範圍(一般數位像機的CCD,一個pixel 只有一個感光單元);但是很可惜的,儘管影像擷取的技術不斷的再前進,顯像的技術仍然無法以同步的節奏跟上,例如以往最普遍的顯示器CRT,通常其對比範圍少於100:1。

日常生活常碰到的問題:如何在顯示硬體受限的狀況下,將高動態範圍的影像更完整的顯示出來,使其顯示效果更接近於人眼所看到的。

l   Background:Tone mapping的問題,最早是由Tumblin和Rushmeier和Ward這三個學者所提出來的,但是這幾年許多不同的演算法被提出來,但是大致上可以將這些演算法分成兩大類,Spatially Uniform以及Spatially Varying這兩大類。

而這篇paper所採用的方向,為了計算效率的考量,採用第一類,也就是Spatially Uniform的方式,因為這是建立在快速簡單的brightnessperception的架構上,因此在計算量及速度上會得到較佳的結果,並且其影像結果也會具有比較豐富的細節以及較真實的視覺效果。

l   Adaptive Logarithmic Mapping:其設計的主要考量為兩點,第一點是希望所發展出來的方法可以適用於所有的影像,而不是只能用於某些特定的影像而已,另外一點則是希望這個方法可以依據每張圖的亮度條件不同,而適應性的調整其中一些變數參數,使得此方法更有彈性的應用於所有的影像圖形。

l   Conclusion:此篇論文提出了一個perception-motivated的tone mapping方法,此方法是屬於global mapping的方式,因此比較快速,也不會有奇怪的artifact,而這個演算法主要是利用bias函式來達成interpoationbase的方式代入對數關係裡,而有效取得以2為底及以10為底的優點,最後再利用改良式的ITU-R BT.709 gamma correction函式來達到修正補償的效果,進而得到更佳的顯示效果。

以實做此演算法之後的觀察發現,大約有四個參數可以決定這個演算法的效果,不同的參數出現的效果卻有不小的改變,因此,此演算法在不同類型的圖中,勢必要有不同的參數,若定死了一組參數,並無法在每張影像中都得到最佳的效果,所以此演算法尚不能稱為完全autometic,若要讓此演算法表現得更加完美,如何讓此演算法自動在不同情況下判斷並使用不同的參數,是一個可取的方向。

Source:作者提供論文的資源網站(http://www.mpi-inf.mpg.de/resources/tmo/logmap/),除了有實驗結果和與其它演算法比較的結果影像,還有提供source code可供測試。

l   Adaptive Logarithmic Mapping:其設計的主要考量為兩點,第一點是希望所發展出來的方法可以適用於所有的影像,而不是只能用於某些特定的影像而已,另外一點則是希望這個方法可以依據每張圖的亮度條件不同,而適應性的調整其中一些變數參數,使得此方法更有彈性的應用於所有的影像圖形。

l   從公式中,知道利用對數的關係,可以簡單快速的做到tone mapping的初步結果,但是經過深入的觀察發現,利用對數關係來做tone mapping,若利用不同的base,則出來的結果會有不一樣的效果,以2為底的話,log2所做出來的結果對比比較明顯比較強烈,而且暗部的細節會出現的比較多,但是同時的,亮部的地方卻因為過度over了,亮部容易變成一片白色,整體影像看起來也比較偏亮;若以10為底的話,與log2的結果可說是截然不同,暗步細節出現的效果有限,但是在亮部的細節卻比較好,整體的影像效果看起來是偏暗的。透過下圖的結果便可看的出來,以2為底和以10為底時,所呈現出來兩種不同的結果。

l   其原因可以從下面的分析圖得到答案:

 

l   紅色的限代表以2為底時,mapping的對應圖,藍色則是以10為底,綠色則是由介於2和10之間的數為底所對應的代表圖,在上面的圖中,橫坐標代表原始的值,縱坐標則是代表對映後的值,從圖中明顯的看出,紅色的線將前面的部分快速的對應到較大的部份,而較後面的部份則被對應到一個比較小的範圍,因此,以2為底時,為何暗部細節明顯,並且亮部細節過於over以致變成一片白,從這條紅色的線便說明了一切;相反的,藍色的線和紅色的線對應的走勢真的是大部相同,整個線都被壓制在比較小的範圍上,這也說明了為何以10為底時,整體影像的亮度會被壓低。

l   以2為底太亮,但是暗部細節佳,以10為底的話又太暗,不過亮部細節也很不錯。綜合這兩種結果,若能夠將對數的底,在對應的過程中慢慢的由2 透過interpolation的方式增加到10的話,那理論上整體的影像結果,應該是可以預期會很不錯。

l   此bias函式是一個很常用在電腦影像方面的函式,此函式可以將t重新賦予一個較高或較低的值,其主要的參數是b,不同的b所得到的結果也是不太一樣,以下圖中則是經由不同b所得到的不同的對應曲線:

經過實驗發現一個有趣的結果,bias0.73所得到的結果,相當接近於一般的gamma correction以g = 2.2所得到的結果。

Comments on: "[paper] Adaptive Logarithmic Mapping For Displaying High Contrast Scenes" (3)

  1. 未知 的大頭貼

    […] Adaptive Logarithmic Mapping For Displaying High Contrast Scenes […]

  2. mhnler 的大頭貼

    本來我也想要做這個主題,結果老闆沒同意……
    現在都用PS做HDR。

回覆給mhnler 取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料

標籤雲