前不久才使用影像品質衡量指標峰值信號雜訊比 (Peak Signal to Noise Ratio),然而我發現它儘管客觀衡量,但並不能保證人眼檢驗就如其數字所代表。於是,找到更好且更複雜的指標結構相似性 (Structural SIMilarity)。來看愛因斯坦如何決定SSIM吧:P
來看一下WiKi如何描述結構相似性 (Structural SIMilarity):
結構相似性指標 (structural similarity index,SSIM index)是一種用以衡量兩張數位影像相似程度的指標。當兩張影像其中一張為無失真影像,另一張為失真後的影像,兩者的結構相似性可以看成是失真影像的影像品質衡量指標。相較於傳統所使用的影像品質衡量指標,像是峰值信噪比(PSNR),結構相似性在影像品質的衡量上更能符合人眼對影像品質的判斷。
基本觀念
自然影像是高度結構化的狀態,亦即在自然影像中相鄰像素之間有很緊密的關聯性,而這樣的關聯性承載了場景中物體的結構資訊。人類視覺系統在觀看影像時已經很習慣抽取這樣的結構性資訊。因此,在設計影像品質衡量指標用以衡量影像失真程度時,結構性失真的衡量是很重要的因素。
作為結構相似性理論之實現,結構相似度指數從圖像組成的角度,將結構訊息定義為獨立於亮度、對比度及反映場景中物體結構的屬性,並將失真建模為亮度、對比度和結構三個不同因素的組合。用均值作為亮度的估計,標準差作為對比度的估計,共變異數作為結構相似程度的度量。
定義
其中,l(x, y)比較x和y的亮度(luminance),c(x, y)比較x和y的對比度(contrast),s(x, y)比較x和y的結構(structure),α>0、β>0、γ>0,為調整l(x, y)、c(x, y)、s(x, y)相對重要性的參數,μx及μy、σx及σy分別為x和y的平均值和標準差,σxy為x和y的共變異數,C1、C2、C3 皆為常數,用以維持l(x, y)、c(x, y)、s(x, y)的穩定。
總結
結構相似性指標的值越大,代表兩個影像的相似性越高。
界定範圍
SSIM=1就是和原始視訊檔案完全一致,若SSIM>=0.98就是難以與原始視訊檔案分辨區別,而SSIM=0.95的時候大多數人都會對畫面滿意,這個數值可以認為是及格的畫面。SSIM=0.90的時候意味著瑕疵可能要比0.95多一倍,肉眼就會察覺到明顯的畫面劣化,因此低於這個數值時,就可以判定為沒有實際觀賞價值。
參考:WiKi – 結構相似性、SSIM implementation for OpenCV2.x (c++)。
Comments on: "結構相似性 (Structural SIMilarity)" (1)
[…] 定義可參考:結構相似性 (Structural SIMilarity),在此只列出數學方程式: […]
讚讚