基于地面成像高光譜的石碑文字信息提取研究
0 引言
石碑作為古時代的文化產(chǎn)物,它是人類征服自然、改造自然的物質(zhì)文化結(jié)晶,也是古代精神文明的外在表現(xiàn)。它作為時代界標(biāo)矗立于世,見證了中國古代社會歷史的變遷,維系了時代精神。然而現(xiàn)存的一些石碑已經(jīng)破損,表面的文字和圖案信息模糊不清,這些石碑文物不僅是藝術(shù)作品也具有重要的研究價值,因此保護(hù)石碑就是保護(hù)珍稀的歷史文物,搶救石碑就是搶救不可再生的傳統(tǒng)文化。
隨著科學(xué)技術(shù)的發(fā)展,高光譜技術(shù)在文物保護(hù)中的應(yīng)用越來越多。高光譜遙感是20世紀(jì)80年代興起的新型對地觀測技術(shù),是當(dāng)前遙感的前沿技術(shù)。高光譜數(shù)據(jù)具有波段數(shù)目多,波段寬度窄,波段分布連續(xù),光譜分辨率高,圖譜合一等特點,基于高光譜數(shù)據(jù)完整而豐富的特點,利用高光譜技術(shù),對石碑上存在的信息進(jìn)行提取分析,以期提取和重現(xiàn)石碑上的原有信息。譚克龍等以秦始皇陵區(qū)為研究區(qū),較系統(tǒng)地闡述了高光譜遙感在考古中的創(chuàng)新應(yīng)用研究,以及所取得的考古成果;侯妙樂等基于高光譜數(shù)據(jù)設(shè)計了半自動提取壁畫底稿信息的“三步法”,實現(xiàn)基于特征波段合成影像的壁畫底稿信息提??;Scholten等通過對高光譜影像分析,參考不同墨水的波譜特性,提取了部分底稿的歷史文本信息;郭丹彤對沙巴卡石碑及其學(xué)術(shù)價值進(jìn)行了研究,沙巴卡石碑的學(xué)術(shù)價值體現(xiàn)在語言、政治、宗教等方面,但它最重要的學(xué)術(shù)價值則體現(xiàn)在哲學(xué)上;田子馥等以7塊石碑為實證,說明東北文化從上古時期就是以漢族漢字文化為主體,多民族的文化形成多元一體的文化形態(tài),并且闡述了東北文化主體性、重疊性、相對性的本質(zhì)特征。但這些研究的對象都是比較完好的石碑,對于破損和表面信息模糊缺失的石碑沒有進(jìn)行應(yīng)用研究。
本文基于閾值的最小噪聲分離變換(Minimum Noise Fraction Rotation,MNF Rotation)算法并應(yīng)用到提取石碑特征信息中,分離了高光譜數(shù)據(jù)中的有效信息和噪聲,降低了數(shù)據(jù)維數(shù),并將原始數(shù)據(jù)轉(zhuǎn)換到新的數(shù)據(jù)空間中,然后從中選取體現(xiàn)石碑特征信息效果最好的特征波段,為進(jìn)一步利用挖掘?qū)κ系奶卣餍畔⑻峁┘夹g(shù)基礎(chǔ)。
1、 材料與分析
試驗中的石碑分別由北京大學(xué)考古文博學(xué)院、山西博物院提供,石碑出土?xí)r石碑上有部分被土覆蓋,對石碑表面覆蓋的土層進(jìn)行簡單的剝離處理,可以看到石碑上有模糊的文字存在。
石碑的高光譜圖像采集是運(yùn)用江蘇雙利合譜科技有限公司自主研發(fā)的便攜式高光譜成像儀系統(tǒng)GaiaFiled。該系統(tǒng)由多維運(yùn)動控制器(二維運(yùn)動控制平臺,掃描維度和調(diào)焦維度控制平臺),成像鏡頭、光譜相機(jī)(面陣探測器)和成像光譜儀組成,支持自動曝光、自動掃描速度匹配、自動調(diào)焦等功能。圖1為GaiaField便攜式高光譜成像儀的實體圖,表1為高光譜相機(jī)的參數(shù)。
圖1 GaiaField便攜式高光譜成像儀實體圖
表1 GaiaFiled高光譜分選儀系統(tǒng)參數(shù)
序號 |
相關(guān)參數(shù) |
V10 |
1 |
光譜范圍 |
400-1000 nm |
2 |
光譜分辨率 |
4.0±0.3 nm |
3 |
像面尺寸 |
6.45×8.8mm |
4 |
倒線色散 |
93.9nm/mm |
5 |
相對孔徑 |
F/2.8 |
6 |
雜散光 |
<0.5% |
7 |
波段數(shù) |
520 |
8 |
成像鏡頭 |
23 mm |
圖像采集軟件采用江蘇雙利合譜科技有限公司提供的高光譜成像系統(tǒng)采集軟件SpecView完成。圖像處理采用 ENVI5.3 軟件進(jìn)行處理。在進(jìn)行圖像處理之前,先要對采集的光譜圖像進(jìn)行圖像校正,圖像校正公式如下:
(1)
式中,Rref 是校正過的圖像,DNraw 是原始圖像,DNwhite為白板校正圖像,DNdark是黑板校正圖像。
試驗得到的光譜含有由儀器和試驗條件等引起的噪聲,對這些噪聲的處理有助于減少噪聲對光譜分析的影響,突出光譜的有效信息。Savitzky-Golay (SG)平滑算法可以有效消減光譜數(shù)據(jù)中的隨機(jī)噪聲,消噪效果受平滑點數(shù)的影響,本文中選擇SG二次多項式5點平滑對光譜數(shù)據(jù)進(jìn)行處理。
由于高光譜遙感數(shù)據(jù)波段多,波段間存在很大相關(guān)性,為了克服維數(shù)災(zāi)難,利用最小噪聲分離變換進(jìn)行波段選擇,達(dá)到優(yōu)化數(shù)據(jù),去除噪聲和數(shù)據(jù)降維的目的。
最小噪聲分離變換( MNF)是對主成分變換( PCA) 的一種改進(jìn)方法。PCA 是一種線性變換,變換后各主成分分量彼此之間互不相關(guān),隨著主成分的增加該分量包含的信息量減小,第一主成分包含的信息量最大,第二主成分與第一主成分無關(guān)且在剩余成分中包含的信息量最大,依此類推。但PCA對噪聲比較敏感,在變換后的主成分分量中,信息量大的信噪比不一定高,當(dāng)某個信息量大的主成分中包含的噪聲的方差大于信號的方差時,該主成分分量形成的圖像質(zhì)量就差。針對 PCA 變換的不足,Green 和 Berman 提出最小噪聲分離變換( MNF),它不但能判定圖像數(shù)據(jù)內(nèi)在的維數(shù)( 波段數(shù)) ,分離數(shù)據(jù)中的噪聲,而且能減少隨后處理中的計算需求量。MNF 變換是基于圖像質(zhì)量的線性變換,變換結(jié)果的成分按照信噪比從大到小排列。經(jīng)過MNF變換大部分噪聲集中在特征小的分量中。而不像 PCA變換按照方差由大到小排列,從而克服了噪聲對影像質(zhì)量的影響。
本文分析的對象由北大考古文博學(xué)院、山西博物院提供,如圖 2 所示為使用高光譜成像相機(jī)拍攝的數(shù)據(jù)合成的真彩色圖像。從圖2可知,石碑里的文字有些已經(jīng)風(fēng)化變的模糊不清,難以用肉眼識別出來。
圖2 北大考古文博學(xué)院與山西博物院石碑RGB真彩色合成圖(從左到右)
對原始高光譜數(shù)據(jù)進(jìn)行 MNF 變換(如圖3) ,分別得到以有效信息為主的波段和以噪聲為主的波段,并且按照信噪比從大到小的順序排列。原始數(shù)據(jù)的主要信息都集中在前面特征值大的波段,后面特征值小的波段主要以噪聲為主。特征值接近于1的多數(shù)是噪聲,最好選擇特征值高的波段。根據(jù)MNF變換特征值曲線確定閾值為 8,選擇變換后的維數(shù)為 8。
圖 3 MNF 變換后的特征值曲線(從左到右:考古文博學(xué)院、山西博物院)
2.3 特征信息提取分析
在進(jìn)行 MNF 變換后的波段中,選擇特征值大,圖像信息顯示效果突出的波段。在原始高光譜圖像中右下角可以模糊地看到有圖案存在,分別加載MNF 變換后第 1- 8波段影像,發(fā)現(xiàn)北京大學(xué)考古文博學(xué)院提供的石碑在MNF變換的第 4波段顯示的文字部分較為清晰(圖4a),山西博物院提供的石碑在MNF變換的第1波段顯示的文字較為清晰,如圖4b所示。在MNF變換中,通過信號與噪聲分離,使信息更加集中在有限的特征集中,一些微弱信息則在去噪轉(zhuǎn)化中被增強(qiáng)。同時在MNF轉(zhuǎn)化過程中,使光譜特征向類特征向量匯集,增強(qiáng)分類信息。在MNF變換后的特征域中不同的波段具有不同的光譜信息。比如北京大學(xué)考古文博學(xué)院提供的石碑在變換后的MNF波段1代表整個波段的亮度背景,即光譜背景,在影像上都較其他的MNF波段亮,第8波段以后出現(xiàn)隨機(jī)噪聲。
圖4a 北京大學(xué)考古文博學(xué)院石碑文字信息提取結(jié)果對比圖
圖4b 山西博物院石碑文字信息提取結(jié)果對比圖
對比原始高光譜數(shù)據(jù),由表 2 可知,MNF 變換后的數(shù)據(jù)量也有效地降低,提高了數(shù)據(jù)的處理速度。
表 2 數(shù)據(jù)對比
數(shù)據(jù) |
北大考古文博院 |
山西博物院 |
原始數(shù)據(jù) |
598,560 KB |
549,144 KB |
MNF變換后數(shù)據(jù) |
468,776 KB |
418,631 KB |
針對高光譜數(shù)據(jù)信息量豐富,但數(shù)據(jù)冗余且包含噪聲的特點,本文基于最小噪聲分離變換算法有效地對石碑高光譜圖像進(jìn)行降維和去噪處理,分離了圖像中的有效信息和噪聲,減小了后期處理的數(shù)據(jù)量,提高了數(shù)據(jù)處理效率。通過對石碑高光譜數(shù)據(jù)進(jìn)行最小噪聲分離變換,提取了原始影像中模糊不清的文字,實驗結(jié)果對于后期石碑的文字修復(fù)和研究提供了參考和借鑒。
地址:無錫市梁溪區(qū)南湖大道飛宏路58-1-108
電話:13810664973
郵箱:info@dualix.com.cn
地址:北京市海淀區(qū)中關(guān)村大街19號
電話:13810664973
郵箱:info@dualix.com.cn
地址:陜西省西安市高新區(qū)科技一路40號盛方科技園B座三層?xùn)|區(qū)
電話:13810664973
郵箱:info@dualix.com.cn
地址:成都市青羊區(qū)順城大街206號四川國際大廈七樓G座
電話:13810664973
郵箱:info@dualix.com.cn