當前位置:
首頁 > 最新 > 基於SVM手繪太陽黑子圖像背景提取方法

基於SVM手繪太陽黑子圖像背景提取方法

朱明鋒,鄭勝,曾祥雲,徐高貴

(三峽大學 理學院,湖北 宜昌 443002)

手繪太陽黑子圖像手寫記錄信息對於研究太陽黑子長期活動規律具有重要價值,而背景提取又是利用計算機手繪太陽黑子信息數字化工作中的關鍵過程。文章提出一種基於支持向量機(Support Vector Machine ,SVM)的手繪太陽黑子圖像信息背景提取方法,通過針對性地對每個像素樣本特徵向量的監督學習訓練,從而實現背景像素與前景像素的分離,實驗證明該方法具有很好的魯棒性,將此方法與傳統的K-means模糊劃分、模糊C均值(FCM)聚類方法進行對比分析,證實該方法的應用價值更高。

手繪太陽黑子圖;背景提取;支持向量機;監督學習;K-means聚類

TP319文獻標識碼:ADOI: 10.19358/j.issn.1674 7720.2016.23.015

朱明鋒,鄭勝,曾祥雲,等. 基於SVM手繪太陽黑子圖像背景提取方法[J].微型機與應用,2016,35(23):52-55,58.

0引言

隨著科學技術的快速發展,在短短几十年間,數字圖像處理技術快速發展,並逐漸趨於成熟。該技術在人工智慧應用、遙感影像處理、空間探測、工業檢測以及生物醫學等眾多領域都得到了廣泛應用,並為這些領域內的學科發展提供了新的方向和突破點[1]。在研究太陽活動的過程中,對太陽黑子活動的觀察最為明顯和容易。在計算機不發達的過去,天文工作者所觀測到的太陽黑子的大小、形狀和位置等特徵,主要是通過投影法手工描跡[2],近些年才逐漸由光球觀測照相替代這一傳統方法。每天黑子面積數值表示的是每天出現在全日面上的黑子面積(單位是全日面面積的百萬分之一),在一定意義上,它是太陽磁場活動的每日磁流量的數字化表示,也是太陽發電機產生黑子功率的直接表現[3]。將手繪太陽黑子圖的工作數字化,能夠最大程度地保護這些寶貴數據不被丟失,並且可以方便地快速整合所有觀測到的黑子信息,使不同天文台的觀測數據信息得到有效的整合與規整化處理,可為太陽黑子活動研究者提供便捷的數據查詢和使用服務,這一革新對天文研究的意義是不言而喻的[4-5]。

西班牙和比利時是世界上較早開始手繪太陽黑子圖像數字化處理工作的,DigiSun和HSUNSPOTS等手繪黑子圖像的數字化工具就是由他們研製出來的[6]。我國自上世紀30年代末開始對太陽黑子活動進行相關觀測,並將觀測結果記錄於紙上,到目前為止雲南國家天文台已經獲取了2萬多張如圖1所示的太陽黑子手繪圖。對於手繪太陽黑子圖信息數字化工作即是將圖像中手寫記錄信息提取並保存於資料庫中,這一工作的重要環節是對圖像背景的提取和分離。

圖像信息數字化的關鍵在於數字圖像的處理演算法[7-10],包括圖像RGB空間聚類、圖像分割等,背景的有效分割是手繪太陽黑子圖像中信息數字化的難點。

SVM是經典的機器學習方法之一,在回歸處理、模式分類等方面都有明顯優勢[11]。針對手繪太陽黑子圖像信息數字化中的背景分離工作,本文提出一種基於支持向量機的背景提取方法,通過利用LIBSVM圖像處理演算法將圖像中的R、G、B顏色分量進行訓練學習,得到最優分類模型,經試驗驗證,該方法不僅效果顯著,而且魯棒性也很好,自動適應由於年代久遠、紙張發生變化給圖像帶來的模糊效應。

1理論基礎

支持向量機 (Support Vector Machine,SVM)機器學習方法以統計學的VC理論和構造風險最小化為基本原理。該方法可以基於一定的樣本信息,使模型在其實現可行性和模式分類能力之間尋找最佳平衡點,是SLT的一種成功實現[12],又稱為回歸機。假設訓練樣本為(xi,yi),(i=1,…,n),其中n為樣本大小。採用線性函數對樣本進行擬合是最簡易的SVM回歸分析方法。對於如何解決線性不可分的分類問題,最有效的方法是在高維樣本特徵空間中建立線性模型,其中的關鍵是將樣本點映射到高維空間的非線性變換,SVM回歸機可以表示如下:

式(1)中,ω2是模型複雜度相關因素;C>0代表對誤差範圍之外樣本的抑制力度,即懲罰係數;ε則代表非敏感損失函數,模型中支持向量的個數會受到其取值大小的影響;ξi、ξ*i表示樣本與非敏感區域的相對距離,即鬆弛變數。

對於式(1),通常獲得原始問題最佳解的方法是通過求解上述模型對偶問題的最佳解:

其中,K(xi+xj)是核函數,滿足Mercer條件並且K(xi+xj)=φ(xi)φ(xj)。徑向基核(Radial Basis Function,RBF)是普適的核函數:

其中γ=1/σ2,σ>0 是核函數寬度係數。懲罰力度大小C、不敏感程度ε、卷積核及其處理參數的選取,對SVM的分類正確率有較大的影響[13]。

K-means是一種無監督的數據劃分聚類演算法,在預先不知道樣本所屬類別的情況下,根據樣本之間的距離或相似程度自動地進行樣本的分類,是一種基於劃分的聚類方法 [14] 。

經典的K-means演算法中,使用每個樣本與每個樣本區中心點之間誤差的平方和最小為準則來建立映射關係。假設待分類的樣本集合為D=nj=1,xj∈Rd,K-means劃分演算法的目的就是將樣本數據集合劃分為k(k>

FCM採用隸屬度矩陣來確定每個樣本屬於某個分類的程度[15]。假設樣本數為n個向量xi(i=1,2,…,n)組成的模糊組,將其分為c個區域中心,使得非相似性指標函數的值達到最小。

2數據樣本採集及特徵向量構造

2.1數據樣本採集

早先的太陽黑子觀測是記錄在特定的紙張上的。特定的繪製紙張是印刷出來的,上面有固定的表格和文字信息等,如圖2所示。為了更好地進行圖像的下一步分割操作,首先需要將圖像中的印刷部分提取出來,也就是圖2所示部分。

將圖2中的圖像進行二值化處理,即可得到每個像素樣本的類別信息。手繪太陽黑子圖像中,對於每個像素點,都是一個特定樣本,其R、G、B值即是其特徵值,那麼,對於每個像素樣本而言,其特徵向量即為X=[RGB]。

2.2特徵向量構造

手繪太陽黑子圖像的背景提取中,每個像素點都是一個待分類的樣本,由此,構造樣本的特徵向量為:

其中,n為圖像中像素的個數。假設圖像為M×N×3的矩陣,那麼n=M×N。在SVM模型訓練過程中,需要輸入樣本的監督向量。由此,建立監督向量為:

其中,當Xi為前景像素點時,yi=+1;當Xi為背景像素點時,yi=-1。

SVM可以使用少量樣本來對大量實體對象進行分類[16-17]。因此,本文隨機選取原圖像素中的2萬個點進行訓練,然後使用得到的模型對圖像進行前景與背景的提取。

2.3SVM問題求解機制

SVM比較擅長於二分類問題的求解,本問題正屬於二分類問題。假設待分類的N個樣本組成的集合為:xi,yiNi,並且yi=+1,-1,這裡,可以將構造的樣本特徵向量X i看作是xi,而Y i即是yi。其中xi是一個n維向量,這裡n=3,yi是向量所屬的分類類別信息。

SVM使用一個超平面將樣本進行分類:

其中,w是輸入向量,x是自適應權重向量,b是偏置量。求解過程中,最大化邊界2/w2獲得最優分界面參數w和b,設定約束條件為:

引入拉格朗日係數,獲得對偶問題有效解:

滿足條件:

αi≥0,∑mi=1αiyi=0

將內積形式數據點映射到希爾伯特內積空間:

其中,K(·)是核函數。

由此可將式(9)化為:

由此可得到SVM分類器為:

其中,

是SVM分類面上的決策表達式。

3手繪黑子圖像背景提取實驗結果及分析

3.1SVM背景提取

構造的樣本通過訓練後得到SVM分類模型,然後對原始圖像進行分類處理。

圖3是背景提取結果的局部顯示,圖3(a)是原始圖像中的局部圖,圖3(b)是提取出來的背景圖像,圖3(c)是提取出來的背景黑白顯示。

3.2SVM劃分與模糊聚類劃分對比分析

文中使用中國科學院雲南天文台1982年到1992年,以及1995、1997、2000年每年一月份中隨機抽取一張共14張手繪太陽黑子圖像進行試驗,使用K means、FCM、SVM等方法分別對圖像中印刷體背景進行提取,部分結果如圖4所示。

圖4中a0、a1、a2、a3、a4分別是1989年1月19日手繪太陽黑子圖像原圖中的部分圖像、手動提取背景信息圖像中相同位置部分圖像、K means聚類提取背景信息圖像中相同位置部分圖像、SVM提取背景圖像中相同位置部分圖像、FCM提取背景圖像中相同位置部分圖像;b0、b1、b2、b3、b4,c0、c1、c2、c3、c4則分別是1991年1月9日和1995年1月11日兩天不同處理後圖像中的局部顯示。

分別對幾種處理方法在處理速度和處理PSNR上進行統計,結果如表1所示,計算PSNR的公式為:

其中,d代表圖像像素的位深,8 bit的圖像中d=8,MSE是原始圖像與處理後圖像之間的均方誤差,其計算公式如下:

其中,m,n是圖像的大小維度,I(i,j)為原圖像中的像素點的值,P(i,j)為處理後圖像中對應點的像素點的值。因此,PSNR值越大,代表處理後圖像失真越小。

由表1可知,SVM提取印刷體背景與人工手動處理得到的背景信息PSNR均值達到56.33,具有高的實用價值,並且處理速度也在可接受範圍內。

4結論

K-means與FCM等傳統的聚類方法在前景與背景的分離中具有較好的使用價值,但聚類中心不穩定性以及聚類演算法複雜性,限制了其應用範圍和場景。支持向量機作為有監督的分類網路,可在一次性學習後,得到相關係列分類問題的分類知識表達,並且模型易於推廣使用,在手繪太陽黑子圖像背景的分離中具有較好的效果,可應用於手繪太陽黑子圖像分割的前期處理,以便更好地自動提取和識別圖像中的手寫記錄信息,對於手繪太陽黑子圖像信息的提取和數字化具有重要意義。另外,在自然背景下的圖像中,對於單色目標的分割也具有較好的適應性。

參考文獻

[1] 劉中和,王瑞雪,王鋒德,等. 數字圖像處理現狀與展望[J]. 計算機時代,2005(9):6-8.

[2] 劉學富. 太陽黑子觀測[J]. 天文愛好者,1999(6):24-26.

[3] 吳立德. 計算機視覺[M]. 上海:復旦大學出版社,1993.

[4] 李可軍,蘇同衛,梁紅飛. 現代黑子觀測的太陽黑子活動周的周期性[J]. 科學通報,2004,49(24):2511-2516.

[5] Zheng Sheng,Zeng Xiangyun,Lin Ganghua,et al. Sunspot drawings handwritten character recognition method based on deep learning[J]. New Astronomy, 2016,(45): 54-59.

[6] 朱道遠,鄭勝,曾祥雲,等. 手繪太陽黑子圖像手寫字元分割方法研究[J]. 微型機與應用,2015,34(20):33-35.

[7] 周得水,葛洪偉. 基於貪心演算法的快速模糊連接圖像分割[J]. 計算機應用與軟體,2015,32(8):201-203.

[8] 邰瀅瀅,吳彥海,張利. 基於快速mean-shift聚類與標記分水嶺的圖像分割方法[J]. 計算機應用與軟體,2015,32(8):184-186.

[9] 黎遠松. 高斯混合模型融合SSC的腦部MR圖像分割[J]. 計算機應用與軟體,2015,32(7):70-73.

[10] 鄧娟. 基於灰度向量表示的紋理元集的非監控紋理圖像分割[J]. 計算機應用,2005,25(1):117-118.

[11] 鍾壇旺,林昭語. LIBSVM回歸演算法在話務預測中的應用[J]. 電信工程技術與標準化,2014(9):80-83.

[12] 李冬萍. 基於混沌粒子群優化的SVM分類器研究[J]. 計算機模擬,2010,27(4):185-187.

[13] 袁勛,吳秀清,洪日昌,等. 基於主動學習SVM分類器的視頻分類[J]. 中國科學技術大學學報,2009,39(5):473-478.

[14] 高麗平,周雪燕,詹宇斌. 流行上的非線性判別K均值聚類[J]. 計算機應用,2011,31(12):3247-3251.

[15] 徐少平,劉小平,李春泉,等. 基於區域特徵分析的快速FCM圖像分割改進演算法[J]. 模式識別與人工智慧,2012,25(6):987-995.

[16] 孫少乙,黃志波. 一種 SVM 多分類演算法[J]. 微型機與應用,2016,35(8):12-14,17.

[17] 高晴,閆德勤,楚永賀,等.基於模糊聚類的 LLE 和 SVM 的人臉識別[J].微型機與應用,2016,34(6):56-58.

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 環保領域好幫手 的精彩文章:

TAG:環保領域好幫手 |