緒論:寫作既是個人情感的抒發(fā),也是對學(xué)術(shù)真理的探索,歡迎閱讀由發(fā)表云整理的11篇數(shù)字圖像處理綜述范文,希望它們能為您的寫作提供參考和啟發(fā)。
【中圖分類號】G642 【文獻(xiàn)標(biāo)識碼】A 【文章編號】1006-9682(2012)10-0001-03
一、引 言
數(shù)字圖像處理作為一門學(xué)科大約形成于20世紀(jì)60年代初期,并首次在航空航天領(lǐng)域取得了成功應(yīng)用。數(shù)字圖像處理技術(shù)的發(fā)展除了與計算機(jī)技術(shù)、信息技術(shù)的快速發(fā)展密切相關(guān)以外,還得益于其在航空航天、工業(yè)、生物醫(yī)學(xué)、軍事、通信工程、商務(wù)、環(huán)境、林業(yè)等諸多領(lǐng)域的廣泛應(yīng)用,正是這些應(yīng)用需求,促進(jìn)了數(shù)字圖像處理技術(shù)的深入研究和快速發(fā)展。“數(shù)字圖像處理”課程是隨著計算機(jī)和信息技術(shù)發(fā)展應(yīng)運(yùn)而生的一門新興課程,已成為信息類專業(yè)本科生的重要專業(yè)課。通過該課程的學(xué)習(xí),要求學(xué)生掌握數(shù)字圖像處理的基本概念和原理,能夠?qū)D像進(jìn)行各種處理,如圖像增強(qiáng)、圖像運(yùn)算、圖像編碼、邊緣檢測等,為圖像通信、模式識別、計算機(jī)視覺以及其他交叉學(xué)科等工程領(lǐng)域的應(yīng)用奠定基礎(chǔ)。
“數(shù)字圖像處理”課程的理論教學(xué)很抽象,僅僅通過理論教學(xué)學(xué)生很難掌握數(shù)字圖像處理的基本原理。如果把數(shù)字圖像處理的廣泛應(yīng)用引入課堂理論教學(xué),將具體知識點與其在實踐中的使用相結(jié)合,同時為學(xué)生提供邊學(xué)邊實踐的機(jī)會,不僅可以提高學(xué)生的學(xué)習(xí)興趣,加深對抽象理論知識的理解,增強(qiáng)其動手實踐的能力,還可以拓展學(xué)生的視野,與目前學(xué)科前沿技術(shù)相銜接。
二、視覺測量技術(shù)
在現(xiàn)代三維測量新技術(shù)中,視覺測量是由計算機(jī)視覺、圖像處理、模式識別等多學(xué)科交叉結(jié)合而形成的科學(xué)。圖1所示,視覺測量是一種非接觸性測量手段,以數(shù)字圖像作為信息載體,對被測目標(biāo)進(jìn)行成像,通過提取多個像面的二維像點信息,標(biāo)定相機(jī)內(nèi)、外參數(shù),并重建、優(yōu)化被測目標(biāo)的三維信息,實現(xiàn)測量。視覺測量基于嚴(yán)謹(jǐn)?shù)睦碚摵同F(xiàn)代的硬軟件設(shè)施,可以達(dá)到相當(dāng)高的精度和可靠性,便于對大型工件、設(shè)備的尺寸、位置、三維輪廓等進(jìn)行高精度測量,而且移動方便,可快速靈活地構(gòu)建適于不同測量對象的系統(tǒng),進(jìn)行現(xiàn)場測量。目前,視覺測量技術(shù)已經(jīng)廣泛應(yīng)用于建筑工程、航空航天、汽車制造、生物醫(yī)學(xué)、考古等各個領(lǐng)域。[1~5]因此,視覺測量技術(shù)正在深入工業(yè)生產(chǎn)和社會生活的各個領(lǐng)域,研究和應(yīng)用新的基于光學(xué)、數(shù)字圖像和視覺信息融合的三維測量方法,既具有重要的理論意義,又具有重大的實用價值,應(yīng)用前景非常廣闊。
根據(jù)視覺測量的基本原理,利用數(shù)字圖像處理技術(shù)獲取的二維信息是視覺測量中相機(jī)標(biāo)定、三維重建等環(huán)節(jié)的基礎(chǔ),對于系統(tǒng)的測量精度、穩(wěn)定性等方面具有決定性的影響,是視覺測量領(lǐng)域的關(guān)鍵技術(shù)。在長期的數(shù)字圖像處理課程教學(xué)以及視覺測量研究工作中發(fā)現(xiàn),可以將視覺測量中關(guān)于數(shù)字圖像處理的應(yīng)用內(nèi)容引入課堂教學(xué)中,與具體理論知識相結(jié)合,加深學(xué)生對于課程理論的理解,使其接觸到科學(xué)研究的前沿內(nèi)容。此外,通過設(shè)置開放性實驗等環(huán)節(jié),引導(dǎo)有興趣和能力的學(xué)生進(jìn)行實踐能力的培養(yǎng),使學(xué)到的知識“活”起來。
三、視覺測量與數(shù)字圖像處理課程的融合
為了改善數(shù)字圖像處理課程的教學(xué)效果,提高教學(xué)效率,將視覺測量技術(shù)與數(shù)字圖像處理課程相融合,本文主要在教學(xué)方法和教學(xué)手段改革、視覺測量需求與理論知識點結(jié)合、實踐動手能力提高等方面進(jìn)行了研究。
1.教學(xué)方法和教學(xué)手段改革
為了貫徹學(xué)生是教育主體的教育思路,使學(xué)生學(xué)會學(xué)習(xí),并充分激發(fā)學(xué)生的創(chuàng)新能力和素質(zhì)培養(yǎng),促進(jìn)學(xué)生個性的發(fā)展,同時有利于師生彼此促進(jìn)共同進(jìn)步的原則,針對數(shù)字圖像處理課程的特點,采取了以下措施:
(1)重視數(shù)字圖像處理課程的基礎(chǔ)理論教學(xué)。數(shù)字圖像處理內(nèi)容豐富,應(yīng)用靈活廣泛,但學(xué)生在掌握某些具體應(yīng)用技術(shù)時感到理解困難。因此,在實際教學(xué)上,首先需要注重相關(guān)的基礎(chǔ)理論教學(xué)。[6]例如,數(shù)字圖像的本質(zhì)是數(shù)字信號,所以在課程前期階段,專門有針對性地復(fù)習(xí)和講解了信號分析與處理方面的基本理論,包括數(shù)字信號處理的常用方法、離散傅里葉變換和快速傅里葉變換、離散余弦變換等,這些理論在數(shù)字圖像處理課程中有具體應(yīng)用。這不僅有利于對數(shù)字圖像處理內(nèi)容的掌握,也可以反過來加深對相關(guān)理論的理解。另一方面注意授課內(nèi)容的精選,內(nèi)容不在于多,而在于少而精,突出重點,使學(xué)生在有限學(xué)時內(nèi)有最大的收獲。例如,在頻域空間進(jìn)行圖像增強(qiáng)時,不能將頻域空間的所有方法都對學(xué)生講授,而是突出講解了關(guān)于頻域空間與時域空間處理之間的關(guān)系,針對頻域圖像平滑介紹一種低頻濾波器,分析其原理和特點。這樣不僅節(jié)省了教學(xué)時間,而且重點突出,同時也引導(dǎo)學(xué)生查閱其他相關(guān)方法,讓他們自己去動腦思考,提高其思維能力。
(2)完善和改革課堂教學(xué)方法。在課堂教學(xué)過程中,我們始終重視啟發(fā)式教學(xué),遵循“提出問題”、“啟發(fā)式思考”、“解決問題”的教學(xué)過程,使用“問題教學(xué)法”引導(dǎo)學(xué)生去思考、分析問題,激發(fā)學(xué)生學(xué)習(xí)的積極性,提高教學(xué)效果。課堂開始時,根據(jù)授課內(nèi)容,提前向?qū)W生拋出相關(guān)問題,在講課過程中則圍繞該問題講解課程內(nèi)容,最后提出問題的解決方法。例如,在講解“直方圖均衡化圖像增強(qiáng)技術(shù)”一節(jié)內(nèi)容時,首先向?qū)W生展示了兩幅曝光不足和曝光過量的圖片,并且為了提高學(xué)生的學(xué)習(xí)興趣,認(rèn)識數(shù)字圖像處理的實際應(yīng)用,圖片取自于視覺測量、航空交會對接定位等領(lǐng)域的實際圖片,向?qū)W生提問,“如果實際應(yīng)用中,由于環(huán)境光的影響,拍攝到了這樣的圖片,應(yīng)該怎么辦?”課堂講解過程中,隨著直方圖、直方圖增強(qiáng)技術(shù)的理論、直方圖均衡化方法等內(nèi)容的展開,使學(xué)生逐漸理解并掌握直方圖均衡化方法,最后,給學(xué)生演示了直方圖均衡化方法的實現(xiàn),并看到了利用該方法對圖片增強(qiáng)前后的圖片效果。這種啟發(fā)引導(dǎo)式的課堂教學(xué)方法,取得了良好的效果。
(3)傳統(tǒng)和現(xiàn)代化教學(xué)手段相結(jié)合。隨著計算機(jī)、通信技術(shù)應(yīng)用的迅速普及,國內(nèi)高校的課堂教學(xué)已普遍采用了多媒體技術(shù),利用計算機(jī)、投影儀、幻燈機(jī)等現(xiàn)代化教學(xué)設(shè)備,結(jié)合計算機(jī)輔助教學(xué)(CAI)展示教學(xué)內(nèi)容。這些現(xiàn)代化技術(shù)的確為課堂帶來了很多豐富多彩的教學(xué)手段。數(shù)字圖像處理是以圖像為處理對象,其輸出的形式主要以圖像和圖形為主,該課程也十分適宜將教學(xué)內(nèi)容制成課件,采用多媒體計算機(jī)開展現(xiàn)代化教學(xué)。借助多媒體,使學(xué)生較直觀地看到各種圖像的處理需求、處理過程、處理效果等,這是普通教材和參考資料所無法比擬的。因此,我們針對課堂教學(xué)需求,進(jìn)行了多媒體課程教學(xué)資源建設(shè),如教學(xué)大綱、教學(xué)日歷、授課教案和課件等通過多媒體平成,便于講課,同時也便于學(xué)生課后的復(fù)習(xí)。例如,將視覺測量原理、過程等,通過多媒體課件的形式演示出來,相比較口頭介紹等方法具有更加直觀的效果。除了多媒體教學(xué)手段,傳統(tǒng)的板書式教學(xué)作為補(bǔ)充手段也在數(shù)字圖像處理課程中得到應(yīng)用,主要用在課堂教學(xué)內(nèi)容框架展示、理論推導(dǎo)等方面。
2.視覺測量與理論知識點結(jié)合
為了提高算法對于目標(biāo)特征的識別效果,視覺測量通常采用圓形或方形特征點(圖2),在獲取的圖像中對特征的成像位置進(jìn)行識別和精確定位。視覺測量對于圖像處理的要求主要包括圖像預(yù)處理、特征粗定位、特征精定位等內(nèi)容,對應(yīng)數(shù)字圖像處理課程中的圖像增強(qiáng)、邊緣檢測、特征識別、幾何運(yùn)算等知識點。[7]
圖2 視覺測量常用特征點
(1)圖像預(yù)處理。圖像預(yù)處理的主要方法包括彩色圖像灰度化、圖像增強(qiáng)等,為此,在講解彩色圖像內(nèi)容時,介紹了RGB、HSI等彩色模型以及不同彩色模型之間的轉(zhuǎn)換,并引出如何將彩色信息轉(zhuǎn)換成灰度信息。通過分析彩色表示模型,建立了彩色到灰度圖像的轉(zhuǎn)換。
向?qū)W生展示常用視覺測量圖像效果的基礎(chǔ)上,為了減少圖像噪聲的影響、提高圖像識別效果,提出改善圖像質(zhì)量的目標(biāo),需要進(jìn)行圖像增強(qiáng)。結(jié)合圖像增強(qiáng)中常用的直方圖增強(qiáng)技術(shù)、空域和頻域圖像增強(qiáng)方法在視覺測量圖像處理中的實際應(yīng)用,給學(xué)生展示直觀的處理效果,加深對圖像增強(qiáng)方法的理解。
(2)特征點粗定位。數(shù)字圖像處理的邊緣檢測是該課程比較重要的一部分內(nèi)容,邊緣檢測中包含了多種方法,便于學(xué)生對不同邊緣檢測算法的作用效果有直觀印象,將各種算法應(yīng)用于視覺測量圖像征點的邊緣檢測,并有針對性地選擇相應(yīng)參數(shù),使學(xué)生不僅學(xué)習(xí)了各種邊緣檢測算法的使用,也看到了算法的特點。
根據(jù)視覺成像的特點,圓形特征點成像后一般為橢圓,所以,利用邊緣檢測得到的邊緣像點數(shù)據(jù),講解用邊緣點進(jìn)行指定特征識別的方法,如基于Hough變換的特征檢測方法。為了引導(dǎo)學(xué)生思考,采用啟發(fā)式講課方法,講解了Hough變換檢測直線的方法,引出如何用Hough變換檢測像面上的圓或橢圓,并鼓勵有能力的學(xué)生實現(xiàn)相應(yīng)算法。
(3)特征點精定位。特征點精定位的目的是在實現(xiàn)特征點粗定位的基礎(chǔ)上,對圓形特征點中心在像面上的精確坐標(biāo)進(jìn)行定位。精確定位主要設(shè)計到數(shù)字圖像處理中的點運(yùn)算,但需要考慮采用的具體定位算法,如灰度重心法、加權(quán)灰度重心法、橢圓擬合法等。引導(dǎo)學(xué)生通過文獻(xiàn)資料查找和實現(xiàn)相關(guān)定位算法,并且與國際領(lǐng)先的專業(yè)軟件進(jìn)行定位精度對比。通過比較,可以使學(xué)生發(fā)現(xiàn)不同算法之間的區(qū)別,并分析不同的原因。進(jìn)一步,引導(dǎo)學(xué)生嘗試對定位算法做一定的改進(jìn),這種改進(jìn),不需要從算法根本上做出很大的創(chuàng)新,只是從某一方面進(jìn)行微小的變化,使其能夠適合特定的應(yīng)用需求。例如,如果對視覺測量像面上特征點定位采用加權(quán)灰度重心法時,通過調(diào)整加權(quán)系數(shù),得到不用的效果,從而分析加權(quán)系數(shù)對于定位精度的影響,并據(jù)此得出適用于該需求的結(jié)論。
四、開放性實驗
長期以來,“數(shù)字圖像處理”課程教學(xué)主要采用課堂理論教學(xué),教學(xué)內(nèi)容也多為經(jīng)典的內(nèi)容,很難反映課程內(nèi)容的時代特征。實驗教學(xué)是高等教育的重要組成部分,是抽象思維與形象思維、傳授知識與訓(xùn)練技能相結(jié)合的過程,在人才培養(yǎng)中具有課堂理論教學(xué)環(huán)節(jié)不可替代的作用,對培養(yǎng)理工科大學(xué)生的創(chuàng)造性是不可缺少的。雖然目前大多數(shù)課程都設(shè)置了實踐環(huán)節(jié),但也普遍存在著很多問題,[8]例如,實驗課成績占課程成績比例小,學(xué)生對實驗的重視度不夠,存在著抄襲他人實驗結(jié)果和報告的現(xiàn)象;實驗?zāi)J絾我唬瑢嶒瀮?nèi)容陳舊、呆板,多為驗證性實驗,缺乏創(chuàng)新性和挑戰(zhàn)性,學(xué)生完全處于被動狀態(tài),最終導(dǎo)致實驗不認(rèn)真,敷衍了事,所學(xué)的知識和操作技術(shù)遺忘快;不能保證每個學(xué)生都有充分的時間和機(jī)會做實驗,個別學(xué)生逐漸養(yǎng)成依賴心理,最終只有一部分學(xué)生得到了鍛煉;理論課與實驗課教學(xué)老師分離,造成理論和實踐環(huán)節(jié)脫節(jié)等。
針對目前“數(shù)字圖像處理”課程實驗的現(xiàn)狀,根據(jù)視覺測量像面特征點定位需求,開設(shè)相關(guān)開放性實驗項目“視覺測量特征點提取定位實驗”,實驗要求學(xué)生結(jié)合數(shù)字圖像處理課程知識理論,對視覺測量采集的數(shù)字圖像進(jìn)行處理,提取相關(guān)特征點。針對視覺測量中常用的特征點(圓形、方形)進(jìn)行自動檢測,并實現(xiàn)高精度定位,主要實驗內(nèi)容包括:圖像預(yù)處理、特征點粗定位、特征點精定位、算法設(shè)計與實現(xiàn)、實驗結(jié)果分析等。
教師在開放性實驗項目中承擔(dān)的角色主要是方案設(shè)計和實施過程中的指導(dǎo)、監(jiān)督,對方案的具體實現(xiàn)方法不做限制性要求,主要由學(xué)生結(jié)合課堂教學(xué)內(nèi)容以及查閱文獻(xiàn)資料來設(shè)計并完成。為了提高項目完成的效率,教師可以通過適當(dāng)?shù)囊龑?dǎo)為學(xué)生指出主要方向。
對于單個學(xué)生來說,這樣的實驗項目有些困難,“團(tuán)隊合作”也是新時期對科技人才素質(zhì)的要求,所以可以通過建立項目小組的方式開展實驗。小組成員將實驗內(nèi)容進(jìn)行分工,每人負(fù)責(zé)不同的部分,通過相互合作、幫助,完成整個實驗項目。通過這種形式,也在某種程度上鍛煉了學(xué)生的團(tuán)隊合作意識和合作方法。
五、結(jié)束語
通過將視覺測量領(lǐng)域研究成果引入“數(shù)字圖像處理”課程,并在教學(xué)方法、教學(xué)手段、教學(xué)內(nèi)容、開放性實踐等方面的改革和嘗試,逐步做到科學(xué)研究成果與課堂理論教學(xué)的有機(jī)結(jié)合,不僅豐富了課程的教學(xué)內(nèi)容,提高了學(xué)生的學(xué)習(xí)興趣,加深了對理論知識的理解,而且使學(xué)生接觸到科學(xué)研究的前沿領(lǐng)域,開拓了視野,對創(chuàng)新能力的培養(yǎng)鍛煉等方面也具有重要意義。
參考文獻(xiàn)
1 E.M. Mikhail, J.S. Bethel. Introduction to Modern Photogramme
-try[M]. New York: John Wiley & Sons,2001
2 胡安文、季錚、盛慶紅.基于近景數(shù)字視覺測量的飛機(jī)表面模型重建[J].地理空間信息,2004(6):23~25
3 Nicola D’Apuzzo. Overview of 3D surface digitization technologi-es in Europe[C]. Three-Dimensional Image Capture and Applications VI, Proc. of SPIE-IS&T Electronic Imaging, San Jose (CA),2006
4 劉常杰、邾繼貴、葉聲華.汽車白車身機(jī)器視覺檢測系統(tǒng)[J].汽車工程,2000(6):373~376
5 彭三城、孫星明、劉國華.三維人體自動測量技術(shù)綜述[J].計算機(jī)應(yīng)用研究,2005(4):1~5
【中圖分類號】TP391.41【文獻(xiàn)標(biāo)識碼】A【文章編號】1672-5158(2013)02-0129-02
1.數(shù)字圖像處理技術(shù)的內(nèi)容及特點
1.1 研究內(nèi)容
不管應(yīng)用到哪個領(lǐng)域的圖像處理圖像數(shù)據(jù)都要輸入、加工和輸出圖像,其研究內(nèi)容:
(1)獲取、表示和表現(xiàn)圖像――把圖像信號轉(zhuǎn)化為計算機(jī)可以識別的形式,并把數(shù)字圖像顯示和表現(xiàn)出來。
(2)圖像復(fù)原――已知圖像發(fā)生退化的緣由時,對圖像進(jìn)行修復(fù),關(guān)鍵是建立退化模型。復(fù)原是以模型和數(shù)據(jù)的圖像恢復(fù)為基礎(chǔ),消除退化的影響。
(3)圖像增強(qiáng)――對圖像質(zhì)量的常規(guī)改善。當(dāng)不知道圖像退化原因時,還可用此技術(shù)比較主觀的改善圖像。
(4)圖像分割――人類視覺系統(tǒng)可以輕松地將觀察到的對象區(qū)分開來,但計算機(jī)卻很難。分割的基本問題目前是將各種方法融合使用,以此提高處理的質(zhì)量。
(5)圖像分析――檢測和測量圖像中的目標(biāo),獲取其客觀信息,是從圖像到數(shù)據(jù)的過程。
(6)圖像重建――指從數(shù)據(jù)到圖像的處理。
(7)圖像壓縮編碼――為減少數(shù)據(jù)容量、降低數(shù)據(jù)率、壓縮信息量,在不影響其效果的前提下減少圖像的數(shù)據(jù)量。
1.2 數(shù)字圖像處理技術(shù)的特點
(1)圖像再現(xiàn)性好――不會因為對圖像的變換操作而影響到圖像質(zhì)量;
(2)圖像處理精度高――可以將圖像數(shù)字處理為任意大小的數(shù)組;
(3)適用面寬――來自不同信息源的圖像被變換為數(shù)字編碼形式后,都可以用數(shù)組來體現(xiàn)灰度圖像。
(4)靈活性高――圖像處理可完成線性及非線性處理。
2.應(yīng)用領(lǐng)域
數(shù)字圖像處理技術(shù)被應(yīng)用到越來越多的領(lǐng)域中,如醫(yī)療保健、航空航天、交通通信、軍事、工業(yè)、農(nóng)業(yè)、林業(yè)等。下面選取幾方面進(jìn)行分析:
(1)試聽資料證據(jù)――視聽資料證據(jù)是重要的訴訟證據(jù),在司法訴訟活動中發(fā)揮著越來越重要的作用,數(shù)字圖像處理技術(shù)是視聽資料證據(jù)中圖像證據(jù)資料技術(shù)性司法鑒定的常用手段,是圖片原始性、真?zhèn)涡浴⑾嚓P(guān)性認(rèn)定的基本方法,如名捕監(jiān)控錄像模糊圖像處理系統(tǒng),該系統(tǒng)是手印、足跡、槍彈痕跡、工具痕跡、印章檢驗、文件檢驗以及錄像帶處理等痕檢、文檢、視頻圖像處理工作的必備工具;以及實時視頻降噪儀,能夠?qū)崟r處理現(xiàn)場錄像流,增強(qiáng)視頻的清晰度,該在錄像安全系統(tǒng)中加強(qiáng)監(jiān)視錄像的清晰度,或者在警方實地調(diào)查拍攝錄像后回到警署再進(jìn)行降噪。
(2)電子商務(wù)――當(dāng)前的電子商務(wù)中,圖像處理技術(shù)也大有可為,如身份認(rèn)證、產(chǎn)品防偽和水印技術(shù)等。
(3)軍事公安領(lǐng)域――軍事的目標(biāo)是偵察、制導(dǎo)和警戒系統(tǒng)和自動滅火器的控制及反偽裝;公安部門的現(xiàn)場照片、指紋、手跡、印章和人像等的處理和辨識;歷史文字和圖片檔案的修復(fù)和管理等。而數(shù)字圖像處理技術(shù)將數(shù)碼攝影和圖像處理技術(shù)結(jié)合起來以其獨特的優(yōu)勢在公安領(lǐng)域中逐步開始擔(dān)當(dāng)重任,在刑事攝影、檔案管理、痕跡檢驗、文件檢驗、法醫(yī)、物證提取以及公安教學(xué)或宣傳中發(fā)揮著巨大作用,為廣大的公安人員開闊了視野、拓展了思維空間,為執(zhí)法的公正性提供了有力保證,應(yīng)用提高了工作效率,減少了人、財、物的消耗,大大提高了工作效率。
(4)智能交通――圖像處理具有算法柔性大、適應(yīng)能力強(qiáng)等特點,在智能交通系統(tǒng)中取得了廣泛的應(yīng)用價值,例如車牌識別(車牌定位、車牌傾抖校正與字符分割、車牌字符識別變換等)和車輛檢測與跟蹤系統(tǒng)(包括感興趣區(qū)域提取、車輛檢測、車輛跟蹤等),智能車輛導(dǎo)航、車型識別、交通控制等。
(5)航空航天通信――包括圖像傳輸、電視電話和視會議等,主要是進(jìn)行圖像壓縮甚至理解基礎(chǔ)上的壓縮。
(6)遙感技術(shù)――航空航天和衛(wèi)星搖撼圖像獲取中和獲取后都要用圖像處理技術(shù)進(jìn)行加工處理,提取出有利用價值的信息。主要用來對地形地質(zhì)、礦藏資源搜索以及農(nóng)業(yè)、水利、森林和海洋等資源調(diào)查研究,對自然災(zāi)害進(jìn)行預(yù)測預(yù)報、檢測環(huán)境污染、處理氣象衛(wèi)星云圖以及識別地面軍事目標(biāo)。
(7)生物醫(yī)學(xué)領(lǐng)域――圖像處理在醫(yī)學(xué)界的應(yīng)用非常廣泛,圖像處理首先應(yīng)用于細(xì)胞分類、染色體分類和放射圖像等,臨床診斷和病理研究中都大量接住了圖像處理技術(shù)。它的直觀、安全方便、無創(chuàng)傷的優(yōu)點受到醫(yī)生和患者的青睞。
(8)工業(yè)生產(chǎn)中的應(yīng)用――在生產(chǎn)線中對產(chǎn)品及部件進(jìn)行無損檢測
(9)機(jī)器人視覺――機(jī)器視覺相當(dāng)于智能機(jī)器人的重要感覺器官,可以對三維景物進(jìn)行理解,醫(yī)院、工廠、郵政以及家庭中的智能機(jī)器人,識別和定位裝配線工件,太空機(jī)器人的自動操作。
(10)視頻及多媒體系統(tǒng)――目前,電視制作系統(tǒng)中廣泛使用圖像處理、變換和合成技術(shù),使電視效果更佳。在多煤體系統(tǒng)中廣泛使用靜止圖像和動態(tài)圖像的采集、處理、存儲、傳輸和壓縮,以達(dá)到使用者的目的。
(11)科學(xué)可視化――圖像處理和計算機(jī)圖形學(xué)的緊密結(jié)合,使科學(xué)研究得各個領(lǐng)域有了更為新穎的研究工具。
(12)宇宙探測――由于探索太空的需要和太空技術(shù)的快速發(fā)展,需要用數(shù)字處理技術(shù)來處理從外太空獲取的大量星體照片。
(13)地質(zhì)勘探――近年來發(fā)展起來的以數(shù)字圖像處理技術(shù)為基礎(chǔ)、綜合多門學(xué)科知識的地學(xué)信息處理新技術(shù)的多源地學(xué)信息綜合圖像處理,使用一些特定的圖像處理方法,實現(xiàn)了多源地學(xué)信息綜合圖像處理,用來輔助地質(zhì)填圖,構(gòu)造地質(zhì)研究,進(jìn)行寸產(chǎn)資源的預(yù)測和評估,成為當(dāng)前地質(zhì)工作者正在研究和探討的一個問題。
由圖像處理技術(shù)在以上幾個領(lǐng)域中的應(yīng)用可以看出,圖像處理技術(shù)在各領(lǐng)域中的重要程度:計算機(jī)圖像生成技術(shù)在航空航海中可以充當(dāng)仿真訓(xùn)練系統(tǒng),還可以應(yīng)用到廣告和動畫制作,跟友人將其應(yīng)用到網(wǎng)游中;圖像傳輸與通信還可在多媒體教學(xué)、網(wǎng)絡(luò)視頻領(lǐng)域得到廣泛應(yīng)用;在醫(yī)學(xué)上,醫(yī)學(xué)圖像處理和材料分析也日益重要,如超聲成像、X光成像、Y光成像以及核磁共振成像,對醫(yī)生工作產(chǎn)生了巨大的輔助;圖像跟蹤和光學(xué)制導(dǎo)在戰(zhàn)略技術(shù)武器中發(fā)揮了重要作用。
3.發(fā)展方向
隨著計算機(jī)的發(fā)展,圖像處理技術(shù)將越來越成熟,對各領(lǐng)域的影響也越來越大,總的來說,圖像處理技術(shù)的發(fā)展有以下幾個趨勢:
(1) 在目前的基礎(chǔ)上,圖像處理速度越來越快,分辨率越來越高,多媒體應(yīng)用光來月廣泛,標(biāo)準(zhǔn)化、立體化程度越來越高,并產(chǎn)生智能化的趨勢;
(2) 在目前二維基礎(chǔ)上將出現(xiàn)多維成像的趨勢;
(3) 芯片廣泛運(yùn)用到圖像處理技術(shù)中,使用起來更加方便;
(4) 將出現(xiàn)新的算法與理論。
圖像處理技術(shù)在各個領(lǐng)域的應(yīng)用與發(fā)展,大大降低了相應(yīng)領(lǐng)域的工作難度,效率更高,質(zhì)量也無可挑剔,使人類受益匪淺。日后圖像處理技術(shù)將進(jìn)一步根據(jù)人類需求,在相關(guān)科研人員的努力奮斗下而實現(xiàn)新的突破,在更為廣闊的領(lǐng)域造福人類事業(yè)。
參考文獻(xiàn)
[1] 李紅俊,韓冀皖.數(shù)字圖像處理技術(shù)及其應(yīng)用. 計算機(jī)測量與控制,2009.
[2]W.K.Pratt.DIGITAL IMAGE PROCESSING.Johnwiley & Sons,inc, 2008.
[3]楊枝靈,王開.Visual C++數(shù)字圖像獲取、處理及實踐應(yīng)用.人民郵電出版社,2003
中圖分類號:TP312 文獻(xiàn)標(biāo)識碼:A
1 數(shù)字圖像技術(shù)概述
數(shù)字圖像處理工具箱函數(shù)包括以下15類:(1)圖像顯示函數(shù);(2)圖像文件輸入、輸出函數(shù);(3)圖像幾何操作函數(shù);(4)圖像像素值及統(tǒng)計函數(shù);(5)圖像分析函數(shù);(6)圖像增強(qiáng)函數(shù);(7)線性濾波函數(shù);(8)二維線性濾波器設(shè)計函數(shù);(9)圖像變換函數(shù);(10)圖像鄰域及塊操作函數(shù);(11)二值圖像操作函數(shù);(12)基于區(qū)域的圖像處理函數(shù);(13)顏色圖操作函數(shù);(14)顏色空間轉(zhuǎn)換函數(shù);(15)圖像類型和類型轉(zhuǎn)換函數(shù)。
MATLAB圖像處理工具箱支持四種圖像類型,分別為真彩色圖像、索引色圖像、灰度圖像、二值圖像,由于有的函數(shù)對圖像類型有限制,這四種類型可以用工具箱的類型轉(zhuǎn)換函數(shù)相互轉(zhuǎn)換。MATLAB可操作的圖像文件包括JPG、HDF、JPEG、PCX、TIFF、XWD等格式。下面就圖像處理的基本過程討論工具箱所實現(xiàn)的常用功能。
圖像的讀寫與顯示操作:用imread( )讀取圖像,imwrite( )輸出圖像,把圖像顯示于屏幕有imshow( ),image( )等函數(shù)。imcrop()對圖像進(jìn)行裁剪,圖像的插值縮放可用imresize( )函數(shù)實現(xiàn),旋轉(zhuǎn)用imrotate( )實現(xiàn)。
圖像增強(qiáng)是數(shù)字圖像處理過程中常用的一種方法,目的是采用一系列技術(shù)去改善圖像的視覺效果或?qū)D像轉(zhuǎn)換成一種更適合于人眼觀察和機(jī)器自動分析的形式。
2 MATLAB圖像處理工具箱運(yùn)用實例
為了證明MATLAB語言是一種簡潔,可讀性較強(qiáng)的高效率編程軟件,本文通過運(yùn)用圖像處理工具箱中的有關(guān)函數(shù)對一實拍的芯片圖像進(jìn)行處理。如圖1,圖“Fig.jpg”為一幅原圖像,該圖像右邊的剪切圖像為從“Fig.jpg”中剪切出的將用于分析的子圖像塊。為了便于分析與觀察,把子圖像塊旋轉(zhuǎn)90度置于水平位置并把該圖存在名為“Fig1.jpg”的圖像文件中。以上的過程可用以下代碼實現(xiàn)。
x=imread('E:\study\電子與通信\Term 2\數(shù)字圖像處理DIP\Fig.jpg');
figure,imshow(x);
y=imcrop(x);
figure,imshow(y,[]);
z=imrotate(y,90);
imwrite(z,'E:\study\電子與通信\Term 2\數(shù)字圖像處理DIP\Fig1.jpg','jpg');
isrgb(z)
原圖Fig.jpg 剪貼圖Fig1.jpg
圖1
經(jīng)判斷得知該圖像為一真彩色圖像,首先把它轉(zhuǎn)換為灰度圖像,以下所有的進(jìn)一步處理均采用經(jīng)過灰度化處理后的圖像作為原圖。
通過比較灰度原圖和經(jīng)均衡化后的圖形可見圖像變得清晰,均衡化后的直方圖形狀比原直方圖的形狀更理想。效果比較見圖2,程序代碼如下:
x=imread('E:\study\電子與通信\Term 2\數(shù)字圖像處理DIP\Fig1.jpg');
y=rgb2gray(x);
subplot(221),imshow(y);title('Fig1.jpg 灰度化圖像');
subplot(222),imhist(y);title('均衡化前直方圖');
I=histeq(y);
subplot(223),imshow(I);title('均衡化后圖像');
subplot(224),imhist(I);title('均衡化后直方圖');
圖2
3 結(jié)論
以上圖像處理實例只是對MATLAB圖像工具箱的一小部分進(jìn)行運(yùn)用,經(jīng)過更進(jìn)一步的圖像分割、二值化、歸一化等處理,可以把芯片中的字符特征提取出來送入神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行識別,我們應(yīng)用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱對字符分類進(jìn)行模擬仿真也取得了較好的效果。由此可以看出MATLAB語言簡潔,可讀性強(qiáng),工具箱涉及的專業(yè)領(lǐng)域廣泛且功能強(qiáng)大。圖像工具箱幾乎包括所有經(jīng)典的圖像處理方法。由于工具箱具有可靠性和開放性,我們可以方便地直接加以使用,也可以把自己的代碼加到工具箱中以改進(jìn)函數(shù)功能,同時,MATLAB中的小波工具箱也有許多函數(shù)可運(yùn)用于圖像處理技術(shù)。因此,在圖像處理技術(shù)中使用MATLAB語言可以快速實現(xiàn)模擬仿真,大大提高實驗效率, 如果要開發(fā)實用程序,MATLAB語言還可以通過MEX動態(tài)連接庫實現(xiàn)與C語言的混合編程,為工程應(yīng)用提供了更多的便利條件。
參考文獻(xiàn)
摘要:為了預(yù)防礦井下電機(jī)車撞人事故的發(fā)生,提出了一種基于數(shù)字圖像處理技術(shù)的軌道行人識別算法,首先對圖像進(jìn)行尺度變換,裁剪,中值濾波,維納濾波,垂直邊緣檢測,二值化,密度模板匹配,閾值分割,連通域篩選和軌道擬合,識別出軌道,然后用行人和非行人樣本對支持向量機(jī)的參數(shù)進(jìn)行訓(xùn)練,最后運(yùn)用支持向量機(jī)對軌道上的行人進(jìn)行識別。運(yùn)用該算法,對現(xiàn)場采集到的圖片進(jìn)行Matlab仿真實驗,實驗結(jié)果表明該算法能很好的識別出軌道上的行人,做到提前報警。
關(guān)鍵詞 :電機(jī)車;數(shù)字圖像處理;軌道檢測;行人識別;報警
中圖分類號:TD7文獻(xiàn)標(biāo)志碼:A文章編號:1000-8772(2014)19-0202-01
1 引言
礦用電機(jī)車多年來一直作為礦井下的主要運(yùn)輸設(shè)備,由于礦井下情況復(fù)雜,機(jī)車運(yùn)行頻繁,可能會發(fā)生電機(jī)車撞人事故,因此急需要一種監(jiān)測報警系統(tǒng),對行人進(jìn)行識別報警。
目前運(yùn)用在車輛上的檢測障礙物方法主要有:超聲波檢測、毫米波雷達(dá)檢測、紅外線檢測、激光檢測和攝像頭檢測等,在運(yùn)動的電機(jī)車上,攝像頭檢測更具優(yōu)勢,攝像頭檢測即圖像識別[1,2]。行人檢測被廣泛用于行人流量統(tǒng)計、智能車輛輔助駕駛、智能交通、防盜報警,行人報警等方面,具有廣大的應(yīng)用前景[3]。行人檢測即從圖像或視頻中識別出行人,主要有兩步:特征提取和分類定位,行人的特征包括HOG特征,紋理特征,SIFT特征等;行人檢測的方法有:基于運(yùn)動的方法、基于形狀的方法、基于模板匹配的方法和基于統(tǒng)計分類的方法等[3,4]。
將現(xiàn)有的行人識別算法用于礦井下軌道上的行人識別,具有豐富的理論依據(jù)和廣大的應(yīng)用前景,可降低礦下機(jī)車撞人事故的發(fā)生。本文行人檢測的思想是:先識別軌道,再識別軌道上的行人。
2 MATLAB仿真
設(shè)原圖像的尺寸為:M×N M,N都為偶數(shù),則下采樣后圖像的尺寸為:M/2×N/2。在下采樣后圖像中裁剪的區(qū)域為x坐標(biāo):x1x2,y坐標(biāo):y1y2。中值濾波的尺寸為3×3,維納濾波的尺寸為5×5,垂直邊緣檢測算子為:。 密度匹配模板尺寸為3×3。垂直邊緣檢測出的圖像和密度圖像的二值化閾值都采用Otsu方法求得。檢測窗口的大小為,塊的大小為64×128,塊的重疊率為,一個塊內(nèi)的單元數(shù)為4,單元的大小為8×8,在[-π/2,π/2]將梯度方向均勻的劃分成9個區(qū)間[5-9]。圖1中白色矩形區(qū)域為經(jīng)支持向量機(jī)識別出的行人。
3、結(jié)論
一種基于數(shù)字圖像處理技術(shù)的軌道行人識別算法能識別出軌道和行人,做到提前報警,本文僅從算法上實現(xiàn),還需結(jié)合硬件,才能將該算法用到實處,在現(xiàn)實環(huán)境中,該算法的性能也有待檢驗。該行人識別算法可進(jìn)一步推廣,用到現(xiàn)實中各種場合的行人識別。
參考文獻(xiàn):
[1] 王榮本,趙一兵,李琳輝等.智能車輛的障礙物檢測研究方法綜述[J].公路交通科技,2007,11:109-113+124.
[2] 賈慧星,章毓晉.車輛輔助駕駛系統(tǒng)中基于計算機(jī)視覺的行人檢測研究綜述[J].自動化學(xué)報,2007,01:84-90.
[3] 王興寶.復(fù)雜場景下多姿態(tài)行人檢測與識別方法研究[D].蘇州大學(xué),2012.
[4] 蘇松志,李紹滋,陳淑媛,蔡國榕,吳云東.行人檢測技術(shù)綜述[J].電子學(xué)報,2012,04:814-820.
[5] 范昕煒.支持向量機(jī)算法的研究及其應(yīng)用[D].浙江大學(xué),2003.
[6] 方莉,張萍.經(jīng)典圖像去噪算法研究綜述[J].工業(yè)控制計算機(jī),2010,11:73-74
[7] 陳剛.基于多特征的行人檢測方法研究[D].吉林大學(xué),2012.
中圖分類號:TP3 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2014)02-0120-02
Abstract:DSP hardware based license plate recognition system characteristics, analyzes plate region improved positioning algorithm, character segmentation algorithm to improve the efficiency of the license plate recognition.
Key Words:license plate identification;DSP;algorrithm
1 引言
據(jù)公安部相關(guān)數(shù)據(jù)統(tǒng)計,現(xiàn)如今我國汽車保有量已達(dá)2.4億輛,且每年的增長率都在15%以上,應(yīng)用智能交通系統(tǒng)來解決隨之產(chǎn)生的交通問題已是大勢所趨。基于DSP的車牌識別方法是智能化車牌識別的有效方法。現(xiàn)如今,自動車牌識別技術(shù)已被廣泛應(yīng)用,但由于算法的復(fù)雜性與效率的矛盾,及算法于系統(tǒng)上的應(yīng)用的困難性,對車牌識別的關(guān)鍵算法還有待于更深入的研究。
2 硬件系統(tǒng)結(jié)構(gòu)
通用可編程的DSP芯片的硬件技術(shù)的發(fā)展給數(shù)字圖像處理帶來了飛躍性的進(jìn)步。要實現(xiàn)車牌識別,需要數(shù)字圖像處理技術(shù)中的很多復(fù)雜的算法,基于DSP的車牌識別系統(tǒng)也因此得到了廣泛的研究與應(yīng)用。為了提高整個系統(tǒng)的可操作性及性價比,當(dāng)前應(yīng)用最多的是分布式的處理模式,即聯(lián)合PC機(jī)與DSP的優(yōu)勢共同完成車牌識別系統(tǒng),其總體結(jié)構(gòu)及具體結(jié)構(gòu)如(圖1)所示:
3 車牌識別關(guān)鍵算法
算法流程為圖像預(yù)處理、車牌定位、車牌分割,最后字符識別。圖像預(yù)處理為提高攝像機(jī)攝取的圖像質(zhì)量,便于后續(xù)處理。利用DSP技術(shù)在處理車牌識別關(guān)鍵算法中的車牌的定位與字符分割方面優(yōu)勢顯著。
3.1 車牌定位
基于灰度圖像的定位技術(shù)日趨成熟,但彩色圖像包含了圖像的更多信息特征,加之車牌的底色是有規(guī)律可循的,所以基于彩色圖像的定位技術(shù)越來越成為在發(fā)展定位技術(shù)上的突破點。本文定位的思路為:
(1)圖像從RGB空間轉(zhuǎn)換到HSI空間,其算法為(以藍(lán)底白色車牌為例):
(3)對二值圖像進(jìn)行水平投影[1],從車牌固有的矩形特征中的高度特征提取車牌圖像,如圖3所示。再使用特征顏色邊緣檢測法,檢測車牌正確位置,如圖4所示。
(4)根據(jù)車牌固有的矩形特征中的寬度特征,使用垂直投影法提取車牌圖像,如(圖5)所示:
3.2 字符分割
字符分割是字符識別的關(guān)鍵前提。在2013年新交通法規(guī)中規(guī)定,對故意遮擋、污損、不安規(guī)定安裝車牌的扣12分的處罰,這項規(guī)定的出臺,也間接降低了算法的復(fù)雜性。本文采用車牌字符間隔的特征在垂直投影中的規(guī)律來進(jìn)行字符分割。
其算法原理為:
(1)設(shè)垂直投影值為T,閾值為V,在確定前還要充分考慮字符粘連、斷裂及“1”字符的特殊性。當(dāng)時,T=0。
(2)設(shè)數(shù)組為從左向右掃描的投影值,當(dāng)掃描的數(shù)組的值時,字符的寬度設(shè)為。根據(jù)規(guī)律[2],單個字符的寬度約為45mm,除第2、3字符的間隔為34mm,其它字符的間隔均為12mm。由此,得出以下3中情況:
(1)時,為字符粘連,取為單個字符的寬度;
(2)且后面的字符也如此時,為字符斷裂,合并這兩個字符;
(3)且不滿足字符斷裂,此字符為數(shù)字“1”。
實驗結(jié)果如(圖6)所示:
4 結(jié)語
本文在以DSP處理器TMS320DM6437嵌入式系統(tǒng)上對以上兩大關(guān)鍵算法進(jìn)行實驗研究,在150張不同類型的車牌進(jìn)行識別后,測試結(jié)果的正確率92.3%,且處理的速度達(dá)到實時處理的需求。為以后在智能交通控制系統(tǒng)中的車牌識別技術(shù)的提高和發(fā)展提供了參考基礎(chǔ)。
參考文獻(xiàn)
中圖分類號:TP212 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-3973(2012)011-059-02
1 引言
電網(wǎng)GIS平臺是提供電網(wǎng)圖形和分析服務(wù)的企業(yè)級電網(wǎng)空間信息服務(wù)平臺,該平臺建設(shè)主要工作就是基礎(chǔ)地理數(shù)據(jù)及電力設(shè)施坐標(biāo)數(shù)據(jù)采集。在將原始影像信息如矢量地圖、航空航天影像、數(shù)字高程模型、導(dǎo)航數(shù)據(jù)等應(yīng)用在GIS平臺用于分析、決策、管理之前,對原始數(shù)據(jù)的處理展現(xiàn)必不可少。
對圖像進(jìn)行一系列的操作,以達(dá)到預(yù)期的目的的技術(shù)稱作圖像處理技術(shù)。公共設(shè)施、發(fā)電、輸電、變電、配電等方面都對數(shù)據(jù)有不同精度的采集要求,在像源一定的情況下,對已采集到的數(shù)據(jù)使用圖像處理技術(shù)進(jìn)行二次加工,以滿足不同程度的應(yīng)用需求也是目前亟待研究的課題之一。
2 圖像處理基本技術(shù)
數(shù)字圖像處理的研究源于兩個領(lǐng)域:其一是為了便于人們分析圖像信息進(jìn)行改進(jìn);其二是為使機(jī)器自動理解而對圖像數(shù)據(jù)進(jìn)行存儲、傳輸及顯示。
由于電網(wǎng)GIS影響多來源于衛(wèi)星影像,而衛(wèi)星傳感器系統(tǒng)所采集的圖像受到所在平臺、太陽位置及角度、外界天氣條件、飛行器位置姿態(tài)等等條件的制約和影響,會表現(xiàn)出一定程度的模糊、失真、扭曲變形、斑點噪聲等等現(xiàn)象,在一定程度上降低了圖像的質(zhì)量,這就使得這些原始圖像數(shù)據(jù)并不能直接被用于電網(wǎng)分析、決策,圖像處理技術(shù)的應(yīng)用必不可少。
2.1 圖像幾何校正
遙感圖像幾何校正是針對圖像幾何畸變而展開的誤差校正。遙感圖像的幾何畸變表現(xiàn)為像元相對于地面目標(biāo)實際位置發(fā)生擠壓、扭曲、變形等。其基本環(huán)節(jié)有兩個,即像素坐標(biāo)變換和重采樣。一般步驟如圖1所示。
2.2 圖像重采樣
圖像重采樣的目的主要是保證圖像像素的連續(xù)性,因為對遙感圖像空間分辨率進(jìn)行提升時,需要利用插值的手段在空出的像素上補(bǔ)上對應(yīng)的值,使整個圖像平滑,有利于進(jìn)一步處理。其最基本方法有三種:最近鄰插值、雙線性插值和雙三次插值。
2.3 圖像增強(qiáng)
圖像增強(qiáng)就是采用一定的方法對圖像的某些特征進(jìn)行調(diào)整,以突出圖像中的某些感興趣信息,同時抑制或去除不需要的信息來提高圖像質(zhì)量。它的主要目的是改變圖像的灰度等級,提高對比度;消除邊緣噪聲,平滑圖像;突出邊緣及圖像主要信息,銳化圖像、壓縮數(shù)據(jù)量等。
圖像增強(qiáng)主要方法根據(jù)處理空間的不同,分為空間域方法和頻率域方法兩大類。空間域增強(qiáng)主要是通過改變像元及相鄰像元的灰度值達(dá)到增強(qiáng)的目的。而頻率域增強(qiáng)則是通過對圖像進(jìn)行傅里葉變換后改變頻域圖像的頻譜來達(dá)到圖像增強(qiáng)的目的。此外,根據(jù)圖像處理的范圍又可以將增強(qiáng)處理技術(shù)分為全局(整幅圖像)處理和局部(部分圖像)處理兩種。
2.4 圖像融合
圖像融合也是信息融合的一種,它把針對同一目標(biāo)或場景的由相同或不同傳感器、相同或不同成像方式、同時相或不同時相獲得的多個圖像,通過一定的融合規(guī)則取長補(bǔ)短變成一幅能反映多重原始圖像信息的、能對目標(biāo)或場景做綜合描述的融合圖像,以便于進(jìn)一步處理。
高效的圖像融合方法可以根據(jù)需要綜合處理多源通道的信息,從而有效地提高了圖像信息的利用率、系統(tǒng)對目標(biāo)探測識別地可靠性及系統(tǒng)的自動化程度。其目的是將單一傳感器的多波段信息或不同類傳感器所提供的信息加以綜合,消除多傳感器信息之間可能存在的冗余和矛盾,以增強(qiáng)影像中信息透明度,改善解譯的精度、可靠性以及使用率,以形成對目標(biāo)的清晰、完整、準(zhǔn)確的信息描述。
依據(jù)在融合處理流程中所處的階段,按照信息的抽象程度及目標(biāo)識別層次上,可以將圖像融合分為三個層次,即像素級融合,特征級融合和決策級融合三種。
2.5 圖像裁剪與拼接
圖像裁剪顧名思義就是將圖像中的感興趣區(qū)域提取出來。而圖像拼接技術(shù)則是將數(shù)張有重疊部分的圖像(可能是不同時間、不同視角或者不同傳感器獲得的)拼成一幅大型的無縫高分辨率圖像的技術(shù)。圖像配準(zhǔn)和圖像融合是圖像拼接的兩個關(guān)鍵技術(shù)。
圖像配準(zhǔn)就是對同一景物在不同時間、用不同探測器、從不同視角獲得的圖像,利用圖像中公有的景物,通過比較和匹配找出圖像之間的相對位置關(guān)系。一般而言,圖像配準(zhǔn)方法包括特征空間、搜索策略和相似性推測三個部分。圖像配準(zhǔn)技術(shù)經(jīng)過多年的研究分為三個基本類別:基于灰度信息的方法,基于變換域的方法和基于特征的方法。
圖像配準(zhǔn)是圖像融合的基礎(chǔ),而且圖像配準(zhǔn)算法的計算量一般非常大,因此圖像拼接技術(shù)的發(fā)展很大程度上取決于圖像配準(zhǔn)技術(shù)的創(chuàng)新。
2.6 圖像壓縮與編碼
圖像的壓縮與編碼所解決的問題是盡量減少表示數(shù)字圖像時所需要的數(shù)據(jù)量。減少數(shù)據(jù)量的基本原理是出去其中多余的數(shù)據(jù),以數(shù)學(xué)的觀點來看,這一過程實際上就是將二維像素陣列名變換為一個在統(tǒng)計上無關(guān)聯(lián)的數(shù)據(jù)結(jié)合,這種變換在圖像存儲或傳輸之前進(jìn)行。經(jīng)典壓縮編碼方法有:哈夫曼編碼,算術(shù)編碼,游程編碼、變換編碼等。
3 GIS平臺與圖像處理
GIS是近些年迅速發(fā)展起來的一門空間信息分析技術(shù),它是一個綜合的學(xué)科產(chǎn)物,隨著計算機(jī)科學(xué)、地理學(xué)、數(shù)學(xué)、測繪等學(xué)科的發(fā)展而飛速發(fā)展。GIS不僅可以有效地管理具有空間屬性的各種資源環(huán)境信息,對資源環(huán)境管理和實踐模式進(jìn)行快速和重復(fù)的分析測試,便于制定決策、進(jìn)行科學(xué)和政策的標(biāo)準(zhǔn)評價,而且可以有效地對多時期的資源環(huán)境狀況及生產(chǎn)活動變化進(jìn)行動態(tài)監(jiān)測和分析比較,也可將數(shù)據(jù)收集、空間分析和決策過程綜合為一個共同的信息流,明顯地提高工作效率和經(jīng)濟(jì)效益,為解決資源環(huán)境問題及保障可持續(xù)發(fā)展提供技術(shù)支持,GIS平臺建設(shè)也是電網(wǎng)建設(shè)的重點項目之一。
數(shù)字圖像處理是GIS平臺的底層操作基礎(chǔ),如GIS中的編輯、查詢、存儲等都是運(yùn)用了數(shù)字圖像處理的理論。GIS圖像的像源多源自遙感影像,圖像處理技術(shù)則貫穿于從遙感影像成像到進(jìn)入決策分析的全過程。在GIS的發(fā)展中也會越來多用到遙感影像處理技術(shù),并且GIS要實現(xiàn)動態(tài)分析需要處理海量數(shù)據(jù),圖像壓縮與編碼技術(shù)則是不可或缺的解決方案。
4 結(jié)語
本文致力于將電網(wǎng)GIS平臺可能會涉及的圖像處理技術(shù)對讀者進(jìn)行簡要說明,讓讀者對其產(chǎn)生感性認(rèn)識。其內(nèi)容包括但不限于上文中所提到的領(lǐng)域,圖像處理技術(shù)的發(fā)展日新月異,且領(lǐng)域也在不斷擴(kuò)展,相信未來會有更多、更先進(jìn)的圖像處理方法會應(yīng)用于電網(wǎng)GIS中,以不斷提高分析決策水平。
參考文獻(xiàn):
[1] 岡薩雷斯.數(shù)字圖像處理[M].北京:電子工業(yè)出版社,2007.
[2] 湯曉春.遙感圖像增強(qiáng)方法的研究及實現(xiàn)[D].華中科技大學(xué),2008.
[3] 廉明.遙感中的幾何校正技術(shù)[D].北京化工大學(xué),2007.
[4] 宋智禮.圖像配準(zhǔn)技術(shù)及其應(yīng)用的研究[D].復(fù)旦大學(xué),2010.
中圖分類號:TM76 文章編號:1009-2374(2016)21-0047-03 DOI:10.13535/ki.11-4406/n.2016.21.023
1 概述
隨著信息技術(shù)的發(fā)展,人類逐漸步入信息化時代。在此過程中所引起的信息革命給許多傳統(tǒng)行業(yè)帶來了巨大的沖擊,信息化時代的四大特點――智能化、電子化、全球化、非群體化成為了許多行業(yè)變革的風(fēng)向標(biāo)。而信息化時代的代表性象征――計算機(jī)在各行各業(yè)中的必要性與日俱增,在電力行業(yè)中也不可避免。
而電力行業(yè)作為關(guān)乎國計民生的傳統(tǒng)行業(yè),在信息化時代中也面臨著如何更高效地利用能源、如何更安全可靠地供電、如何更好地了解用戶需求等諸多方面的新挑戰(zhàn),于是“智能電網(wǎng)”的概念應(yīng)運(yùn)而生。
2 智能電網(wǎng)
2.1 智能電網(wǎng)的概念
智能電網(wǎng)是將信息技術(shù),如通信技術(shù)、傳感技術(shù)、計算機(jī)技術(shù)和控制技術(shù)等融入電力系統(tǒng)之中,使整個電力系統(tǒng)更加安全可控,成為高效智能的新型電網(wǎng)。由于各國的國情不同,因此各個國家對智能電網(wǎng)的具體要求也會有不同的側(cè)重點。因為我國還是一個發(fā)展中國家,與國外發(fā)達(dá)國家的電力工業(yè)已步入成熟期不同,我國在發(fā)展智能電網(wǎng)的同時,還需要加強(qiáng)骨干電網(wǎng)建設(shè)。因此除了要建設(shè)能夠充分滿足用戶對電力的需求和優(yōu)化資源配置,確保電力供應(yīng)的安全性、可靠性和經(jīng)濟(jì)性,滿足環(huán)保約束,保證電能質(zhì)量,適應(yīng)電力市場化發(fā)展的堅強(qiáng)智能電網(wǎng)外,我國的智能電網(wǎng)建設(shè)還需要滿足以特高壓電網(wǎng)為骨干網(wǎng)架,各級電網(wǎng)高度協(xié)調(diào)發(fā)展。
2.2 智能電網(wǎng)的特點
智能電網(wǎng)一般包括有以下七個特點:
2.2.1 能量互聯(lián)網(wǎng):智能電網(wǎng)要求實現(xiàn)供電方和用戶之間的交互,構(gòu)建多向電力流,它主要由能量管理系統(tǒng)和配電管理系統(tǒng)組成。其中能量管理系統(tǒng)提供整個電網(wǎng)的實時狀態(tài)信息,并根據(jù)實時信息選擇最優(yōu)發(fā)電方案,減少輸電損耗,維護(hù)系統(tǒng)可靠性以確保供電穩(wěn)定;配電管理系統(tǒng)提供配電網(wǎng)絡(luò)的實時狀態(tài)信息,允許供電方遠(yuǎn)程控制斷電的隔離與恢復(fù),管理可再生能源發(fā)電。
2.2.2 降低損耗:智能電網(wǎng)能夠基于“能量互聯(lián)網(wǎng)”中的實時信息,根據(jù)用戶的需求來供電,通過電壓控制來降低電力損耗。同時還可以沿輸電線放置傳感器和電容器,通過無功負(fù)載控制來減少電力損耗。減少電力損耗的同時還會降低二氧化碳的排放量,使電網(wǎng)系統(tǒng)更加低碳環(huán)保。
2.2.3 融入可再生能源發(fā)電:目前可再生能源發(fā)電的最大缺點在于可變性過大,產(chǎn)電不穩(wěn)定。智能電網(wǎng)能夠通過儲電技術(shù),在產(chǎn)電過剩時將多余電能存儲起來,在供不應(yīng)求時再通過智能電網(wǎng)的自動化技術(shù)供能,進(jìn)而解決可再生能源產(chǎn)電不穩(wěn)定的問題。
2.2.4 減少輸電阻塞:智能電網(wǎng)能夠檢測輸電線的實時度數(shù),在可能發(fā)生輸電阻塞時,傳感器和控制器會及時地重新安排電力輸送線路,使得電力能夠最大限度地流過線路而不發(fā)生阻塞。
2.2.5 分布式發(fā)電:通過智能電網(wǎng)的雙向電力流,用戶自行通過太陽能、風(fēng)能等可再生能源產(chǎn)生的電力可以出售給供電方,流入配電網(wǎng)絡(luò)中,使電網(wǎng)系統(tǒng)在用電高峰期可以為用戶提供更穩(wěn)定的供電服務(wù)。
2.2.6 自愈:智能電網(wǎng)能夠基于實時測量的概率風(fēng)險評估確定最有可能失敗的設(shè)備、發(fā)電廠和線路,及時進(jìn)行隔離和恢復(fù),從而減少大面積用電故障的出現(xiàn)。同時,智能電網(wǎng)還能實時分析電網(wǎng)的整體健康水平,及時觸發(fā)可能導(dǎo)致電網(wǎng)故障發(fā)展的早期預(yù)警,并根據(jù)具體情況確定是否立即進(jìn)行檢查或采取相應(yīng)措施。
2.2.7 用戶需求管理:智能電網(wǎng)能夠通過智能電表實時通知用戶其電力消費(fèi)成本、實時電價、電網(wǎng)的狀況、計劃停電信息等信息,使用戶可以根據(jù)這些信息制定自己的電力使用方案,繼而通過影響用戶需求來促進(jìn)電力供求平衡。
2.3 智能電網(wǎng)的相關(guān)技術(shù)
智能電網(wǎng)的關(guān)鍵基礎(chǔ)技術(shù)主要包括集成的通信技術(shù)、先進(jìn)的傳感和測量技術(shù)、先進(jìn)的電網(wǎng)設(shè)備技術(shù)、先進(jìn)的控制技術(shù)以及決策支持和可視化技術(shù)。
3 計算機(jī)科學(xué)在智能電網(wǎng)中的應(yīng)用
在電網(wǎng)智能化的過程中,計算機(jī)是必不可少的。而計算機(jī)科學(xué)在智能電網(wǎng)中也有諸多應(yīng)用,其中云計算、數(shù)字圖像處理、數(shù)據(jù)挖掘、人工智能和軟件工程這些計算機(jī)科學(xué)相關(guān)技術(shù)在智能電網(wǎng)中尤為重要。
3.1 云計算
云計算是分布式計算的一種特殊形式,根據(jù)美國國家標(biāo)準(zhǔn)與技術(shù)研究院的定義,云計算可以實現(xiàn)隨時隨地、便捷、按需地從可配置計算資源共享池中獲取所需的資源,資源可以快速供給和釋放,使管理的工作和服務(wù)提供者的介入降低至最少。
云計算技術(shù)能夠整合優(yōu)化電網(wǎng)系統(tǒng)中的各種異構(gòu)資源,如電力系統(tǒng)中的監(jiān)控維護(hù)資源、配電管理資源和市場運(yùn)營資源等。利用云計算支持廣泛企業(yè)計算和普適性強(qiáng)的特點,能夠構(gòu)建更加高效的智能電網(wǎng)數(shù)據(jù)中心,實現(xiàn)基礎(chǔ)設(shè)施資源的自動化管理。例如利用Google的Borg能夠使大量服務(wù)器協(xié)調(diào)工作,繼而實現(xiàn)大規(guī)模系統(tǒng)的可靠性管理。
而智能電網(wǎng)信息系統(tǒng)所產(chǎn)生的大量數(shù)據(jù),更需要通過云計算來實現(xiàn)分布式存儲和管理。利用云計算來實現(xiàn)海量數(shù)據(jù)的分布式存儲,可以通過冗余存儲和高可靠性軟件來提高數(shù)據(jù)的可靠性,并能較好地達(dá)到成本、可靠性和性能的最佳平衡。例如利用Google的GFS文件系統(tǒng)可以實現(xiàn)數(shù)據(jù)的冗余存儲,并大幅度降低主服務(wù)器的負(fù)擔(dān),使系統(tǒng)IO高度并行工作,從而提高系統(tǒng)的整體性能。智能電網(wǎng)所產(chǎn)生的數(shù)據(jù)種類眾多,而云計算的數(shù)據(jù)管理技術(shù)能夠較好地滿足智能電網(wǎng)信息平臺數(shù)據(jù)種類繁多的海量服務(wù)請求,因此云計算能夠高效地管理智能電網(wǎng)信息平臺中的多元數(shù)據(jù)。例如,利用Google的BigTable,通過一個巨大的分布式多維數(shù)據(jù)表,將數(shù)據(jù)都作為對象,并通過關(guān)鍵字、列關(guān)鍵字和時間戳來進(jìn)行索引,滿足各類數(shù)據(jù)的性能要求,進(jìn)而實現(xiàn)多元數(shù)據(jù)的高效管理。
為了保證電網(wǎng)系統(tǒng)運(yùn)行的安全穩(wěn)定,智能電網(wǎng)需要通過大規(guī)模的電力系統(tǒng)計算來監(jiān)控整個電網(wǎng)系統(tǒng)的運(yùn)行狀態(tài),如暫態(tài)穩(wěn)定計算、故障計算、拓?fù)浞治觥?shù)據(jù)挖掘與智能決策等,計算量極大,而云計算可以為智能電網(wǎng)提供高性能的并行計算與分析服務(wù)。例如利用Google的MapRduce,可實現(xiàn)針對大規(guī)模數(shù)據(jù)集的并行計算。
3.2 數(shù)字圖像處理
數(shù)字圖像處理是指通過計算機(jī)對圖像進(jìn)行去噪、增強(qiáng)、復(fù)原、分割以及提取特征等處理,從而改善圖示信息,以便人們解釋或機(jī)器自動理解。
在智能電網(wǎng)系統(tǒng)所產(chǎn)生的海量數(shù)據(jù)中有不少的數(shù)據(jù)都是圖像數(shù)據(jù),例如對輸電線路狀態(tài)的遠(yuǎn)程監(jiān)測常常通過線路圖像/視頻監(jiān)控系統(tǒng)來實現(xiàn)。為了能夠?qū)崿F(xiàn)對輸電線路狀態(tài)全天候全方位的實時監(jiān)控,采用智能化和自動化的手段來代替人工是必然的趨勢。但原始圖像中包含的噪聲太多了,價值密度低,難以用于智能識別。在這種情況下,可以通過數(shù)字圖像處理中的灰度變換、直方圖修正、小波包去噪、圖像銳化以及邊緣檢測等處理方式來增強(qiáng)圖像對比度,去除噪聲,加強(qiáng)圖像的輪廓特征,以便于特征的提取和識別,進(jìn)而產(chǎn)生價值密度較高的特征數(shù)據(jù)集,為輸電線路狀態(tài)的智能識別過程做好圖像數(shù)據(jù)的預(yù)處理。
3.3 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘的方法包括分類、聚類、關(guān)聯(lián)分析、預(yù)測等。
由于智能電網(wǎng)系統(tǒng)中的數(shù)據(jù)具有數(shù)據(jù)量巨大、數(shù)據(jù)類型繁多、價值密度低以及處理速度快的特點,智能電網(wǎng)系統(tǒng)中的數(shù)據(jù)屬于無法在一定時間內(nèi)用傳統(tǒng)數(shù)據(jù)庫軟件工具對其內(nèi)容進(jìn)行抓取、管理和處理的“大數(shù)據(jù)”,需要通過數(shù)據(jù)挖掘來提取其中隱含的有價值的信息,從而實現(xiàn)對整個電網(wǎng)系統(tǒng)多角度、多層次的精確感知。例如,通過對長期的、大量的用戶用電數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,對不同地區(qū)以及不同用戶進(jìn)行分類,可以得到有助于優(yōu)化配電調(diào)度的信息,并能為電費(fèi)定價調(diào)整提供參考;由于在當(dāng)今社會中各行業(yè)的發(fā)展都離不開能源的使用,因此對用電數(shù)據(jù)進(jìn)行挖掘甚至還可以歸納總結(jié)出各種指標(biāo)增長率與社會用電情況的一般規(guī)律,便于政府了解和預(yù)測社會各行業(yè)發(fā)展?fàn)顩r及用能情況,為政府決策提供參考。而通過對長期的、大量的電動汽車充電數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,可以為充電站的布點提供參考。通過對長期的、大量的可再生能源發(fā)電情況進(jìn)行數(shù)據(jù)挖掘,有利于降低可再生能源產(chǎn)電不穩(wěn)定對供電網(wǎng)絡(luò)的影響,進(jìn)而更好地融入可再生能源發(fā)電。此外,數(shù)據(jù)挖掘還有利于用戶能效的分析管理、業(yè)務(wù)拓展分析、供電輿情監(jiān)測預(yù)警分析、電力系統(tǒng)的故障預(yù)測和狀態(tài)檢修、短期電網(wǎng)負(fù)荷預(yù)測、城市電網(wǎng)規(guī)劃等。智能電網(wǎng)系統(tǒng)的數(shù)據(jù)特性表明了數(shù)據(jù)挖掘在智能電網(wǎng)中有著廣泛的應(yīng)用。
3.4 人工智能
根據(jù)著名人工智能科學(xué)家Michael R.Genesereth和Nils J.Nilsson在1987年提出的定義,人工智能是研究智能行為的科學(xué),它的最終目的是建立關(guān)于自然智能實體行為的理論和指導(dǎo)創(chuàng)造具有智能行為的人工制品。人工智能是一門研究如何將人的智能轉(zhuǎn)化為機(jī)器智能或者用機(jī)器來模擬或?qū)崿F(xiàn)人的智能的學(xué)科。
數(shù)據(jù)挖掘在智能電網(wǎng)中有著廣泛的應(yīng)用,而數(shù)據(jù)挖掘需要人工智能技術(shù)來提供數(shù)據(jù)分析的技術(shù)支持,因此人工智能在智能電網(wǎng)中也有著十分重要的應(yīng)用。例如,通過構(gòu)建人工神經(jīng)網(wǎng)絡(luò)來對經(jīng)過數(shù)字圖像處理所得的典型線路狀態(tài)的監(jiān)控圖像特征數(shù)據(jù)集進(jìn)行訓(xùn)練識別來實現(xiàn)輸電線路狀態(tài)的智能識別。除了故障診斷外,人工神經(jīng)網(wǎng)絡(luò)還可應(yīng)用于智能控制、繼電保護(hù)、優(yōu)化運(yùn)算等
方面。
除了為數(shù)據(jù)挖掘提供數(shù)據(jù)分析的技術(shù)支持外,人工智能還可以通過人類專家提供的經(jīng)驗和知識來構(gòu)建相應(yīng)的專家系統(tǒng),如電網(wǎng)故障診斷和調(diào)度處理專家系統(tǒng)和操作票專家系統(tǒng)等,模擬人類專家解決問題的過程來進(jìn)行決策,從而實現(xiàn)電網(wǎng)自動化和智能化。
而采用遺傳算法、粒子群算法等進(jìn)化算法求解諸如發(fā)電廠和輸電線架設(shè)的規(guī)劃問題以及電力系統(tǒng)中各種控制參數(shù)的最優(yōu)解等問題或利用模糊集理論來處理電力系統(tǒng)中難以實現(xiàn)精確控制的復(fù)雜問題,也是人工智能在智能電網(wǎng)中的重要應(yīng)用。
3.5 軟件工程
根據(jù)Fritz Bauer在NATO會議上給出的定義,軟件工程是建立和使用一套合理的工程原則,以便獲得經(jīng)濟(jì)的軟件,這種軟件是可靠的,可以在實際機(jī)器上高效的
運(yùn)行。
為了便于管理和使用,無論是供電管理方還是用戶方都會希望通過一個穩(wěn)定可靠,功能完備,并具有友好人機(jī)界面的軟件來方便操作。因此在建設(shè)智能電網(wǎng)的過程中勢必需要開發(fā)相應(yīng)的軟件,軟件工程便應(yīng)用于其中。尤其是對用戶端而言,在移動設(shè)備使用越來越廣泛的今天,開發(fā)相應(yīng)的移動端的APP無疑能夠更好地促進(jìn)用戶參與到交互過程中。一個針對用戶個體,能夠?qū)崟r顯示如電力消費(fèi)成本、實時電價、電網(wǎng)狀況、計劃停電信息等的智能電表提示信息,結(jié)合數(shù)字家庭技術(shù),能夠遠(yuǎn)程控制家電開關(guān)以便于用戶隨時隨地調(diào)整自己的用電情況,并整合線上業(yè)務(wù)申請、繳納電費(fèi)等功能的APP能夠極大程度地減輕用戶的操作負(fù)擔(dān),方便用戶的使用,使智能電網(wǎng)更加高效智能。
4 結(jié)語
計算機(jī)科學(xué)在智能電網(wǎng)中的廣泛應(yīng)用使電力行業(yè)在信息化時代中能夠更好地應(yīng)對各種新挑戰(zhàn),為整個社會的發(fā)展帶來深遠(yuǎn)的影響。
參考文獻(xiàn)
[1] 肖世杰.構(gòu)建中國智能電網(wǎng)技術(shù)思考[J].電力系統(tǒng)自動化,2009,33(9).
[2] 李乃湖,倪以信,孫舒捷,等.智能電網(wǎng)及其關(guān)鍵技術(shù)綜述[J].南方電網(wǎng)技術(shù),2010,4(3).
[3] 楊德昌,李勇,C.Rehtanz,等.中國式智能電網(wǎng)的構(gòu)成和發(fā)展規(guī)劃研究[J].電網(wǎng)技術(shù),2009,33(20).
[4] 王德文,宋亞奇,朱永利.基于云計算的智能電網(wǎng)信息平臺[J].電力系統(tǒng)自動化,2010,34(22).
[5] 彭小圣,鄧迪元,程時杰,等.面向智能電網(wǎng)應(yīng)用的電力大數(shù)據(jù)關(guān)鍵技術(shù)[J].中國電機(jī)工程學(xué)報,2015,35(3).
[6] 宋亞奇,周國亮,朱永利.智能電網(wǎng)大數(shù)據(jù)處理技術(shù)現(xiàn)狀與挑戰(zhàn)[J].電網(wǎng)技術(shù),2013,37(4).
[7] 張東霞,苗新,劉麗萍,等.智能電網(wǎng)大數(shù)據(jù)技術(shù)發(fā)展研究[J].中國電機(jī)工程學(xué)報,2015,35(1).
[8] 金華,王民,昝濤,等.基于數(shù)字圖像處理的輸電線路狀態(tài)智能識別技術(shù)[J].微計算機(jī)信息,2012,28(4).
[9] 韓禎祥,文福拴,張琦.人工智能在電力系統(tǒng)中的應(yīng)用[J].電力系統(tǒng)自動化,2000,24(2).
1 引言
近年來,人們提出了許多方法用于檢測和跟蹤序列圖像中的運(yùn)動目標(biāo),但是由于受到計算機(jī)速度和算法復(fù)雜度的限制,使得在檢測和跟蹤運(yùn)動目標(biāo)的實時性和魯棒性方面總是不太理想。同時在設(shè)備不斷小型化、集成化、網(wǎng)絡(luò)化的今天,F(xiàn)PGA由于其可編程的特點成為嵌入式開發(fā)的最佳平臺。因此,本設(shè)計核心模塊為Altera公司的Cyclone系列FPGA EP4CGX150DF3117N核心處理器,以提高系統(tǒng)的整體的性能。[1]
2 系統(tǒng)工作流程和原理
系統(tǒng)主要由一體化攝像機(jī)、高速數(shù)字云臺、視頻解碼器SAA7113H、圖像存儲器SRAM,F(xiàn)PGA控制器、以太網(wǎng)模塊、監(jiān)視器、報警模塊等部分構(gòu)成。
該跟蹤系統(tǒng)的工作過程為:系統(tǒng)開機(jī)后FPGA加載程序,然后根據(jù)算法對采集到的圖像進(jìn)行處理,獲得控制云臺的參數(shù)并傳遞給云臺控制器,從而跟蹤目標(biāo)運(yùn)動。具體實現(xiàn)過程:攝像頭安裝在跟蹤轉(zhuǎn)臺上,攝像頭輸出的電視制式的信號(含有圖像和同步、行場消隱信號)一路送到監(jiān)視器上進(jìn)行實時監(jiān)視,另一路經(jīng)過視頻預(yù)處理,經(jīng)過SAA7113變換后送入圖像處理單元FPGA進(jìn)行圖像處理,圖像處理單元首先形成一個檢測(波門)窗口,然后在窗口中檢測、識別、提取出目標(biāo)圖像信號,確定出目標(biāo)在當(dāng)前幀觀測圖像中的精確坐標(biāo),經(jīng)計算得到相對于攝像頭瞄準(zhǔn)線的偏差量,送至伺服機(jī)構(gòu),云臺輸出控制信號控制步進(jìn)電機(jī)轉(zhuǎn)動,帶動云臺上的攝像頭轉(zhuǎn)動,使目標(biāo)始終處于視場中心,從而達(dá)到跟蹤的目的[2]。通過以太網(wǎng)上傳目標(biāo)坐標(biāo)數(shù)據(jù),用于進(jìn)一步分析。
3 裝置硬件的具體實現(xiàn)
本裝置對核心處理器、視頻解碼芯片,以太網(wǎng)模塊等器件的選擇關(guān)系到整個裝置的性能和價格,即選擇性能價格比高且能滿足設(shè)計需要的器件。
3.1核心處理器選擇
處理器需要根據(jù)算法及實際被測目標(biāo)對處理能力的要求來選擇。目前的處理器主要有單片機(jī)、ARM、DSP、FPGA等等。本裝置核心模塊主要是Altera公司的Cyclone系列FPGA EP4CGX150DF3117N,該芯片有149760個邏輯單元,RAM 635520 bit, 8個鎖相環(huán),用戶I/O 508個,芯片具有很高的性價比,還支持SOPC ,從而完成各模塊功能,并協(xié)調(diào)整個系統(tǒng)工做。芯片功能很強(qiáng)大,為以后系統(tǒng)升級,算法改進(jìn),數(shù)據(jù)量增大提供很大空間。
3.2 視頻解碼芯片SAA7113 和以太網(wǎng)W5100配置
為了使視頻解碼芯片SAA7113H可以按照預(yù)想的方式工作,需要對其進(jìn)行初始化,視頻解碼芯片為I2C串行總線,在上電后首先修改SAA7113H的內(nèi)部寄存器的數(shù)值,進(jìn)行正確初始化[3]。
W5100是一款多功能的單片網(wǎng)絡(luò)接口芯片,內(nèi)部集成10/100以太網(wǎng)控制器,內(nèi)部集成為全硬件形式,且具有經(jīng)過多年市場驗證的TCP/ IP協(xié)議棧,太網(wǎng)介質(zhì)傳輸層MAC和物理層PHY 硬件,TCP/IP等協(xié)議已經(jīng)在很多領(lǐng)域經(jīng)過多年驗證[4]~[5]。
W5100內(nèi)部集成有16KB的存儲器用于數(shù)據(jù)傳輸,使用W5100不需要考慮以太網(wǎng)的控制,只要進(jìn)行簡單的端口SOCKET編程。此外,其接口非常簡單,可選擇SPI接口。
對上述兩個模塊的設(shè)計采用SOPC方法,SOPC是一種用于嵌入式開發(fā)的片上可編程系統(tǒng),設(shè)計靈活,可剪裁,可升級軟硬件在系統(tǒng)可編程的功能,運(yùn)用FPGA 的NIOS II 對 I2C,對SPI口配置過程為:運(yùn)行QUARTUS II 軟件中的SOPC BUILDER 添加I2C,SPI 模塊,從而構(gòu)成功能強(qiáng)大的32位NIOS嵌入式系統(tǒng)。
4 目標(biāo)的跟蹤定位
確定目標(biāo)位置的方法分兩類,即波門跟蹤和相關(guān)跟蹤算法。本文采用形心跟蹤算法,該算法對跟蹤窗內(nèi)的數(shù)字圖像處理得到一閾值,再從跟蹤窗內(nèi)的數(shù)字圖像中分割出目標(biāo)像元,然后根據(jù)分割出的全體目標(biāo)像元位置數(shù)據(jù)和目標(biāo)像元的點數(shù),計算出目標(biāo)的形心,目標(biāo)的形心相對于視場中心的位置數(shù)據(jù)則作為目標(biāo)偏差數(shù)據(jù)[6]。
5 結(jié)論
本文介紹了一種移動目標(biāo)跟蹤裝置。該裝置是以ALTERA公司的FPGA芯片EP4CGX150DF3117N為核心處理器。通過以太網(wǎng)上傳的跟蹤信息來看,看該系統(tǒng)取得了較好的跟蹤效果,實驗結(jié)果證明該裝置能夠很好的適應(yīng)目標(biāo)檢測和跟蹤算法,該裝置對運(yùn)動目標(biāo)監(jiān)視和跟蹤產(chǎn)品有一定的參考意義。
參考文獻(xiàn)
[1]楊宜禾,周維真.成像跟蹤技術(shù)導(dǎo)論[M].西安電子科技大學(xué)出版社,1992.
[2]王栓,艾海舟,何克忠.基于差分圖像的多運(yùn)動目標(biāo)檢測與跟蹤[J].中國圖形圖像學(xué)報,1994(6).
[3]郝迎吉,劉青,徐凌志.基于EPP和FPGA的CMOS圖像傳感器的數(shù)據(jù)采集[J].電子設(shè)計應(yīng)用,2002(01).
[4]黃釘勁,阮照軍,王剛,郭小莉.基于FPGA的圖像采集與遠(yuǎn)程傳輸系統(tǒng)設(shè)計[J].西安工業(yè)大學(xué)學(xué)報,2008.
[5]放璐,楊天怡,牟萬軍.數(shù)字圖像遠(yuǎn)程監(jiān)控系統(tǒng)的組網(wǎng)方式[J].電子產(chǎn)品世界,2002(21).
0 引言
圖像復(fù)原技術(shù)是當(dāng)今圖像處理研究領(lǐng)域的一個重要分支。目的是去除或減輕在獲取數(shù)字圖像過程中發(fā)生的圖像質(zhì)量下降即退化的問題,從而使圖像盡可能接近真實的場景。景物形成過程中可能出現(xiàn)畸變、模糊、失真或混入噪聲,使所成圖像降質(zhì),則稱為圖像的“退化”。
運(yùn)動模糊圖像的產(chǎn)生原因可能是由于攝像機(jī)與被攝物體之間的相對運(yùn)動或曝光瞬間相機(jī)抖動造成的。通過硬件上的去模糊技術(shù)并不容易實施且往往價格昂貴。因此,軟件補(bǔ)償非常流行。先通過數(shù)學(xué)方法將運(yùn)動模糊建模為點擴(kuò)展函數(shù)(psf)與圖像的卷積。再由去模糊方法如迭代算法Lucy-Richardson或非迭代算法 Wiener 算法[1]或更復(fù)雜的方法如Bussgang算法[2]重建原始圖像。由于清晰的源圖像信息是未知的,因此為了重建圖像需要估計點擴(kuò)散函數(shù)。很多方法估計psf已經(jīng)發(fā)展的很好[3-4]。估計點擴(kuò)散函數(shù)的方法很大程度依賴于特定類型的圖像如天文學(xué)和天體物理學(xué)的照片,電腦斷層掃描圖像,或顯微鏡圖像。本文提出一個估計點擴(kuò)散函數(shù)參數(shù)的新方法。對圖像先進(jìn)行預(yù)處理,在做參數(shù)識別和復(fù)原濾波,從而更準(zhǔn)確的恢復(fù)清晰圖像。實驗結(jié)果證明本文方法效果較好。
1 圖像恢復(fù)方法的數(shù)學(xué)模型
2 快速恢復(fù)算法
2.1 點擴(kuò)散函數(shù)的估計
如果引起圖像退化的點擴(kuò)散函數(shù)具有零點,這些零點就會迫使退化圖像的頻譜在某些特定的頻率上變成0,表現(xiàn)在頻譜上就會出現(xiàn)一系列暗線。對于水平勻速直線運(yùn)動的模糊圖像而言,會在n/L處存在零點,其中n為整數(shù),L為模糊的長度,因而圖像在頻率平面上存在一些垂直的等間距直線。對于任意方向運(yùn)動模糊圖像,例如β方向的模糊圖像,其頻譜一定在β+90°的方向存在暗線。圖像頻譜暗線的個數(shù)即為圖像實際運(yùn)動的距離,單位為像素。圖1(a)顯示lena圖像由于運(yùn)動模糊降質(zhì)退化。在傅里葉頻譜的圖像中,如圖1(b)平行深色的線條是顯而易見的。
2.2 去模糊的新算法
4 結(jié)論
本文提出了一個精確性、魯棒性較好的方法恢復(fù)模糊圖像。對圖像去模糊之前先做預(yù)處理,利用Butterworth帶通濾波器先進(jìn)行濾波,再結(jié)合Radon變換和Richardson-Lucy(RL)算法進(jìn)行復(fù)原。實驗結(jié)果證明本文算法能獲得較好結(jié)果。
實際上,圖像復(fù)原算法很多,無法判斷哪種更好,只是適用的領(lǐng)域不同,因此本文還有改進(jìn)空間,可以使該算法適合更多更廣泛的圖像。
【參考文獻(xiàn)】
[1]程姝,趙志剛,呂慧顯.順序結(jié)構(gòu)的運(yùn)動模糊圖像復(fù)原技術(shù)綜述[J].計算機(jī)應(yīng)用,2013(S1):161-165,185.
[2]S. Colonnese, P. Campisi, G. Panci, G. Scarano, Blind image deblurring driven by nonlinear processing in the edge domain, EURASIP J. Appl[Z]. Signal Process. 16 (2004):2462-2475.
[3]趙志剛,程姝,王國棟.基于運(yùn)動估計的模糊圖像盲復(fù)原[J].光電子?激光,2012,(10):2010-2016.
[4]M.A. Santiago, G. Cisneros, E. Bernues, Iterative desensitisation of image restoration filters under wrong PSF and noise estimates, EURASIP J. Adv[Z]. Signal Process(2007), Art. No. 72658.
中圖分類號:C37 文獻(xiàn)標(biāo)識碼:A
一、概述
隨著計算機(jī)視覺技術(shù)的發(fā)展,近年來利用機(jī)器視覺直接觀察焊接熔池,對焊
接質(zhì)量進(jìn)行閉環(huán)控制是通過圖像處理獲取熔池的幾何形狀信息,已是當(dāng)前研究的主要方向。
和傳統(tǒng)的手工焊和半自動焊接過程相比,使用機(jī)器視覺進(jìn)行直接觀測焊接熔池有著很明顯的優(yōu)點,采集的數(shù)字圖像信息豐富,表象直觀,且數(shù)字化的圖像數(shù)據(jù)可以實時傳輸?shù)接嬎銠C(jī)高速緩存內(nèi),提取特征信息, 進(jìn)行實時處理,同時作出在線判決,可以實現(xiàn)焊接過程質(zhì)量實時控制和傳感。
在傳統(tǒng)的手工焊接和半自動焊接過程當(dāng)中,對于一個有經(jīng)驗的焊工,通過直接觀察熔池的行為、接頭的位置、焊道外形及電弧形狀,能夠感知焊接的狀態(tài)。若是感覺到實際焊接過程中同最佳狀態(tài)不一致,為了達(dá)到最佳狀態(tài)可以通過調(diào)節(jié)各參數(shù),以獲得高質(zhì)量的焊縫。可以把這個過程劃分為眼-腦-手的控制過程。圖像處理在焊接過程中的重要意義就等同于手工焊接過程中人的眼睛,可以實現(xiàn)采集和處理焊接位置的傳感、焊接時熔池、焊道對中、熔寬和熔深的信息,然后利用計算機(jī)發(fā)出指令,實現(xiàn)焊接過程的各種工藝參數(shù)如電流、電壓、焊接速度的調(diào)節(jié)和電弧或焊絲的對中。
二、圖像處理的概念
圖像處理(image processing),用計算機(jī)對圖像進(jìn)行分析,以達(dá)到所需結(jié)果的技術(shù)。又稱影像處理。一般圖像處理就指的是對數(shù)字圖像處理。數(shù)字圖像是指用數(shù)字?jǐn)z像機(jī)、掃描儀等設(shè)備經(jīng)過采樣和數(shù)字化得到的一個大的二維數(shù)組,該數(shù)組的元素稱為像素,其值為一整數(shù),稱為灰度值。圖像處理技術(shù)的主要內(nèi)容包括圖像壓縮,匹配、描述和識別以及增強(qiáng)和復(fù)原這3個部分。常見的處理包括有圖像復(fù)原、圖像數(shù)字化、圖像增強(qiáng)、圖像編碼、圖像分析和圖像分割等
三、焊接圖像攝取方法
圖像的處理一般包括量化、圖像識別和圖像預(yù)處理等幾個步驟。圖像預(yù)處理包括圖像增強(qiáng)、圖像變換和圖像恢復(fù),盡量把因為隨機(jī)因素的干擾和攝像中各種條件的限制而產(chǎn)生的不足和噪聲減小,繼而可以獲取焊縫位置的精確信息;量化由圖像卡完成;圖像識別包括邊緣提取和圖像分割等,可借助小波變換、快速傅立葉變換、概率統(tǒng)計等數(shù)學(xué)工具對圖像進(jìn)行理解、分析、模式識別和特征提取。
從國內(nèi)外大量文獻(xiàn)來看,利用機(jī)器視覺采集焊接熔池圖像的方法主要分為被動式直接視覺傳感和主動式直接視覺傳感兩大類,視覺傳感器常采用CCD攝取原始圖像。CCD是英文(Charge-Coupled Devices)的縮寫,意即“電荷耦合器件”。具有體積小、耐震動、重量輕、穩(wěn)定性好、壽命長、速度高,幾何失真小及耐高壓等一系列優(yōu)點。CCD是固態(tài)圖像傳感器的一種,固態(tài)圖像傳感器是指把布設(shè)在半導(dǎo)體襯底上的許多感光小單元的光-電信號,用所控制的時鐘脈沖讀取出來的一類功能器件。
動式直接視覺傳感利用窄帶復(fù)合濾光系統(tǒng)濾除非連續(xù)光譜的電弧強(qiáng)光,并采用高強(qiáng)脈沖激光或具有圖像增強(qiáng)器的高頻閃光燈作為輔助光源,可有效地抑制弧光獲得清晰圖像。被動式直接視覺傳感是利用焊接過程中的結(jié)構(gòu)光進(jìn)行成像。主被動式直接視覺傳感存在強(qiáng)光干擾的問題,激光焊接中,通常采用中性減光的辦法解決強(qiáng)光干擾的問題;在電弧焊中,對于短路電弧焊和脈沖電弧焊.可在短路期間或基值電流期間獲取圖像數(shù)據(jù),或者在攝像機(jī)前通入部分保護(hù)氣,減少煙霧和飛濺的影響;TIG/MIG/MAG焊時弧光在600~700nm波段內(nèi)相對光強(qiáng)最弱最穩(wěn)定,選用這一波段內(nèi)的干涉濾光片和防熱玻璃可有效地排除弧光及紅外干擾。
四、圖像處理在焊接中的應(yīng)用
現(xiàn)如今,對于圖像處理主要集中應(yīng)用在脈沖機(jī)器人焊接、TIG焊、激光焊和焊縫質(zhì)量的檢測等領(lǐng)域。圖像技術(shù)在機(jī)器人焊接領(lǐng)域應(yīng)用較廣。由于機(jī)器人需要有很強(qiáng)的適應(yīng)能力,借助三維視覺傳感系統(tǒng)和計算機(jī)圖像處理技術(shù),焊接機(jī)器人可對焊接環(huán)境進(jìn)行實時控制。通過圖像的采集,可幫助機(jī)器人進(jìn)行焊縫的對中,為機(jī)器人焊接提供實時特征信息,如熔深、熔寬和熔池的形狀等,從而實現(xiàn)焊接過程的智能控制。目前國內(nèi)哈工大的吳林教授在這方面作了較深入的研究,從焊縫位置的傳感到熔滴的過渡,從過程實時控制到最后焊接質(zhì)量的檢測都進(jìn)行了較為系統(tǒng)的研究。
哈工大的何景山博士在脈沖TIG焊熔深及熔透的彩色圖形法傳感方面進(jìn)行了較深入的研究。圖像處理目前用得最廣的領(lǐng)域是在脈沖TIG焊中,國內(nèi)外許多學(xué)者都對該領(lǐng)域進(jìn)行了積極的探索。首先創(chuàng)建了一套適用于脈沖TIG焊的彩色圖像法熔深和熔透的傳感系統(tǒng),通過對脈沖峰值和脈寬的控制實現(xiàn)對熔深和熔透的控制,其控制信息來源于基值期間,進(jìn)行圖像信息的采集。
此外,圖像處理還在焊接的其它領(lǐng)域中有一定的應(yīng)用。有的將圖像處理用于焊接缺陷的自動監(jiān)測與缺陷尺寸的保真,也都收到了良好的效果。有些科技工作者還將圖像處理用于水下濕法焊接,通過復(fù)合濾光技術(shù)和水下CCD攝像系統(tǒng),采集出了藥芯焊絲水下濕法焊接電弧區(qū)域的圖像,用中值濾波和梯度算子的電弧區(qū)域圖像邊緣檢測方法,有效地區(qū)分了電弧燃燒區(qū)域和電弧氣泡區(qū)域。哈爾濱工業(yè)大學(xué)的何景山、楊春利等人結(jié)合采用埋弧焊進(jìn)行容器類焊接結(jié)構(gòu)制造過程中的工藝特點及實際工況,設(shè)計了一種將微型攝像機(jī)、微型半導(dǎo)體激光發(fā)生器及具有濾光功能的光學(xué)系統(tǒng)三者集成一體的焊縫視覺傳感器。
焊接控制過程中的一個重要環(huán)節(jié)就是焊接縫隙檢測,圖像處理在這方面的應(yīng)用也有許多學(xué)者研究。為了實現(xiàn)電弧焊過程的自動對中和焊縫質(zhì)量控制,必須對焊接縫隙的相對位置和坡口幾何參數(shù)進(jìn)行檢測。西安交大的梁晉、賈昌申等在《圖像法焊接縫隙檢測的研究》一文介紹了一套自行設(shè)計的計算機(jī)焊接縫隙檢測系統(tǒng),包括圖像采集卡、計算機(jī)接口、光學(xué)傳感器、圖像處理軟件,分析了它們的基本結(jié)構(gòu)和工作原理,討論了提高光學(xué)傳感器、圖像處理軟硬件等抗干擾能力的措施。該系統(tǒng)工作原理是:由光源和CCD攝像機(jī)組成的光學(xué)傳感器攝取圖象,CCD攝像機(jī)把圖象轉(zhuǎn)換為電信號,再經(jīng)圖象采集卡把模擬信號變?yōu)閿?shù)字信號存儲于計算機(jī)內(nèi),計算機(jī)對此信號進(jìn)行必要的處理,即可得到縫隙位置和坡口幾何參數(shù)信息,在監(jiān)視器屏幕上顯示出來,或經(jīng)過D/A電路給執(zhí)行機(jī)構(gòu),修正焊槍位置,實現(xiàn)閉環(huán)對中控制。有的將圖像分割和小波分析應(yīng)用于焊接領(lǐng)域,小波分析在焊縫視覺跟蹤過程中檢測焊縫,采用多次小波變換可獲得清晰的焊縫邊緣,大大簡化了硬件設(shè)備;圖像分割法可減小焊縫識別的圖像處理的復(fù)雜性,使得焊接過程的實時性增強(qiáng)。
五、圖像處理在焊接中應(yīng)用的展望
為焊接現(xiàn)象的描述及內(nèi)在規(guī)律的解釋提供了極佳的條件和直接的證據(jù),推動焊接理論和實踐的發(fā)展就是通過圖像傳感的這種方法。同時也使得研究者能夠觀察到其它傳感方法所不能觀察到的被強(qiáng)光所淹沒的豐富直觀的信息。
把圖像處理技術(shù)應(yīng)用到現(xiàn)代焊接技術(shù)中,將會推動焊接過程質(zhì)量實時傳感與控制的發(fā)展和成熟,使得焊接過程通過閉環(huán)反饋控制而實現(xiàn)完全自動化,保證焊接質(zhì)量,提高焊接生產(chǎn)效率。
總之,作為智能控制中關(guān)鍵技術(shù)―數(shù)字圖像技術(shù),在焊接過程中發(fā)揮的作用將會越來越大,將為焊接智能化生產(chǎn)作出貢獻(xiàn)。現(xiàn)代工業(yè)正朝著信息化和智能化方向發(fā)展,現(xiàn)代焊接技術(shù)也必然要實現(xiàn)智能化。
參考文獻(xiàn):
[1]段佳佳,楊迎春.圖像處理在自動焊接中的應(yīng)用[J].電子測試,2012,02:12-15.
[2]陳彥賓,李俐群,陳鳳東,陳杰.圖像處理在自動焊接中的應(yīng)用和展望[J].材料科學(xué)與工藝,2003,01:106-112.
中圖分類號:TP3 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-8228(2015)01-26-03
Research and application of image segmentation technology
Wang Wei1, Zeng Xiaoneng2
(1. Changsha Information technology School, Changsha, Hunan 410116, China; 2. Central South University)
Abstract: Image segmentation is about decomposing an image into a number of mutually non-overlapping region while having the same attribute. It is a key technology of digital image processing, which directly affects the effectiveness of segmentation accuracy of subsequent tasks, hence having important significance. The existing segmentation algorithm achieved success to some extent, but the image segmentation problem is far from being solved, research in this area still faces many challenges. The existing problems of image segmentation methods are analyzed. The classical algorithm for image segmentation is improved. A new segmentation method is given and applied to the machine vision-related products which achieve good results.
Key words: digital image processing; image segmentation; segmentation algorithm; machine vision
0 引言
圖像分割是數(shù)字圖像處理中的一項關(guān)鍵技術(shù),它通常用于對圖像進(jìn)行分析、識別、編碼等處理之前的預(yù)處理環(huán)節(jié),其分割的準(zhǔn)確性直接影響后續(xù)任務(wù)的有效性,因此具有十分重要的意義。自上世紀(jì)70年代以來,已經(jīng)出現(xiàn)了多種圖像分割方法,而每一種圖像分割方法都是為了解決一些特定的應(yīng)用問題。該技術(shù)成功地應(yīng)用于許多領(lǐng)域,例如:交通路口的電子警察、光學(xué)字符識別(OCR)、指紋識別、機(jī)動車牌號識別等等。
圖像分割是指將一副圖像分解為若干互不交疊的有意義且具有相同屬性的區(qū)域。好的圖像分割應(yīng)具備的特性:①分割出來的各區(qū)域?qū)δ撤N性質(zhì)如灰度、紋理而言具有相似性,區(qū)域內(nèi)部比較平整;②相鄰區(qū)域?qū)Ψ指钏罁?jù)的性質(zhì)有明顯的差異;③區(qū)域邊界上是明確和規(guī)整的[1]。
大多數(shù)圖像分割方法只是部分滿足上述特征。如果強(qiáng)調(diào)分割區(qū)域的同性質(zhì)約束,則分割區(qū)域很容易產(chǎn)生大量小孔和不規(guī)則邊緣;若強(qiáng)調(diào)不同區(qū)域間性質(zhì)差異的顯著性,則易造成不同區(qū)域的合并。具體處理時,不同的圖像分割方法總是在各種約束條件之間尋找一種合理的平衡。
雖然圖像分割方法已經(jīng)有了很大的發(fā)展,但由于它的復(fù)雜性,仍有很多問題沒有很好地得到解決。因此,人們至今還一直在努力發(fā)展新的、更有潛力的分割算法,以期實現(xiàn)更通用、更完美的分割結(jié)果。實踐表明,對圖像分割理論與技術(shù)的進(jìn)一步研究仍然具有非常重要的意義。
本文首先對數(shù)字圖像分割的一些經(jīng)典分割方法作了概述,然后分析了現(xiàn)有項目開發(fā)中使用的圖像分割方法所存在的問題,最后基于經(jīng)典算法進(jìn)行技術(shù)改進(jìn),實現(xiàn)了一種新的分割方法,并將其應(yīng)用到實際的產(chǎn)品當(dāng)中,取得了良好的效果。
1 圖像分割方法的現(xiàn)狀
從上世紀(jì)五十年代開始,學(xué)者一直熱衷于研究圖像分割技術(shù)。迄今為止,已提出上千種圖像分割算法,依這些算法對圖像處理的特點,主要可分為以下幾類方法[2]。
1.1 閾值分割法
閾值分割法作為一種常見的區(qū)域并行技術(shù),它通過設(shè)置閥值,把像素點按灰度級分若干類,從而實現(xiàn)圖像分割。由于是直接利用圖像的灰度特性,因此計算方便簡明、實用性強(qiáng)。顯然,閾值分割方法的關(guān)鍵和難點是如何取得一個合適的閾值,而實際應(yīng)用中閾值設(shè)定易受噪聲和光亮度影響。近年來關(guān)于閾值分割法主要有[3]:最大相關(guān)性原則選擇閾值法、基于圖像拓?fù)浞€(wěn)定狀態(tài)法、灰度共生矩陣法、熵法、峰值和谷值分析法等。其中,自適應(yīng)閾值法、最大熵法、模糊閾值法、類間閾值法是對傳統(tǒng)閾值法改進(jìn)較成功的幾種算法。更多的情況下,閾值的選擇會綜合運(yùn)用兩種或兩種以上的方法,這也是圖像分割發(fā)展的一個趨勢。例如,將圖像的灰度直方圖看作是高斯分布的選擇法與自適應(yīng)定向正交投影高斯分解法的結(jié)合,較好地擬合了直方圖的多峰特性,從而得到了更為準(zhǔn)確的分割效果。閾值法的缺陷主要在于它僅僅考慮了圖像的灰度信息,而忽略了圖像的空間信息。對于非此即彼的簡單圖像處理(如一些二值圖像的處理)是有效的,但是對于圖像中不存在明顯的灰度差異或各物體的灰度值范圍有較大重疊的圖像分割問題則難以得到準(zhǔn)確的分割效果。
1.2 基于邊緣的圖像分割法
邊緣總是以強(qiáng)度突變的形式出現(xiàn),可以定義為圖像局部特征的不連續(xù)性,如灰度的突變、紋理結(jié)構(gòu)的突變等。邊緣常常意味著一個區(qū)域的終結(jié)和另一個區(qū)域的開始,圖像的邊緣包含了物體形狀的重要信息,它不僅在分析圖像時大幅度地減少了要處理的信息量,還保護(hù)了目標(biāo)的邊界結(jié)構(gòu)。對于邊緣的檢測常常借助空間微分算子進(jìn)行,通過將其模板與圖像卷積完成。兩個具有不同灰度值的相鄰區(qū)域之間總存在灰度邊緣,而這正是灰度值不連續(xù)的結(jié)果,這種不連續(xù)可以利用求一階和二階導(dǎo)數(shù)檢測到。
當(dāng)今的局部技術(shù)邊緣檢測方法中,主要有一次微分(Sobel算子、Roberts算子)、二次微分(拉普拉斯算子等)和模板操作(Prewitt算子、Kirsch算子和Robinson算子)等。這些邊緣檢測器對邊緣灰度值過渡比較尖銳且噪聲較小等不太復(fù)雜的圖像可以取得較好的效果,但對于邊緣復(fù)雜(如邊緣模糊、邊緣丟失、邊緣不連續(xù)等)的圖像效果不太理想。此外,噪聲的存在使基于導(dǎo)數(shù)的邊緣檢測方法效果明顯降低,在噪聲較大的情況下所用的邊緣檢測算子通常都是先對圖像進(jìn)行適當(dāng)?shù)钠交种圃肼暎缓笄髮?dǎo)數(shù),或者對圖像進(jìn)行局部擬合,然后再用擬合光滑函數(shù)的導(dǎo)數(shù)來代替直接的數(shù)值導(dǎo)數(shù),如Marr算子、Canny算子等。有關(guān)學(xué)者曾給出了一種基于彩色邊緣的圖像分割方法,這是對傳統(tǒng)邊緣分割方法只適用于灰度圖像狀況的一個突破。
在未來的研究中,用于提取初始邊緣點的自適應(yīng)閾值選取、用于圖像層次分割的更大區(qū)域的選取,以及如何確認(rèn)重要邊緣去除假邊緣將變得非常重要。
1.3 基于聚類的分割法
對灰度圖像和彩色圖像中相似灰度或色度合并的方法稱之為聚類,通過聚類將圖像表示為不同區(qū)域即所謂的聚類分割方法。此方法的實質(zhì)是將圖像分割問題轉(zhuǎn)化為模式識別的聚類分析,如k均值、參數(shù)密度估計、非參數(shù)密度估計等方法都能用于圖像分割。常用的聚類分割有顏色聚類分、灰度聚類分割和像素空間聚類分割。
顏色聚類分割實際上是將相似的幾種顏色合并為一色,描述顏色近似程度的指標(biāo)是色差,在標(biāo)準(zhǔn)CIE勻色空間中,色差是用兩個顏色的距離來表示的。但是顯示器采用的RGB空間是顯示器的設(shè)備空間,與CIE系統(tǒng)的真實三原色不同,為簡單起見,一般采用RGB色空間中的距離來表示。
灰度聚類分割就是只把圖像分成目標(biāo)和背景兩類,而且僅考慮像素的灰度,這就是一個在一維空間中把數(shù)據(jù)分成兩類的問題。通過在灰度空間完成聚類,得到兩個聚類中心(用灰度值表征),聚類中心連線的中點便是閾值。顯然這個概念也可以輕松地延擴(kuò)至多閾值和動態(tài)閾值的情況。
像素空間聚類分割在某些特定的尺度上觀察圖像,比如說把圖像信號通過一個帶通濾波器,濾波的結(jié)果將使圖像的局部信息更好地被表達(dá)。通過一個多尺度分解,輪廓信息可以在大尺度圖像上保留下來,細(xì)節(jié)或者突變信息可以在中小尺度上體現(xiàn),基于多尺度圖像特征聚類的分割方法漸漸得到了人們的關(guān)注。
1.4 函數(shù)優(yōu)化法
基于函數(shù)優(yōu)化的分割方法是圖像分割中另一大類常用的方法,其基本思路是給出一個目標(biāo)函數(shù),通過該目標(biāo)函數(shù)的極大化或極小化來分割圖像,G.A.Hewer等人提出了一個具有廣泛意義的目標(biāo)函數(shù)。統(tǒng)計學(xué)分割法、結(jié)合區(qū)域與邊緣信息法、最小描述長度(MDL)法、基于貝葉斯公式的分割法等是目前幾種活躍的函數(shù)優(yōu)化法。
統(tǒng)計學(xué)分割法就是把圖像中各個像素點的灰度值看作是具有一定概率分布的隨機(jī)變量,且觀察到的實際物體是作了某種變換并加入噪聲的結(jié)果。統(tǒng)計學(xué)分割方法包括基于馬爾科夫隨機(jī)場法(MRF)、標(biāo)號法(Labeling)和混合分布法(Mixture)等。
結(jié)合區(qū)域與邊緣信息法是基于區(qū)域信息的圖像分割的主要方法。區(qū)域增長有兩種方式:一種是先將圖像分割成很多一致性較強(qiáng)的小區(qū)域,再按一定的規(guī)則將小區(qū)域融合成大區(qū)域,達(dá)到分割圖像的目的;另一種是事先給定圖像中要分割目標(biāo)的一個種子區(qū)域,再在種子區(qū)域基礎(chǔ)上將周圍的像素點以一定的規(guī)則加入其中,最終達(dá)到目標(biāo)與背景分離的目的。分裂合并法對圖像的分割是按區(qū)域生長法沿相反方向進(jìn)行的,無需設(shè)置種子點,其基本思想是給定相似測度和同質(zhì)測度,從整幅圖像開始,如果區(qū)域不滿足同質(zhì)測度,則分裂成任意大小的不重疊子區(qū)域;如果兩個鄰域的子區(qū)域滿足相似測度則合并。
最小長度描述法(MDL)的基本思路是用一種計算機(jī)語言來描述圖像的區(qū)域和邊界信息,得到一個描述長度函數(shù),以此作為目標(biāo)函數(shù),根據(jù)圖像極小化描述長度從而得到分割結(jié)果。MDL準(zhǔn)則主要應(yīng)用于區(qū)域競爭中,即通過這種規(guī)則對比若干個種子區(qū)域,找出其中的壞種子。它常常與其他方法結(jié)合使用。
2 圖像分割技術(shù)的研究與應(yīng)用
2.1 圖像掃描分割
根據(jù)實際產(chǎn)品的需要,要根據(jù)分割的特殊要求,采用簡單的圖像掃描分割。
2.1.1 算法思想
獲取二值化要分割的圖像,然后轉(zhuǎn)換為圖像指針并獲取圖像的左右邊界、上下邊界,然后再分割圖像[4]。
2.1.2 分割過程實現(xiàn)
下面介紹基于FrameWork4.0,采用C#實現(xiàn)對圖像進(jìn)行分割處理的主要步驟。
⑴ 二值化要分割的圖像
BaseFilterHandler.ImgConvertToFormat8(c_Bitmap);
BaseFilterHandler.ImgBradleyLocalThresholding(c_Bitmap);
⑵ 轉(zhuǎn)換為圖像指針并獲取圖像中的左右邊界
BitmapData bmData=c_Bitmap.LockBits(new Rectangle
(0,0,c_Bitmap.Width,c_Bitmap.Height),ImageLockMode
.ReadWrite, c_Bitmap.PixelFormat);
List<int[]> widthLeftRight=GetImgLeftRight(bmData,
c_Bitmap, throldValue);
⑶ 獲取圖像的上下邊界
int[] yValues=img.GetPicTopBottom(sourceMap, 1, sourceMap
.Height-2, widthLeft[widthLeftIndex],
widthRight[widthLeftIndex]);
top=yValues[0]; bottom=yValues[1];
⑷ 分割圖像
Rectangle sourceRectangle0=new Rectangle
(widthLeft[widthLeftIndex],tempTop, widthRight
[widthLeftIndex]-widthLeft[widthLeftIndex], tempHeight);
Bitmap tempMap=sourceMap.Clone(sourceRectangle0,
sourceMap.PixelFormat);
2.1.3 實際效果
存在干擾情況下的分割效果,如圖1所示。
<E:\方正創(chuàng)藝5.1\Fit201501\圖\ww圖1.tif>
圖1 圖像掃描分割
圖像掃描分割的結(jié)果存在多干擾點,一些字符不能完整地被分割出來,多個字符連接在一起,分割效果不是很好。
2.2 findContours分割
2.2.1 算法思想
該算法是提取圖像的輪廓信息,一個輪廓一般對應(yīng)一系列的點,也就是圖像中的一條線[5]。在算法中用序列cvSeq來保存提取到的序列集,序列中的每一個元素就是曲線中的一個點的位置。
2.2.2 分割過程實現(xiàn)
下面介紹采用C++實現(xiàn)對圖像分割處理的主要步驟。
⑴ 圖像的預(yù)處理(二值化、平滑處理等)
threshold(input,img_threshold,60,255,
CV_THRESH_BINARY_INV);
IplImage* input_image=&IplImage(img_threshold);
IplImage* dst_image=cvCreateImage(cvGetSize
(input_image),IPL_DEPTH_8U,0);
cvSmooth(input_image,dst_image,CV_GAUSSIAN,3,0,0,0);
⑵ 查找圖像的聯(lián)通區(qū)域及輪廓
Mat img_contours;
img_threshold.copyTo(img_contours);
vector<vector<Point>> contours;
findContours(img_contours, contours,
CV_RETR_EXTERNAL,CV_CHAIN_APPROX_NONE);
⑶ 對輪廓進(jìn)行轉(zhuǎn)換得到內(nèi)容區(qū)域
vector<vector<Point>>::iterator itc=contours.begin();
IplImage* temp=&(IplImage)input;
vector<Rect> validRect;
while(itc!=contours.end()) {
Rect mr=boundingRect(Mat(*itc));
rectangle(result,mr,Scalar(0,255,0));
if(!checkSplitRect(mr,temp->height,temp->width))
{ ++itc;continue; }
validRect.push_back(mr);
++itc;
}
⑷ 圖像分割
CvSize size=cvSize(rect.width,rect.height);
cvSetImageROI(source,cvRect(rect.x,rect.y,size.width,size.height));
IplImage* pDest=cvCreateImage(size,source->depth,
source->nChannels);
cvCopy(source,pDest);
cvResetImageROI(pDest);
2.2.3 實際效果
從分割結(jié)果看,該分割算法能把所有的單個圖片聯(lián)通區(qū)域分割出來,但是分割出的區(qū)域存在很多干擾區(qū)域,增加了實際區(qū)域提取的復(fù)雜度(見圖2)。
<E:\方正創(chuàng)藝5.1\Fit201501\圖\ww圖2.tif>
圖2 連通區(qū)域分割
下面將在此基礎(chǔ)上進(jìn)行改進(jìn)。
2.3 改進(jìn)后的算法
增加連通區(qū)域的有效性判斷及過濾;
checkSplitRect(Rect rect,int height,int width)
同時對一些單字符被分割成多個字符的區(qū)域按照一定的算法及規(guī)則進(jìn)行有效組合和合并;
vector<Rect> MergeImage(vector<Rect> validRect)
最后形成的分割效果如圖3所示,將所有字符正確的分割出來,去除了干擾,達(dá)到了理想的效果。
<E:\方正創(chuàng)藝5.1\Fit201501\圖\ww圖3.tif>
圖3 改進(jìn)后的分割效果
3 實驗結(jié)果
為了驗證本方案的可行性和可操作性,本文使用10000張測試圖像作為實驗測試庫,對此方案進(jìn)行測試。測試結(jié)果:正確分割達(dá)到99%以上。如圖4,改進(jìn)后的分割正確率比改進(jìn)前的分割正確率提高了將近20倍。
<E:\方正創(chuàng)藝5.1\Fit201501\圖\ww圖4.tif>
圖4 分割對比
4 結(jié)束語
圖像分割沒有通用的理論,要根據(jù)具體情況采取有效的方法。利用已經(jīng)研究出的多種圖像分割方法,將多種方法綜合運(yùn)用,發(fā)揮各自的優(yōu)勢進(jìn)行圖像分割將成為這一領(lǐng)域的發(fā)展趨勢。同時,由于現(xiàn)在所處理的圖像的復(fù)雜度和固有的模糊性,傳統(tǒng)的單一的處理方法已不能適用需要,與新理論、新工具和新技術(shù)結(jié)合起來才能有所突破和創(chuàng)新。
本文在原有分割技術(shù)的基礎(chǔ)上,結(jié)合實際的使用情況,進(jìn)行了算法思想的改進(jìn)和創(chuàng)新,最終達(dá)到了理想的分割效果,在一定程度上具有良好的研究和實用價值。
參考文獻(xiàn):
[1] R.M.Haralick,L.G.Shaprio, "Image segmentation tech2 niques",
Computer Vision, Graphics, and Image Processing,1985.29:100-132
[2] 羅希平等.圖像分割方法綜述[J].模式識別與人工智能,1999.12(3):
300-312
[3] 吳一全,朱兆達(dá).圖像處理中閾值選取方法30年(1962-1992)的進(jìn)