緒論:寫作既是個人情感的抒發,也是對學術真理的探索,歡迎閱讀由發表云整理的11篇解碼技術論文范文,希望它們能為您的寫作提供參考和啟發。
總體結構
系統硬件分為:高清圖像采集板、NiosII核心板、單片機接口板三部分。軟件由NiosII和單片機軟件組成。考慮到程序的標準化、可移植性,NiosII程序和單片機程序都使用標準C編寫。
高清圖像采集
方案一用工業用高清鏡頭采集影像,再對模擬視頻解碼,得到高清視頻數據。解碼芯片可選AD的ADV7181C,10位集成多格式標清高清視頻解碼器,四個10位ADC采樣速率最高110MHz,支持720p/1080i高清分量,最高對1024x768、70Hz(XGA)RGB圖形進行數字化處理。科技論文。或TI TVP5150AM1,超低功耗優化架構,工作狀態下功耗僅為113mW,只需一個晶振就能支持所有標準,可通過I2C對亮度、對比度、飽和度、色調、銳度等控制,功能強大使用方便。或飛利浦SAA7114H,該芯片最多允許6個復合視頻輸入,顯示比例調整分辨率調整,解碼精度高支持視頻窗口縮放。科技論文。此方案成本高體積大。
方案二用高清圖像傳感器采集,直接輸出高清圖像數據。從芯片的性能指標、價格供貨、技術支持、開發難易程度等方面考慮,Omni公司的OV9712芯片較為合適。該傳感器為1/4”標清高清CMOS圖像傳感器,像素尺寸3.0um,內置OmniPixel3-HS技術,可提供WXGA(1280X800)分辨率、640x480、HD720p三種格式圖像,10bit彩色rawRGB并行圖像數據輸出,PLL鎖相環,高信噪比圖像質量,鏡頭校正,畫面缺陷補償。該方案成本百元左右,硬件簡單性能穩定,符合實際要求。
設計OV9712采集電路時,要使用獨立電源,電路板上盡量減小信號線長度及避免上下層平行布線,電源芯片放在板子外側。外圍器件盡量以OV9712要求參數一致,電路中模擬地與數字地分開走線最后匯集一點。OV9712有效圖像傳感區域不在芯片中間位置,而是偏右偏上,為了使目標圖像能處于畫面中心,繪制電路板時要注意調整芯片位置,具體尺寸參見OV9712器件手冊。
Nios核心板
FPGA芯片選型比較如下:
1 MIMO技術的發展
多輸入多輸出技術的核心在于空間復用編碼,空間復用系統中獨立的數據流是由不同的天線在同一時間發送,信道容量直接因為發送天線的增加而線性增加。本論文主要討論空間復用編碼及其相關檢波技術,具體比較了線性檢測、非線性檢測和樹查找三種檢波算法。
2 系統模型
通常的MIMO系統2×2、2×4或4×4的天線系統,一般設定Nr大于或等于Ns。這樣做的目的是第i個數據流xi在第i根天線上發送時,接收到的信號向量r=Hx+n,這樣Ns×1的發送數據流列向量右乘Nr×NS的信道傳輸矩陣H,加上Ns×1的信道噪音列向量。設定傳送的數據系列x服從(0,σ2)的高斯分布,為了簡化系統仿真中直接在接收端導入信道傳輸矩陣H,噪音為高斯白噪。
3 空間復用和檢波技術
OFDM系統發展到今天,加入時空編碼成為在不增加現有帶寬基礎上穩定提高傳輸速率的最好手段。包括線性遞推法和樹查找法的接收器檢波技術實踐中用來移除信道的干擾,恢復被頻選信道干擾的信號的正交性等,但是其計算太繁瑣。因此陸續的出現球形譯碼算法和QRD-M算法既繼承了最大相似性算法的優勢又減少了計算量,節約了處理芯片功耗。
3.1 ZF接收器
ZERO-FORCING接收器在接收天線數大于或等于發送天線數的條件下,使信號傳輸方程:
成立的向量解并不唯一,因此需要找最小方差的發送信號向量,利用微分找到最小方差值為:
從上面公式可以看出,在信號的解調基本是信道傳輸函數的線性運算,因此ZF接收器在信道情況良好的情況下就會非常方便和快捷,利用線性矩陣運算可以很簡單地建立運算函數,如圖1所示。
3.2 V-BLAST譯碼
雖然線性的接收器非常容易實現,但是因為增加了信道傳輸函數階數且需要的信道良好條件在實際高樓密集的城市中很難實現,貝爾實驗室在1996年提出了一種無線通信中多天線的空間結構,稱為D-BLAST,進而在1998年,P. Wolniansky聯合Goschini和 Golden在D-BLAST的時空編碼中實現高傳輸率的垂直-BLAST,即V-BLAST,V-BLAST在信元調制中使其時空編碼先正交,這樣每次減少一個發送的信元的同時減少信道傳輸函數的階數,即將最初的r×t,依次減少到r×1,也就是SIC算法。利用ZF或是MMSE矩陣來調制信元xi,從而使得接收信號在接收端通過ZF或是MMSE相同的矩陣運算后只留下xi的信號成分,從而提取出發送的信元xi,再將提取出的成分反饋回接收器線性元素之后,再重復步驟提取xi+1。
3.3 利用QR分解法分解信道矩陣
利用QR分解法將r×t的信道傳輸函數矩陣H分解為與轉秩相逆的矩陣Q和上對角矩陣R,即QTQ=E,接收到的信號為:
基本所有的多輸入多輸出正交頻分多路復用都會在檢測算法中或多或少使用到QR分解法,當QR分解之后的信道響應不僅能保證信號的正交而且還能夠簡化信號的解調處理。因為信道的傳輸函數H分解為了上三角矩陣R,各信號分量矩陣間的相互關聯也被簡化為上三角矩陣中各信號單獨的向量調制,從而簡化接收端同步檢測器的設計復雜度,如圖2所示。
3.4 樹搜索同步技術
最大似然法利用已知的模型來推導未知的參數,在MIMO-OFDM系統中使用的最大似然法利用樹搜索,每一個搜索樹節點作為信元的可能解碼。下面將對兩類常用的搜索樹的優缺點繼續比對
3.4.1 球形解碼
MIMO接收端天線數量的增加會使算法的復雜度成指數增加,很難在大陣列和高調制數的情況下物理實現解碼器。球形解碼算法利用合理的譯碼半徑R從而判定接收好譯碼的路徑d,約束搜索半徑R的公式一般寫為:
球型解碼器由前端運算部件和后面的樹搜索部件構成。
5 結論
該論文中討論了多輸入多輸出信道模型下的多個解碼算法,通過MATLAB仿真軟件討論各算法下不同的信噪比和算法復雜度。通過MATLAB所生成的圖形,我們可以明顯看到因為零點逼近算法采用的放大濾波器在放大有效信號的同時也相應地放大了噪音信號,因此其在信噪比一定的情況下比其他算法所產生的誤碼率高。采用遞推算法的垂直-BLAST解碼算法對比零點逼近算法來說其誤碼率有所改進,但是其改進的地方在于采用了QR算法來分解信道矩陣,因此其對于零點逼近算法的改進基本取決于QR分解算法的階數。最接近于最大近似算法的誤碼率,且比最大近似算法更為簡單的球型算法作為現代MIMO-OFDM信道解碼的主流算法存在很高的可操作性和理想的低誤碼率。
參考文獻
[1]Bohnke,R.,D.Wubben,“BLAST結構的時空編碼”,IEEE Tran.Vol.50,2003.
[2]G.Foschini,“多天線衰減環境下無線通信的時空結構層結構”,Bell Labs, Technical Journal 2,1996.
[3]P.Wolniansky,G.J.Foschini,G “V-BLAST”,URSI Inter-national Symposium on Signals,Systems and Electronics,1998.
[4]Gentle,J.E.,“QR分子”,1998.
[5]Vikalo,H.,B.Hassibi,“球型約束下頻選信道的最大似然檢波器”,IEEE vol.54 2006.
作者簡介
中圖分類號:TP311 文獻標識碼:A文章編號:1007-9599 (2011) 20-0000-02
Mp3 Player Design Based on SOPC
Xie Huicheng1,Guo Li2
(1.School of Electronic Engineering,Jiujiang University,Jiujiang332005,China;2.Jiujiang University,Information Science and Technology College,Jiujiang332005,China)
Abstract:This paper mainly from the audio playback and the intersection of SOPC technology,this paper proposes the use of technology in Altera's SOPC CyelonII EP2C35 FPGA mp3 player built on the design.The use of IP design reuse,collaboration software and hardware,hardware acceleration and other methods,combined with the experimental characteristics of platform resources to build a soft-core processor based on NiosII mp3 player system. Achieve MPEGⅠ layerⅢ smooth playback audio decoding.The system has a small size,design flexibility,short development cycle and so on.
Keywords:Embedded system;SOPC;MP3 player
一、引言
目前,嵌入式系統進入全面應用的階段,己經成為通信和消費類產品的共同發展方向。在硬件方面,市場上不僅有各大公司生產的各種微處理器芯片,還有用于學習和進行研發的各種配套的軟件開發包和開發工具。SOPC具有系統集成度高、體積小、功耗低、結構簡潔、可靠性高、開發快速等特點,很好的滿足了的嵌入式系統在硬件上的需求。SOPC技術的目標是試圖將盡可能大而完整的電子系統,包括嵌入式處理器系統、接口系統、硬件協處理器或加速器系統、存儲電路、DSP系統、數字通信系統、以及普通數字系統等,在單一FPGA中實現,使得所設計的電路系統在其規模、可靠性、體積、功耗、功能、性能指標、上市周期、開發成本、產品維護及其硬件升級等多方面實現最優化。
二、系統總體設計
設計一個具有基本功能的MP3播放器需要有時鐘電路、CPU、RAM及RAM控制器、Flash及Flash控制器、SD卡及SD卡控制電路、液晶及液晶顯示器驅動電路、DMA控制器、音頻驅動及音頻控制電路、定時器等模塊,如圖1所示。
圖1:MP3播放器系統結構圖
除顯示驅動模塊、音頻控制模塊和SD卡控制模塊外其他模塊都可以從SOPC Builder中添加IP核構建。
其中顯示驅動模塊可以在altera提供的VGA控制器的基礎上添加CLK和BLANK信號完成;SD卡控制模塊只需要定義幾個GPIO端口就可以了,不需要單獨設計。
三、音頻播放模塊
采用的MagicSOPC實驗開發平臺配有AC97音頻解碼模塊,主控制芯片為UCB1400(帶有觸摸屏功能的立體聲音頻編解碼器),它支持可編程抽樣率、輸入/輸出增益和數字音響處理,包括音量、靜音、低音和高音控制。
音頻控制模塊是CPU與UCB1400間的接口電路,功能為將緩存中的音頻數據通過AC-Link總線發送到UCB1400的DAC輸入端口實現音樂的播放,以及由AC-Link總線接收UCB1400采集的音頻編碼數據。本設計采用verilog語言來設計如下各個功能模塊。
(一)UCB1400寄存器訪問控制
音頻播放時主控制器(CPU)需要經常讀/寫UCB1400中相關的寄存器,因為采用AC-Link串行總線傳輸數據,時序變得非常重要,所以定義了訪問控制模塊。要訪問UCB1400時,該模塊向UCB1400發送請求信號;當一次讀取完成,數據準備好時,該模塊向CPU發送反饋信號。
(二)UCB1400掉電模式控制
UCB1400可以將暫時不用的模塊關閉以節約功率,向UCB1400的Power-down Control/status Register(0x26)寫入相應的數值可以控制UCB1400中各個模塊的開啟和關閉。所以設計掉電模式控制模塊,該模塊負責監視UCB1400各模塊的狀態并將此信息反饋給主控制器。
(三)串行輸入/輸出寄存器
FPGA內部數據為并行傳輸,而與UCB1400間則功過AC_Link總線串行傳輸,所以應設計串并轉換模塊。
(四)輸入/輸出FIFO
為保證音樂播放的流暢,應為每個聲道配置一定容量的FIFO用來保存已接收到和即將傳輸的數據。
設計完成后的AC97_Controller結構框圖如圖2所示:
圖2:AC97_Controller結構圖
具有如下功能:
可變比特率支持、雙聲道立體聲輸出支持、雙聲道立體聲輸入支持、單聲道麥克風輸入支持、DMA傳送方式支持。
四、系統軟件設計
將基于NiosⅡ的SOPC系統進行編譯并下載到FPGA中生成硬件系統的同時,SOPC Builder幫助用戶生成相應的SOF文件。在此基礎上,可開始系統軟件的設計。可使用匯編、C、C++來進行嵌入式程序設計,使用IDE工具進行程序的編譯連接以及調試。MP3播放器的軟件系統結構如圖3所示:
圖3MP3播放器軟件系統結構
五、結語
本系統采用SOPC技術在一片FPGA和少數外設上實現了MP3播放器的基本功能。在50MHz的系統時鐘下實現了MPEG-Ⅰ layer-Ⅲ解碼,流暢播放MP3格式的音頻文件。
SOPC方案的優勢在于系統功能改進的靈活性,在不改變硬件平臺的情況下,可以方便對系統進行增刪和優化,這是傳統ARM方案無法達到的。
參考文獻:
論文摘要:醫療器械的發展經歷了從最早的僅僅滿足使用需求到現在需要滿足使用者內心感受的巨大變革,同時對于醫療器械設計理念在不同時代也給予了不同的定義,當今社會所追求的物質與精神的統一決定了醫療器械設計也必須從外觀設計轉向涉及使用者內心感受的交互式設計階段,這是科技與人,歷史與發展結合的必然產物。交互式設計在醫療器械中的作用,旨在思考機器與人,人與機器的和諧發展。
二十世紀二、三十年代包豪斯提出的“功能主義”在工業設計中影響很大,醫療器械的設計有相當長一段時間以“理性主義”思潮為主流,遵循“形式追隨功能”原則,其“技術至上”的傾向導致了產品與人的情感、與環境的疏遠。這種高估 “物”的技術作用,而忽視“物”的人文價值的作法,是不符合當今時代要求的。
我國醫療器械產品技術除在超聲聚焦等少數領域處于國際領先水平外,多數關鍵技術被發達國家大公司所壟斷,國產高端醫療器械產品技術性能和質量水準落后于國際先進水平10年左右。與此同時,將產品的“設計”行為視為或從事為“裝飾”行為,仍是我國企業中醫療器械設計的主流。這種認識和行為上的膚淺化、歪曲化,正使相當多的企業遭受嚴重的短期損失(如產品積壓)和長遠損失(如失去市場)。
一、設計對話——作品與受眾的信息交流
醫療器械的交互式設計在于有效地傳遞產品與服務的信息,樹立良好的品牌形象與企業形象,刺激消費者的購買欲望,并從精神上給人以美的享受,最后達到推動經濟發展的目的。這就要求設計師在設計創新的時候需要考慮到產品與消費者之間的這種對話,以保證產品生產投入市場之后可以獲得較好的市場認同度。從而也在一定程度上促進設計的發展。
設計師根據市場競爭態勢與消費者需求趨向等信息來確定設計作品的開發與傳播,同樣,消費者作為設計信息終端部位的信宿,是設計信息的接受者,他在接受信息時必須經過解碼過程。對于設計師而言,就需要在設計創新的過程中進行思考,來規劃這一個解碼的過程。
對于設計受眾來說,信息的解碼過程大體可分為注意、識碼、分析、記憶、行動幾個階段。當設計作品引發他們關注時,才能產生審美注意,設計信息引起注意是信宿接受信息,解碼過程的開始,當解讀相關信息后,也就獲得了某種設計信息。了解了產品的性能、特點,感受到它的造型、質量。聯想到對提高自己生活品質的利益和好處,從而在心理上縮短了與產品的距離,萌生一種擁有的欲望。識碼、分析是設計信息解碼過程的主體,是信息的接受與處理。設計信息作用的實現就從這里開始,因此也是很重要的。記憶,行動是設計信宿解碼過程的完成,于是設計活動與設計對話就在這種雙向信息交流中開始與終結。在設計的創新階段,設計師可以針對不同的產品進行相應有效的注意、識碼、分析、記憶、行動的針對性預設計,從而為這個結果的實現提供前提。
二、多維思考
醫療器械的交互式設計在明確命題之后,具體實踐的過程則要求進行多維思考。所以在設計創新和開發階段,設計師從多維角度考慮出發,在避免重復傳統的無序思維發散的基礎上,為達到醫療器械交互設計在設計開發之后能準確的與市場消費需求相吻合而充分的實現附加值的最大化,定位情感消費與設計開發相結合方法,還需要提出一些基于命題和市場的概念描述:
1.輔助物:現階段對醫療器械的交互式設計需求注重的是情感上的共鳴,輔助物是一個玩具亦或一個玩伴甚者一種友誼,一種美好的心情。
2.適用人群確立:有想法、充滿了想象力、勇于嘗試和創新,對現行交互式設計文化耳濡目染,關心自己,關心他人,重視生活,物質和精神的雙重需求。
3.共性與個性:或許是某個按鍵、表面、質感、顏色與使用者產生共鳴。
有了這樣的概念性描述之后,基本上明確了醫療器械的交互式設計導向,也就為下一步工作做好了充分的準備。
三、設計效用性
由于現代設計信息創意水平的提高,企業整體營銷戰略的加強,一般有遠見卓識的企業傳播的設計信息都具有長期效果,對受眾起著舉一反三的作用,并使其獲得經濟,藝術與審美的多種效應。而在創意上這種長期的有效性就表現為對設計產品創意程度的應用。產品的周期決定了產品的壽命,創意是這一產品在市場上的賣點。可以通過對效用性的研究,來分析特定產品在特定情況下的設計過程和實現的方法。
中圖分類號:TP331文獻標識碼:A文章編號:1009-3044(2009)25-7245-02
A SoC Architecture Design of Hardware Decoder of AVS
XU Xiao-ni, YAN Xiang-hong
(College of Information Science and Engineering, SDUST, Qingdao 266510, China)
Abstract: According to the algorithm of AVS audio and video decoding standard, this paper proposes a proposal of AVS decoding based on SoC method. This method can reduce the complexity of AVS decoder effectively. Using the hardware and software co-design ideas can reduce the difficulty of designing a decoder while improving the flexibility of decoding.
Key words: AVS; SoC; hardware and software co-design; decoding
AVS(Audio Video coding Standard)[1]是由中國信息產業部成立的“數字音視頻編解碼技術標準工作組”提出的我國自主制定的數字音視頻編解碼技術標準,是為了適應數字電視廣播、數字存儲媒體、網絡流媒體、多媒體通信等應用中對運動圖像壓縮技術的需要而制定的。AVS標準中的解碼后的視頻質量介于MPEG2和H.264之間,但AVS標準的編碼復雜度和效率要好于H.264標準,而且相對H.264較高的專利許可費用,AVS采用了非常低的專利許可費。2006年初,國家信息產業部正式批準AVS標準成為中國音視頻領域的國家標準,從而為國內企業每年節省大量的專利許可費用。
目前在嵌入式設備上,音視頻的硬件編解碼器都采用ASIC的設計方案,即全部采用硬件實現音視頻標準的所有部分。這種方案的設計優點是解碼速度快,但同樣缺點也是明顯的,即它的研發時間長、成本高、靈活性低,而且編解碼格式固定,無法進行升級。而SoC(System on chip)[2]的設計方案能夠滿足音視頻領域要求的編解碼速度,同時還能夠加快研發速度、降低成本,而且靈活性高,可升級(設計部分只針對軟件方面),因此相對ASIC的設計方案,采用SoC的設計方法有很大的優勢。
1 SoC設計方法介紹
SoC(System on chip)[2]簡稱片上系統,是一個有專用目標的集成電路,其中包含完整系統并有嵌入軟件的全部內容,包括CPU、程序存儲器、IP(intellectual property)功能復用模塊、片外總線接口模塊。同時它又是一種技術,用以實現從確定系統功能開始,到軟/硬件劃分,并完成設計的整個過程。SoC設計的關鍵技術主要包括總線架構、IP核可復用、軟硬件協同設計等技術。
音視頻硬件編解碼的Soc設計方案主要采用軟硬件協同設計的思想,將音視頻標準中的各部分分而治之:標準當中邏輯復雜但計算量小的部分采用軟件實現,以增加編解碼器的靈活性,同時可以進行升級;標準當中邏輯簡單但計算量大計算復雜的部分以IP核的形式采用硬件實現,以增加編解碼器的速度,還可以實現IP核在其他設計上的復用。從目前個人計算機上利用GPU(顯卡)中硬件解碼功能進行加速解碼的高清視頻播放的方法中就可以看到SoC設計方法的影子。個人計算機上的視頻播放程序通過GPU的驅動程序,調用GPU內置的硬件解碼功能實現實時加速播放,從而大大降低CPU的工作量,降低對CPU計算能力的要求。
SoC方法的設計流程如圖一,通過下圖可以看出,SoC設計方法中一旦軟硬件功能模塊劃分清楚后就可以同時開發設計,大大加快設計的速度。最后軟硬件協同測試完成開發。
2 基于SoC方法的AVS硬件解碼器設計方案
在嵌入式設備的音視頻解碼方案中,硬件解碼器作為一個外設模塊存在,它與攝像頭之類的外設處于同一級別。根據上述SoC方案的設計思想,按照AVS音視頻標準P2(先進音視頻編碼第2部分:視頻)[1]部分,對AVS視頻的解碼過程中計算量大計算復雜的過程分為以下幾個模塊:
1) 熵解碼模塊:熵解碼是針對AVS視頻編碼過程采用的熵編碼的反過程。熵編碼采用的預計統計科學的一種編碼方法,它能夠有效的降低編碼碼長。AVS視頻流中所有的碼流都是經過熵編碼的數據,因此熵解碼的過程計算量大,計算過程也比較復雜,因此需要硬件解碼來實現。
2) 幀內預測模塊:AVS視頻標準中,幀內預測用于解碼采用幀內編碼方法的幀,幀內預測是采用幀內圖像的空間相關性進行編碼的一種方法。幀內預測分為求參考樣本、求預測模式、計算三步。預測模式又分為5種預測模式,每種預測模式是針對幀圖像中的像素來計算的,而且每種預測模式的計算方法計算復雜。考慮AVS標清視頻720p的每幀圖像720x576的分辨率,就可以清楚的知道計算量的大小。
3) 幀間預測模塊:相對于幀內預測,幀間預測是采用前后相鄰幀之間的時間相關性來進行編碼的,它的計算量更大,復雜性更高,這是任何一個音視頻硬件解碼器中必須實現的一個模塊。
4) IDCT變換模塊:AVS中IDCT變換,即整數離弦變換,定義如下:
先對變換系數矩陣進行如下水變換
H'= CoeffMatrix ×T8T
T8是8×8反變換矩陣,T8T是T8的轉置矩陣,H'表示水變換后的中間結果,T8定義參加AVS標準。矩陣H''的元素h''ij計算如下:
h''ij = (Clip3(-215, 215-1, (h'ij+4))) >> 3 i,j = 0~7
再對矩陣H'進行如下垂直反變換:
H = T8×H''
其中,H表示反變換后的8×8矩陣。最后,殘差樣值矩陣ResidueMatrix的元素rij計算:
rij = (Clip3(-215, 215-1, (hij + 26))) >> 7i,j = 0~7 hij是H矩陣的元素。
對于8×8的殘差樣本矩陣,IDCT變換需要2次矩陣乘法,矩陣相乘需要512次乘法448次加法,總共需要1024次乘法896次加法,對于這樣的計算量,顯然在嵌入式設備上用軟件實現是無法滿足實時解碼的,因此需要硬件實現。
5) 濾波模塊:由于AVS編碼過程中是按照8x8的模塊進行預測編碼的,因此在模塊之間的邊緣會出現變化明顯的邊界,因此需要對解碼后的模塊進行濾波。AVS解碼過程濾波主要分為求邊界濾波強度和計算兩步,這兩步的運算也是針對像素級別的運算,因此也需要大量的計算,也需要硬件來實現。
6) AVS硬件解碼器的總體架構:根據以上的分析,設計出如圖2的硬件解碼器的方案。
SoC是一個完整的系統,因此也包含了CPU,主要用于軟件部分的運行。其中程序存儲模塊包括程序存儲器(ROM實現)和程序運行內存(RAM),通過該部分可以對硬件解碼器進行升級,因此增加了解碼器的靈活性。片外接口用于嵌入式系統與硬件解碼器的通信,由于嵌入式的多樣性,因此該模塊不能通用,需要針對特定的嵌入式系統進行開發。
圖2中的各個模塊通過片內總線連接在一起,形成了一個完整的系統。片內總線目前主要有ARM公司開發的AMBA總線,Altera公司開發的Avalon總線以及開源的Wishbone總線,前兩個總線是專有的,因此使用這個總線是需要繳納專利費用的,而后者是開源的免費總線。具體的總線的實現可以按照不同的場合自由選擇。
3 總結
本論文開展了一種面向嵌入式設備的SoC架構的AVS硬件解碼器設計方案的研究。該設計方案能夠有效的加快AVS解碼器的設計實現,而且靈活性高,可擴展性強,IP核能夠重復應用在各種不同的AVS解碼器架構上,有效的利用現有資源進行開發。
參考文獻
[1] 國家數字音視頻解碼技術標準工作組.AVS視頻AVS-P2視頻標準[S].
中圖分類號:TN949.199文獻標識碼:B
The Design of a Kind of Sending Card for LED Display
DING Tie-fu1,2, YAN Fei2, WANG Rui-guang1,2, ZHENG Xi-feng1,2
(1. Changchun xida Electronic Technology Co., Ltd., Changchun Jilin 130103, China;
2. Institute of Optics, Fine Mechanics and Physics, Changchun, CAS, Changchun Jilin 130033, China)
Abstract: This article discusses a no-storage sending card for full-color LED display system. The system has real-time transmission and cost advantages. The entire real-time lossless video images, such as the formats of 1,024×768@60Hz and 1,280×1024@60Hz, can be transmitted by two-way Gigabit Ethernet port.
Keywords: full-color LED display; sending card; memory device; real-time transmission
引言
隨著全彩LED顯示屏的應用越來越廣泛,人們對LED顯示屏控制系統的要求越來越高,這也促使LED顯示屏控制系統的不斷升級和改造,主要體現在提高性能和節約成本上。LED顯示屏控制系統的組成一般有如下幾個部分[1-3]:視頻發送裝置、視頻接收分配裝置、LED面板。顯然,作為前端的視頻發送裝置在整個環節中起著舉足輕重的作用。
1LED顯示屏發送卡的現狀
LED顯示屏發送卡一般由DVI模塊、FPGA控制器、外存儲體模塊和網絡輸出模塊構成[4],FPGA將輸入的圖像數據交替寫入外存儲體,同時也從外存儲體中交替讀出圖像數據,再通過網絡格式依次將數據輸出,原理框圖如圖1所示。
通常,控制LED顯示屏的計算機的分辨率設置為1,024×768@60Hz或者1,280×1,024@60Hz。對于1,280×1,024@60Hz的實時視頻源,總的數據量為:
1,280×1,024×60×24=1,887,436,800 bit;
其中一幀的數據量為:1,280×1,024×24=31,457,280 bit。
考慮到分辨率為1,280×1,024@60Hz時的像素時鐘為108MHz,并且整個實現過程需要2倍的存儲空間進行乒乓操作,故通常采用兩片32位寬的SDRAM作為外接存儲體。
帶有外接存儲體的發送卡具有緩存一幀數據的能力,并將輸出與輸入隔離開,有利于從全屏的數據中按照不同需求截取所需數據進行處理。
但同時,滯后一幀數據也是實時傳輸中的一個缺點,尤其是在需要嚴格實時傳輸的場合。另外,增加兩片SDRAM也給設計增加了成本。
2無外接存儲體發送卡的實現
2.1基本框圖
在現有LED顯示屏發送卡的基礎上,這里設計了一種無外接存儲體的LED顯示屏發送卡,如圖2所示,該發送卡由DVI模塊、FPGA控制器、兩路千兆網輸出模塊構成。DVI解碼芯片將解碼得到的數據和控制信號傳給FPGA控制器,FPGA通過內部的RAM進行緩存,并做了更換時鐘域和位寬變換的操作,然后將處理后的數據通過千兆網輸出。
對1,280×1,024@60Hz的實時視頻源,這里采用垂直分區的方法,即將滿屏數據平均分成兩路千兆網輸出,每一路千兆傳輸640×1,024,如圖3所示。
2.2實現方法
由圖2的基本框圖看出,該發送卡的設計除了搭建好硬件平臺外,最重要的是FPGA控制器內部程序的設計。無外接存儲體發送卡的FPGA控制器內部原理框圖如圖4所示。
FPGA控制器的內部邏輯包括數據輸入模塊、雙口RAM及其控制模塊、24bit轉8bit模塊、千兆網輸出模塊。數據輸入模塊將輸入的DVI信號(包括數據、時鐘、使能、行場同步信號)分配給后端的RAM和RAM控制模塊,并控制著整個系統的同步;RAM控制模塊控制RAM的讀寫操作,尤其是對開始寫、寫停、開始讀、讀停這4個狀態的控制;從RAM輸出的數據經過并串轉換后傳輸給千兆網輸出模塊,千兆網輸出模塊則按照一定的網絡格式將接收到的數據進行打包輸出[5-7]。
圖3提到的將數據分區發送,該方法能夠將滿屏數據平均分成兩路千兆網輸出。以下就以垂直分區的方法分析其數據流向、時鐘變化和傳輸時間差。
對于一路千兆網數據而言,采用1個雙口RAM設計,RAM的深度設置為640,輸入和輸出字長均設置為24bit,讀寫時鐘和使能分別獨立,如圖5所示。
其中,數據輸入和寫時鐘分別為DVI解碼芯片解碼后的24bit圖像數據DVI_DATA[23:0]和時鐘WRAM_CLK,讀RAM的時鐘為千兆網時鐘RMII_CLK(125M)三分頻后得到的時鐘RRAM_CLK(41.66MHz),這樣,后端再通過一個24bit轉8bit模塊即可將數據進行實時傳輸。
如圖6所示,通過RRAM_CLK(41.66MHz)時鐘從RAM中讀出一個像素的數據,然后再通過3個RMII_CLK(125M)傳輸給千兆網,即做了一個實時的并串轉化。如此流水操作下去,當從RAM中讀完640個像素時,千兆網控制模塊將停止讀RAM操作,等待下一行數據的到來。當DVI解碼后的下一行數據一旦往RAM中存儲的時候(至少已經往其中存儲了1個像素),千兆網控制模塊又開始從RAM中讀取數據,如此循環,直到第1,024行數據的640個像素數據被傳輸完。
在這里,實時傳輸具有如下特點:(1)往RAM中存數據和從RAM中取數據同時進行;(2)存RAM的速度快,讀RAM的速度慢;(3)對寫RAM操作,先把規定的數據存完,用時為t1,然后進入等待階段t2(t = t1 + t2為行周期);對讀RAM操作,把存好數通過t3的時間傳輸出去,必須滿足t3 < t。
標準的1,280×1,024@60Hz的行時鐘為64KHz,周期為t=15.625μs;而從RAM中讀完半行像素(640個)數據的時間是:t3=(1/41.66MHz)×640=15.36μs。
顯然,在一個行周期里,只往外傳出半行的數據,傳輸時間差t-t3=265ns>0,且該時間差滿足千兆網傳輸所必需數據包間隔。
由于寫RAM的時鐘(108MHz)比讀RAM的時鐘(41.66MHz)快得多,所以在寫RAM的同時可以對RAM進行讀操作(至少已經往RAM存儲了1個像素),邊寫邊讀,實現了視頻數據的實時傳輸。
同理,另外一路的千兆網設計與此雷同。
3 結論
本文簡單分析了LED顯示屏發送卡的現狀,著重討論了無外接存儲體發送卡的系統構成及實現方法。該系統具有實時傳輸、節約成本的優勢,能夠在常用的視頻格式下,比如1,024×768@60Hz、1,280×1,024@60Hz,通過兩路千兆網口將整個視頻圖像實時無損的傳輸出去。
參考文獻:
[1] 武 斌. LED全彩屏的系統設計[D]. 碩士學位論文. 北京:北京航空航天大學,2002.
[2] 李 晟. 基于FPGA的LED顯示屏同步控制系統的設計[D]. 碩士學位論文. 南京:東南大學電子工程系,2004.
[3] 蔡江洪. 全彩色LED顯示屏控制系統的設計與實現[D]. 碩士學位論文. 南京:東南大學電子工程系,2005.
[4] 蘇晶國. 基于FPGA的對象存儲控制器原型的硬件設計與實現[D]. 中國優秀碩士學位論文全文數據庫,2008(05).
[5] 柳利軍,熊良芳. 基于FPGA的千兆以太網交換芯片的設計[J]. 微電子學與計算機,2006(03).
森林火災是一種突發性強、破壞性大、救助困難的自然災害。做好森林防火工作,有效預防和撲救森林火災,是確保人民生命財產安全的迫切需要.當森林發生火災時,只有做到早發現、早解決,才能把損失降到最小。針對我國森林防火的實際需要,專門設計了一整套森林防火的解決方案。
1 系統設計
系統設計圖,如圖1所示。
1.1 圖像傳輸設備的選擇及技術參數
模擬圖像傳輸系統采用調頻體制,信號帶寬27MHz。為了保證信號之間互不干擾,兩路信號中心頻率間隔應大于38MHz。目前國產模擬圖像傳輸系統主要有L波段、S波段、Ku波段幾種,頻率范圍分別為:L波段:950~1750MHz;S波段:2200~2700MHz;Ku波段:11~13GHz。
如果以38MHz頻率間隔計算,各頻段可同時傳輸的最多路數分別為:L波段:21路;S波段:13路;Ku波段:50路。
本系統共需同時傳輸15路圖像信號,L波段利用頻率復用技術可以做到30路圖像傳輸,從系統要求整體設備性能及造價來考慮,選擇L波段。微波傳輸需滿足視距傳輸條件,即監控點至控制中心傳輸路徑上無遮擋(收發天線間可視)。
該系統方便安裝,傳輸圖像鮮明,主要是利用微波頻段傳輸,包括報警信號、伴音和視頻。
微波圖像傳輸系統:主要技術指標:頻段:L波段950~1750MHz、KU波段11~13GHz;功率:10~40dBm;
微波工程接收機技術指標:輸入頻率: 950-2050MHz;輸入阻抗:75Ω;輸入電平:-65-- -35dBm;中頻帶寬:27MHz;噪聲門限:6dB典型值;視頻制式:PAL;去加重:CCIR405-1 625行;視頻輸出:1V峰-峰值;頻率響應:+1- -2dB(10KHz-5MHz);工作電壓: AC150V-AC270V;功耗:15W;LNA電源:18V/100mA。
1.2 無線指令遙控系統
無線遙控是指實現對被控目標的非接觸遙遠控制,在工業控制、航空航天、家電領域應用廣泛。我們設計的系統提供的數據接口,以適應各種協儀。由發射和接收部分組成,可以控制云臺、鏡頭。
2 原理設計
如圖2所示。
2.1 功能簡述
在森林內多個地點放攝像機,通過無線發射C(帶煙傳感接收)發射各種信號,接收機能夠看到森林中各個監控點的實時狀況。
前端指令機能接收到監控點發出的指令,解碼器來執行中心的指令,控制云平臺左右上下的轉動,以及對鏡頭進行長焦、短焦的改變等。
2.2 控制原理
2.2.1 無線圖像傳輸的過程
無線圖像傳輸頻率復用采用分割方式,圖像通道采用微波點對點的方式。攝像機通過采集的視頻信號輸送給發射機,然后輸出給天線,以微波的無線形式傳送給監控設備的天線,接收設備接收到信號了以后,再經過解調還原視頻信號,這樣就可以有確盤錄像機中顯示圖像了。
在實際使用的微波通信線路中,總是使用方向性非常強的天線,并把收、發天線對準,以使接收端收到較強的直射波。但是,由于受天線的方向性所限,總會有一部分電磁波透射到地表面,經地表面反射后到達收信端的天線,或散射進入太空;其次,由于大氣層中存在不均勻的氣體,也會造成電磁波的折射和吸收,損失掉一部分能量;另外,由于微波無法穿過傳輸線路上的固體物,所以,在傳輸路線上的固體物,特別是高大的建筑物,就會使微波造成繞射和電平損耗。因此,微波通信既有直線傳輸特性,又有多徑傳輸特性,在無遮擋的情況下,傳輸距離可達70公里。廣泛用于公安、武警、消防、交通、金融、油田、廠礦等領域的遠距離無線監控系統。
2.2.2 無線指令控制的過程
控制通道采用碼分多址、一對多點方式。指令信號通過主機輸入指令參數,再通過發射天線發射到森林中的各個監控點中,監控點接收到主機發射過來的信號,先通過校驗,再通過無線指令接收機解調出控制數據給解碼器,解碼器再根據地址碼來判斷是否解碼,同時具備雙向語音功能,可以適時對話。
3 結束語
實驗證明:通過采用硬盤錄像系統,進行實時錄象,上級領導可以通過聯網的計算機進行遠程監控并查詢錄像資料,能真實記錄火災發生及救火的過程,提供有效真實的資料,其性能可靠;高清晰、高畫質,成為技術先驅。
參考文獻
[1]杜建華,張認成.火災探測器的研究現狀與發展趨勢[J].消防技術,2004(07):10-15.
[2]徐春燕.火災探測技術的發展及其應用[J].鞍鋼技術,2000(09):60-62.
[3]花鐵森.消防報警產品和系統的技術現狀與市場[J].安防科技,2003(06):4-12.
[4]祁勇.火災自動探測技術的發展和今后的方向[J].消防技術與產品信息,2002(04):3-4.
[5]謝磊.基于ZigBee的倉庫數據采集傳輸管理系統研究[D].西安:西安工業大學[碩士學位論文],2011.
[6]李志華.基于無線傳感器網絡的火災預警系統設計[D].汕頭:汕頭大學[碩士學位論文],2009.
[7]顏學義.基于ZigBee的智能火災報警系統[D].長沙:國防科學技術大學[碩士學位論文],2008.
[8]吳起,蔣軍成.基于BP神經網絡技術的實驗數據分析處理[J].中國安全科學報,2006,16(01):39-43.
[9]田亞.基于ZigBee無線傳感器網絡系統設計和實現[D].上海:同濟大學[碩士學位論文],2007.
作者簡介
壹、前言
由於科技日新月異,印刷已由傳統印刷走向數位印刷。在數位化的過程中,影像的資料一直有檔案過大的問題,占用記憶體過多,使資料在傳輸上、處理上都相當的費時,現今個人擁有TrueColor的視訊卡、24-bit的全彩印表機與掃描器已不再是天方夜譚了,而使用者對影像圖形的要求,不僅要色彩繁多、真實自然,更要搭配多媒體或動畫。但是相對的高畫質視覺享受,所要付出的代價是大量的儲存空間,使用者往往只能眼睜睜地看著體積龐大的圖檔占掉硬碟、磁帶和光碟片的空間;美麗的圖檔在親朋好友之間互通有無,是天經地義的事,但是用網路傳個640X480TrueColor圖形得花3分多鐘,常使人哈欠連連,大家不禁心生疑慮,難道圖檔不能壓縮得更小些嗎?如此報業在傳版時也可更快速。所以一種好的壓縮格式是不可或缺的,可以使影像所占的記憶體更小、更容易處理。但是目前市場上所用的壓縮模式,在壓縮的比率上并不理想,失去壓縮的意義。不然就是壓縮比例過大而造成影像失真,即使數學家與資訊理論學者日以繼夜,卯盡全力地為lossless編碼法找出更快速、更精彩的演算法,都無可避免一個尷尬的事實:壓縮率還是不夠好。再說用來印刷的話就造成影像模糊不清,或是影像出現鋸齒狀的現象。皆會造成印刷輸出的問題。影像壓縮技術是否真的窮途末路?請相信人類解決難題的潛力是無限的。既然舊有編碼法不夠管用,山不轉路轉,科學家便將注意力移轉到WAVELET轉換法,結果不但發現了滿意的解答,還開拓出一條光明的坦途。小波分析是近幾年來才發展出來的數學理論。小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處。可達到完全不失真,壓縮的比率也令人可以接受。由於其數學理論早在1960年代中葉就有人提出了,而到現在才有人將其應用於實際上,其理論仍有相當大的發展空間,而其實際運用也屬剛起步,其後續發展可說是不可限量。故研究的動機便由此而生。
貳、WAVELET的歷史起源
WAVELET源起於JosephFourier的熱力學公式。傅利葉方程式在十九世紀初期由JosephFourier(1768-1830)所提出,為現代信號分析奠定了基礎。在十九到二十世紀的基礎數學研究領域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發展出來的數學理論為傅利葉方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波規范正交基。其後1984年,法國地球物理學J.Morlet在分析地震波的局部性質時,發現傳統的傅利葉轉換,難以達到其要求,因此引進小波概念於信號分析中,對信號進行分解。隨後理論物理學家A.Grossman對Morlet的這種信號根據一個確定函數的伸縮,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展開的可行性進行了研究,為小波分析的形成開了先河。
1986年,Y.Meyer建構出具有一定衰減性的光滑函數Ψj,k(x),其二進制伸縮與平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構成L2(R)的規范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構了小波函數的構造及信號按小波轉換的分解及重構。1988年Daubechies建構了具有正交性(Orthonormal)及緊支集(CompactlySupported);及只有在一有限區域中是非零的小波,如此,小波分析的系統理論得到了初步建立。
三、WAVELET影像壓縮簡介及基礎理論介紹
一、WAVELET的壓縮概念
WAVELET架在三個主要的基礎理論之上,分別是階層式邊碼(pyramidcoding)、濾波器組理論(filterbanktheory)、以及次旁帶編碼(subbandcoding),可以說wavelettransform統合了此三項技術。小波轉換能將各種交織在一起的不同頻率組成的信號,分解成不相同頻率的信號,因此能有效的應用於編碼、解碼、檢測邊緣、壓縮數據,及將非線性問題線性化。良好的分析局部的時間區域與頻率區域的信號,彌補傅利葉轉換中的缺失,也因此小波轉換被譽為數學顯微鏡。
WAVELET并不會保留所有的原始資料,而是選擇性的保留了必要的部份,以便經由數學公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲存(跟波長與頻率有關)。以較少的資料代替原來的資料,達到壓縮資料的目的,這種經由取舍資料而達到壓縮目地的作法,是近代數位影像編碼技術的一項突破。即是WAVELET的概念引入編碼技術中。
WAVELET轉換在數位影像轉換技術上算是新秀,然而在太空科技早已行之有年,像探測衛星和哈柏望遠鏡傳輸影像回地球,和醫學上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現的效果。
以往lossless的編碼法只著重壓縮演算法的表現,將數位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。將數位化的影像資料轉換成利於編碼的資料型態,控制解碼後影像的品質,選擇適當的編碼法,而且還在擷取圖形資料時,先幫資料「減肥。如此才是WAVELET編碼法主要的觀念。
二、影像壓縮過程
原始圖形資料色彩模式轉換&n
bsp;DCT轉換量化器編碼器編碼結束
三、編碼的基本要素有三點
(一)一種壓縮/還原的轉換可表現在影像上的。
(二)其轉換的系數是可以量化的。
(三)其量化的系數是可以用函數編碼的。
四、現有WAVELET影像壓縮工具主要的部份
(一)WaveletTransform(WAVELET轉換):將圖形均衡的分割成任何大小,最少壓縮二分之一。
(二)Filters(濾鏡):這部份包含WaveletTransform,和一些著名的壓縮方法。
(三)Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內插量化,對編碼的架構有一定的影響。
(四)EntropyCoding(熵編碼器):有兩種格式,一種是使其減少,一種為內插。
(五)ArithmeticCoder(數學公式):這是建立在AlistairMoffat''''slineartimecodinghistogram的基礎上。
(六)BitAllocation(資料分布):這個過程是用整除法有效率的分配任何一種量化。
肆、WAVELET影像壓縮未來的發展趨勢
一、在其結構上加強完備性。
二、修改程式,使其可以處理不同模式比率的影像。
三、支援更多的色彩。可以處理RGB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。
四、加強運算的能力,使其可支援更多的影像格式。
五、使用WAVELET轉換藉由消除高頻率資料增加速率。
六、增加多種的WAVELET。如:離散、零元樹等。
七、修改其數學編碼器,使資料能在數學公式和電腦的位元之間轉換。
八、增加8X8格的DCT模式,使其能做JPEG的壓縮。
九、增加8X8格的DCT模式,使其能重疊。
十、增加trelliscoding。
十一、增加零元樹。
現今已有由中研院委托國內學術單位研究,也有不少的研究所的碩士。國外更是如火如荼的展開研究。相信實際應用於實務上的日子指日可待。
伍、影像壓縮研究的方向
1.輸入裝置如何捕捉真實的影像而將其數位化。
2.如何將數位化的影像資料轉換成利於編碼的資料型態。
3.如何控制解碼影像的品質。
4.如何選擇適當的編碼法。
5.人的視覺系統對影像的反應機制。
小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處。
陸、在印刷輸出的應用
WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續發展潛力無窮,尤其在網路出版方面,其利用價值更高,WAVELET的出現就猶如當時的JPEG出現,在影像的領域中掀起一股旋風,但是WAVELET卻有JPEG沒有的優點,JPEG乃是失真壓縮,且解碼後復原程度有限,能在網路應用,乃是由於電腦的解析度并不需要太高,就可辨識其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價值。
有一點必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數位印刷上。等到WAVELET的應用成熟,再發展其適用的RIP,又是一段時間以後的事了。
在網路出版上已經有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測試版,可是以後會在網路上大量使用,應該是未來的趨勢。對於網路出版應該是一陣不小的沖擊。
圖像壓縮的好處是在於資料傳輸快速,減少網路的使用費用,增加企業的利潤,由於傳版的時間減少,也使印刷品在當地印刷的可能性增高,減少運費,減少開支,提高時效性,創造新的商機。
柒、結論
WAVELET的理論并不是相當完備,但是據現有的研究報告顯現,到普及應用的階段,還有一段距離。但小波分析在信號處理、影像處理、量子物理及非線性科學領域上,均有其應用價值。國內已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會有正式的定名出現。這也顯示國內的研究速度,遠落在外國的後面,國外已成立不少相關的網站,國內僅有少數的相關論文。如此一來國內要使這種壓縮模式普及還有的等。正式使用於印刷業更是要相當時間。不過對於網路出版仍是有相當大的契機,國內仍是可以朝這一方面發展的。站在一個使用其成果的角度,印刷業界也許并不需要去了解其高深的數理理論。但是在運用上,為了要使用方便,和預估其發展趨勢,影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進者有一參考的依據,也許在不久的將來此一模式會成為主流,到時才不會手足無措。
參考文獻:
1.Geoff&nb
sp;Davis,1997,WaveletImageCompressionConstructionKit,。
2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(上),峰資訊股份有限公司。
3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(下),峰資訊股份有限公司。
4.施威銘研究室,1994,PC影像處理技術(二)圖檔壓縮續篇,旗標出版有限公司。
5.盧永成,民八十七年,使用小波轉換及其在影像與視訊編碼之應用,私立中原大學電機工程學系碩士學位論文。
6.江俊明,民八十六年,小波分析簡介,私立淡江大學物理學系碩士論文。
7.曾泓瑜、陳曜州,民八十三年,最新數位訊號處理技術(語音、影像處理實務),全欣資訊圖書。
附錄:
嵌入式零元樹小波轉換、階層式嵌入式零元樹小波轉換、階層式影像傳送及漸進式影像傳送
目前網路最常用的靜態影像壓縮模式為JPEG格式或是GIF格式等。但是利用這些格式編碼完成的影像,其資料量是不變的,其接受端必須完整地接受所有的資料量後才可以顯示出編碼端所傳送的完整影像。這個現象最常發生在利用網路連結WWW網站時,我們常常都是先接收到文字後,其網頁上的圖形才,慢慢的一小部份一小部份顯示出來,有時網路嚴重塞車,圖形只顯示一點點後就要再等非常久的時間才再有一點點顯示出來,甚至可能斷線了,使得使用者完全不知道在接收什麼圖案的圖形,無形中造成網路資源的浪費。此缺點之改善,可以使用嵌入式零元樹小波轉換(EZW)來完成。
階層式影像傳送系統的主要功能為允許不同規格之顯示裝置或解碼器可以從同一編碼器中獲得符合其要求之訊號,如此不需要對於不同的解碼器設計不同的編碼器配合利用之,進而增加了其應用的范圍,及減低了所架設系統的復雜度,也可以節省更多的設備費用。利用Shapiro所提出的嵌入式零元樹小波轉換(EZW)技術來設計階層式影像傳送系統時,其編碼的效果不是很好。主要的原因是,利用(EZW)技術所設計的編碼器是根據影像的全解析度來加以編碼的,這使得擁有不同解析度與碼率要求的解碼器,無法同時分享由編碼器所送出來的位元流。雖然可以利用同時播放(Simulcast)技術來加以克服之,但是該技術對於同一影像以不同解析度獨立編碼時,將使得共同的低通次頻帶(LowpassSubband)被重復的編碼與傳送,而產生了相當高的累贅(Redundancy)。
基於上述情況,有人將嵌入式零元樹小波轉換(EZW)技術加以修改之,完成了一個新式的階層式影像傳送系統。該技術為階層式嵌入的零元樹小波轉換(LayeredEmbeddedZerotreeWavelet,簡稱LEZW技術。這個技術使我們所設計出來的階層式影像傳送系統,可以在編碼傳送前預先指定圖層數目、每層影像的解析度與碼率。
LEZW技術是將EZW技術中的連續近似量化(SAQ)加以延伸應用之,而EZW傳統的做法是將SAQ應用於全部的小波轉換系數上。然而在LEZW技術中,從基層(BaseLayer)開始SAQ一次僅用於一個圖層(Layer)的編碼,直到最高階析度的圖層為止。當編碼的那一圖層碼率利用完時,即表示該圖層編碼完畢可以再往下一圖層編碼之。為了改善LEZW的效率,在較低圖層的SAQ結果應用於較高圖層的SAQ過程中,基於這種編碼的程序,LEZW演算法則可以在每一圖層平均碼率的限制下,重建出不同解析度的影像。因此,LEZW非常適合用於設計階層式影像傳送系統。
壹、前言
由於科技日新月異,印刷已由傳統印刷走向數位印刷。在數位化的過程中,影像的資料一直有檔案過大的問題,占用記憶體過多,使資料在傳輸上、處理上都相當的費時,現今個人擁有TrueColor的視訊卡、24-bit的全彩印表機與掃描器已不再是天方夜譚了,而使用者對影像圖形的要求,不僅要色彩繁多、真實自然,更要搭配多媒體或動畫。但是相對的高畫質視覺享受,所要付出的代價是大量的儲存空間,使用者往往只能眼睜睜地看著體積龐大的圖檔占掉硬碟、磁帶和光碟片的空間;美麗的圖檔在親朋好友之間互通有無,是天經地義的事,但是用網路傳個640X480TrueColor圖形得花3分多鐘,常使人哈欠連連,大家不禁心生疑慮,難道圖檔不能壓縮得更小些嗎?如此報業在傳版時也可更快速。所以一種好的壓縮格式是不可或缺的,可以使影像所占的記憶體更小、更容易處理。但是目前市場上所用的壓縮模式,在壓縮的比率上并不理想,失去壓縮的意義。不然就是壓縮比例過大而造成影像失真,即使數學家與資訊理論學者日以繼夜,卯盡全力地為lossless編碼法找出更快速、更精彩的演算法,都無可避免一個尷尬的事實:壓縮率還是不夠好。再說用來印刷的話就造成影像模糊不清,或是影像出現鋸齒狀的現象。皆會造成印刷輸出的問題。影像壓縮技術是否真的窮途末路?請相信人類解決難題的潛力是無限的。既然舊有編碼法不夠管用,山不轉路轉,科學家便將注意力移轉到WAVELET轉換法,結果不但發現了滿意的解答,還開拓出一條光明的坦途。小波分析是近幾年來才發展出來的數學理論。小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處。可達到完全不失真,壓縮的比率也令人可以接受。由於其數學理論早在1960年代中葉就有人提出了,而到現在才有人將其應用於實際上,其理論仍有相當大的發展空間,而其實際運用也屬剛起步,其後續發展可說是不可限量。故研究的動機便由此而生。
貳、WAVELET的歷史起源
WAVELET源起於JosephFourier的熱力學公式。傅利葉方程式在十九世紀初期由JosephFourier(1768-1830)所提出,為現代信號分析奠定了基礎。在十九到二十世紀的基礎數學研究領域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發展出來的數學理論為傅利葉方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波規范正交基。其後1984年,法國地球物理學J.Morlet在分析地震波的局部性質時,發現傳統的傅利葉轉換,難以達到其要求,因此引進小波概念於信號分析中,對信號進行分解。隨後理論物理學家A.Grossman對Morlet的這種信號根據一個確定函數的伸縮,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展開的可行性進行了研究,為小波分析的形成開了先河。
1986年,Y.Meyer建構出具有一定衰減性的光滑函數Ψj,k(x),其二進制伸縮與平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構成L2(R)的規范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構了小波函數的構造及信號按小波轉換的分解及重構。1988年Daubechies建構了具有正交性(Orthonormal)及緊支集(CompactlySupported);及只有在一有限區域中是非零的小波,如此,小波分析的系統理論得到了初步建立。
三、WAVELET影像壓縮簡介及基礎理論介紹
一、WAVELET的壓縮概念
WAVELET架在三個主要的基礎理論之上,分別是階層式邊碼(pyramidcoding)、濾波器組理論(filterbanktheory)、以及次旁帶編碼(subbandcoding),可以說wavelettransform統合了此三項技術。小波轉換能將各種交織在一起的不同頻率組成的信號,分解成不相同頻率的信號,因此能有效的應用於編碼、解碼、檢測邊緣、壓縮數據,及將非線性問題線性化。良好的分析局部的時間區域與頻率區域的信號,彌補傅利葉轉換中的缺失,也因此小波轉換被譽為數學顯微鏡。
WAVELET并不會保留所有的原始資料,而是選擇性的保留了必要的部份,以便經由數學公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲存(跟波長與頻率有關)。以較少的資料代替原來的資料,達到壓縮資料的目的,這種經由取舍資料而達到壓縮目地的作法,是近代數位影像編碼技術的一項突破。即是WAVELET的概念引入編碼技術中。
WAVELET轉換在數位影像轉換技術上算是新秀,然而在太空科技早已行之有年,像探測衛星和哈柏望遠鏡傳輸影像回地球,和醫學上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現的效果。
以往lossless的編碼法只著重壓縮演算法的表現,將數位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。將數位化的影像資料轉換成利於編碼的資料型態,控制解碼後影像的品質,選擇適當的編碼法,而且還在擷取圖形資料時,先幫資料「減肥。如此才是WAVELET編碼法主要的觀念。
二、影像壓縮過程
原始圖形資料色彩模式轉換&n
bsp;DCT轉換量化器編碼器編碼結束
三、編碼的基本要素有三點
(一)一種壓縮/還原的轉換可表現在影像上的。
(二)其轉換的系數是可以量化的。
(三)其量化的系數是可以用函數編碼的。
四、現有WAVELET影像壓縮工具主要的部份
(一)WaveletTransform(WAVELET轉換):將圖形均衡的分割成任何大小,最少壓縮二分之一。
(二)Filters(濾鏡):這部份包含WaveletTransform,和一些著名的壓縮方法。
(三)Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內插量化,對編碼的架構有一定的影響。
(四)EntropyCoding(熵編碼器):有兩種格式,一種是使其減少,一種為內插。
(五)ArithmeticCoder(數學公式):這是建立在AlistairMoffat''''slineartimecodinghistogram的基礎上。
(六)BitAllocation(資料分布):這個過程是用整除法有效率的分配任何一種量化。
肆、WAVELET影像壓縮未來的發展趨勢
一、在其結構上加強完備性。
二、修改程式,使其可以處理不同模式比率的影像。
三、支援更多的色彩。可以處理RGB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。
四、加強運算的能力,使其可支援更多的影像格式。
五、使用WAVELET轉換藉由消除高頻率資料增加速率。
六、增加多種的WAVELET。如:離散、零元樹等。
七、修改其數學編碼器,使資料能在數學公式和電腦的位元之間轉換。
八、增加8X8格的DCT模式,使其能做JPEG的壓縮。
九、增加8X8格的DCT模式,使其能重疊。
十、增加trelliscoding。
十一、增加零元樹。
現今已有由中研院委托國內學術單位研究,也有不少的研究所的碩士。國外更是如火如荼的展開研究。相信實際應用於實務上的日子指日可待。
伍、影像壓縮研究的方向
1.輸入裝置如何捕捉真實的影像而將其數位化。
2.如何將數位化的影像資料轉換成利於編碼的資料型態。
3.如何控制解碼影像的品質。
4.如何選擇適當的編碼法。
5.人的視覺系統對影像的反應機制。
小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處。
陸、在印刷輸出的應用
WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續發展潛力無窮,尤其在網路出版方面,其利用價值更高,WAVELET的出現就猶如當時的JPEG出現,在影像的領域中掀起一股旋風,但是WAVELET卻有JPEG沒有的優點,JPEG乃是失真壓縮,且解碼後復原程度有限,能在網路應用,乃是由於電腦的解析度并不需要太高,就可辨識其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價值。
有一點必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數位印刷上。等到WAVELET的應用成熟,再發展其適用的RIP,又是一段時間以後的事了。
在網路出版上已經有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測試版,可是以後會在網路上大量使用,應該是未來的趨勢。對於網路出版應該是一陣不小的沖擊。
圖像壓縮的好處是在於資料傳輸快速,減少網路的使用費用,增加企業的利潤,由於傳版的時間減少,也使印刷品在當地印刷的可能性增高,減少運費,減少開支,提高時效性,創造新的商機。
柒、結論
WAVELET的理論并不是相當完備,但是據現有的研究報告顯現,到普及應用的階段,還有一段距離。但小波分析在信號處理、影像處理、量子物理及非線性科學領域上,均有其應用價值。國內已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會有正式的定名出現。這也顯示國內的研究速度,遠落在外國的後面,國外已成立不少相關的網站,國內僅有少數的相關論文。如此一來國內要使這種壓縮模式普及還有的等。正式使用於印刷業更是要相當時間。不過對於網路出版仍是有相當大的契機,國內仍是可以朝這一方面發展的。站在一個使用其成果的角度,印刷業界也許并不需要去了解其高深的數理理論。但是在運用上,為了要使用方便,和預估其發展趨勢,影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進者有一參考的依據,也許在不久的將來此一模式會成為主流,到時才不會手足無措。
參考文獻:
1.Geoff&nb
sp;Davis,1997,WaveletImageCompressionConstructionKit,。
2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(上),峰資訊股份有限公司。
3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(下),峰資訊股份有限公司。
4.施威銘研究室,1994,PC影像處理技術(二)圖檔壓縮續篇,旗標出版有限公司。
5.盧永成,民八十七年,使用小波轉換及其在影像與視訊編碼之應用,私立中原大學電機工程學系碩士學位論文。
6.江俊明,民八十六年,小波分析簡介,私立淡江大學物理學系碩士論文。
7.曾泓瑜、陳曜州,民八十三年,最新數位訊號處理技術(語音、影像處理實務),全欣資訊圖書。
附錄:
嵌入式零元樹小波轉換、階層式嵌入式零元樹小波轉換、階層式影像傳送及漸進式影像傳送
目前網路最常用的靜態影像壓縮模式為JPEG格式或是GIF格式等。但是利用這些格式編碼完成的影像,其資料量是不變的,其接受端必須完整地接受所有的資料量後才可以顯示出編碼端所傳送的完整影像。這個現象最常發生在利用網路連結WWW網站時,我們常常都是先接收到文字後,其網頁上的圖形才,慢慢的一小部份一小部份顯示出來,有時網路嚴重塞車,圖形只顯示一點點後就要再等非常久的時間才再有一點點顯示出來,甚至可能斷線了,使得使用者完全不知道在接收什麼圖案的圖形,無形中造成網路資源的浪費。此缺點之改善,可以使用嵌入式零元樹小波轉換(EZW)來完成。
階層式影像傳送系統的主要功能為允許不同規格之顯示裝置或解碼器可以從同一編碼器中獲得符合其要求之訊號,如此不需要對於不同的解碼器設計不同的編碼器配合利用之,進而增加了其應用的范圍,及減低了所架設系統的復雜度,也可以節省更多的設備費用。利用Shapiro所提出的嵌入式零元樹小波轉換(EZW)技術來設計階層式影像傳送系統時,其編碼的效果不是很好。主要的原因是,利用(EZW)技術所設計的編碼器是根據影像的全解析度來加以編碼的,這使得擁有不同解析度與碼率要求的解碼器,無法同時分享由編碼器所送出來的位元流。雖然可以利用同時播放(Simulcast)技術來加以克服之,但是該技術對於同一影像以不同解析度獨立編碼時,將使得共同的低通次頻帶(LowpassSubband)被重復的編碼與傳送,而產生了相當高的累贅(Redundancy)。
基於上述情況,有人將嵌入式零元樹小波轉換(EZW)技術加以修改之,完成了一個新式的階層式影像傳送系統。該技術為階層式嵌入的零元樹小波轉換(LayeredEmbeddedZerotreeWavelet,簡稱LEZW技術。這個技術使我們所設計出來的階層式影像傳送系統,可以在編碼傳送前預先指定圖層數目、每層影像的解析度與碼率。
LEZW技術是將EZW技術中的連續近似量化(SAQ)加以延伸應用之,而EZW傳統的做法是將SAQ應用於全部的小波轉換系數上。然而在LEZW技術中,從基層(BaseLayer)開始SAQ一次僅用於一個圖層(Layer)的編碼,直到最高階析度的圖層為止。當編碼的那一圖層碼率利用完時,即表示該圖層編碼完畢可以再往下一圖層編碼之。為了改善LEZW的效率,在較低圖層的SAQ結果應用於較高圖層的SAQ過程中,基於這種編碼的程序,LEZW演算法則可以在每一圖層平均碼率的限制下,重建出不同解析度的影像。因此,LEZW非常適合用於設計階層式影像傳送系統。
引言
智能家居控制系統以家居電器及家電設備為主要控制對象,利用綜合布線技術、網絡通信技術、安全防范技術、自動控制技術、音視頻技術將家居生活有關的設施進行高效集成,構建高效的住宅設施與家庭日程事務的控制管理系統,提升家居智能、安全、便利、舒適,并實現環保控制系統平臺。其中家居電器控制采用弱電控制強電方式,既安全又智能,可以用遙控、定時等多種智能控制方式實現對在家里飲水機、插座、空調、地暖、投影機、音像設備以及新風系統等進行智能控制,用以避免飲水機在夜晚反復加熱影響水質,在外出時斷開插排通電,避免電器發熱引發安全隱患等等。本系統設計正是在這樣的背景下產生,并以家居音頻設備為控制對象。整個系統的設計是通過隨身攜帶的智能手機利用無線網絡和家庭無線路由對嵌入式ARM為核心的音樂播放器進行遠程操控。下文是對整個系統的設計原理和設計過程的詳細論述。
一、總體方案設計
整個系統由智能手機、路由器、開發板三個部分組成。智能手機通過連接無線信號實現與開發板的通信,這里由于所使用的mini2440開發板缺少無線網卡的支持,所以路由器充當了無線網卡的作用,負責發射無線信號:
1.1 硬件方案
硬件平臺選用友善之臂提供的mini2440開發板,處理器采用基于ARM9內核的Samsung S3C2440。由于S3C2440內部配有64M SDRAM,256M NandFlash,所以完全可以勝任內部的音頻解碼任務。另外,為了保證系統運行時的穩定性,采用了專業的CPU內核電源芯片和復位芯片。相對來說,手機的選擇比較自由,只要是安卓系統的智能手機都可以,在APP測試時,要求手機的安卓操作系統是Android2.3版本或以上。
1.2軟件方案
要將硬件設備連接并且工作,關鍵是軟件的開發,因此軟件開發環境的選擇很重要。整個系統的軟件開發主要包括操作系統的裁剪和移植、音頻播放程序的開發、Android應用的開發三個部分。音頻解碼采用軟件解碼。主要是利用CPU進行音頻數據的解碼,這需要在Linux操作系統下移植一個開源音頻解碼庫--madplay。采用軟件解碼雖然增加了CPU的開銷,但大大縮短了開發時間,而且不需要考慮解碼芯片的選擇和驅動問題。
智能手機選用了安卓的操作系統,主要考慮到安卓系統是一種基于Linux的自由及開放源代碼的操作系統,且市場占有量較高,2011年第一季度,Android在全球的市場份額首次超過塞班系統,躍居全球第一。 2013年的第四季度,Android平臺手機的全球市場份額已經達到78.1%,全世界采用這款系統的設備數量已經達到10億臺,2014年第一季度Android平臺已占所有移動廣告流量來源的42.8%,首度超越iOS(運營收入不及iOS)。
二、軟件開發
2.1 操作系統裁剪
操作系統的裁剪是系統設計的重點,一個精簡的操作系統不僅可以加快系統的開機時間,還能減小CPU的開銷,使系統運行的更加流暢。操作系統由uboot、內核、文件系統組成,需要裁剪的部分包括內核(去掉不必要的配置)以及文件系統
2.2 音頻解碼數據庫的移植
madplay是linux下的開源音樂播放器,利用開源解碼庫libmad實現音頻的編解碼,目前該播放器除了不支持網絡歌曲的播放外,其余功能都支持,如快進、暫停、繼續等。開發人員需要自己開發一個自己的可視化界面或者播放器的管理程序,這樣使用起來才方便、快捷。系統設計時需要在開發板的ARM內核上運行madplay可執行文件,所以移植madplay也是本次設計的重要環節。
2.3 音樂播放器設計
播放器的核心代碼就是音樂的播放程序,在整個行程序運行時的內部主控流程:
父進程負責接收按鍵信息或者socket信息。監聽部分由select()函數完成,當按鍵或者socket文件描述符發生變化的時候,父進程首先判斷按鍵或者socket信息,根據不同的信息向子進程或者孫進程發送不同的信號。如,父進程收到的按鍵信息是“暫停”,調用kill()函數向子進程和孫進程發送SIGSTOP信號就可以暫停音樂的播放。
2.4 Android應用程序設計
Android操作系統下設計控制軟件可簡可繁,這里的界面的設計由于缺少專業UI的支持,所以設計的比較簡單。用到的控件主要有Button、TextView、ScrollView、ListView、TabHost,其中前面4個采用常規控制,調用簡單,只需在activity_main.xml文件中調用并設置相應的屬性(如長、寬、在頁面中的位置等)即可。TabHost用起來有點麻煩,這里需要注意兩點:
在開發自己的app過程中,主要難點在于新的線程接收服務器返回的信息,其主要的代碼如下:
Android部分的設計邏輯明了,算法簡單。作為客戶端或者命令發送端,只需向服務器發送自己的指令即可。
三、性能測試
系統的運行需要開發板、路由器以及APP三者的配合,路由器和開發板之間通過網線連接。需要設置路由器和開發板在同一個網段。測試中,路由器IP為192.168.1.10,開發板IP為192.168.1.22。經測試,播放器可以通過按鍵或者APP實現歌曲切換、音量調節、歌曲信息顯示、播放模式的切換。并且經過裁剪的操作系統啟動速度快,從系統上電到程序運行僅需要20秒。
本系統設計關鍵在于操作系統的裁剪移植以及加入了手機APP的控制。省去了QT以及內核中不必要的模塊,使播放器的開機速度更加快,同時也減小了CPU的資源消耗;加入手機APP的控制,符合目前智能家居的發展趨勢,使得播放器使用起來更加的方便、人性化。
系統還存在一個問題未能很好解決。歌曲播放完畢并且切換到下一首后,手機APP測并不能實現播放曲目的更新。
目前,APP上顯示的歌曲信息只有三種情況會更新:點擊上一首或者下一首、暫停后繼續、點擊開始播放。試著修改代碼,子進程在實現共享內存更新后將歌曲信息發送給APP,但是問題來了,APP和開發板的通信是基于UDP協議,即無連接,通俗的說,每次通信過程,只有當APP發送數據給開發板,開發板收到數據后同時記下了客戶端(APP)地址信息,通過地址信息將數據返回給APP。所以如果系統上電后APP并未接入網絡,開發板發送數據時將會報錯。感興趣的讀者可以在APP發送數據給開發板后設定一個標志位,然后根據這個標志位判斷播放下一首歌曲的時候是否要將歌曲信息發送給APP。
參 考 文 獻
[1] Matt Welsh & Lar Kaufman,linux權威指南[M] 中國電力出版社 2000 年3月
壹、前言
由於科技日新月異,印刷已由傳統印刷走向數位印刷。在數位化的過程中,影像的資料一直有檔案過大的問題,占用記憶體過多,使資料在傳輸上、處理上都相當的費時,現今個人擁有True Color的視訊卡、24-bit的全彩印表機與掃描器已不再是天方夜譚了,而使用者對影像圖形的要求,不僅要色彩繁多、真實自然,更要搭配多媒體或動畫。但是相對的高畫質視覺享受,所要付出的代價是大量的儲存空間,使用者往往只能眼睜睜地看著體積龐大的圖檔占掉硬碟、磁帶和光碟片的空間;美麗的圖檔在親朋好友之間互通有無,是天經地義的事,但是用網路傳個640X480 True Color圖形得花3分多鐘,常使人哈欠連連,大家不禁心生疑慮,難道圖檔不能壓縮得更小些嗎?如此報業在傳版時也可更快速。所以一種好的壓縮格式是不可或缺的,可以使影像所占的記憶體更小、更容易處理。但是目前市場上所用的壓縮模式,在壓縮的比率上并不理想,失去壓縮的意義。不然就是壓縮比例過大而造成影像失真,即使數學家與資訊理論學者日以繼夜,卯盡全力地為lossless編碼法找出更快速、更精彩的演算法,都無可避免一個尷尬的事實:壓縮率還是不夠好。再說用來印刷的話就造成影像模糊不清,或是影像出現鋸齒狀的現象。皆會造成印刷輸出的問題。影像壓縮技術是否真的窮途末路?請相信人類解決難題的潛力是無限的。既然舊有編碼法不夠管用,山不轉路轉,科學家便將注意力移轉到WAVELET轉換法,結果不但發現了滿意的解答,還開拓出一條光明的坦途。小波分析是近幾年來才發展出來的數學理論。小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處。可達到完全不失真,壓縮的比率也令人可以接受。由於其數學理論早在1960年代中葉就有人提出了,而到現在才有人將其應用於實際上,其理論仍有相當大的發展空間,而其實際運用也屬剛起步,其後續發展可說是不可限量。故研究的動機便由此而生。
貳、 WAVELET的歷史起源
WAVELET源起於Joseph Fourier的熱力學公式。傅利葉方程式在十九世紀初期由Joseph Fourier (1768-1830)所提出,為現代信號分析奠定了基礎。在十九到二十世紀的基礎數學研究領域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發展出來的數學理論為傅利葉方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波規范正交基。其後1984年,法國地球物理學J. Morlet在分析地震波的局部性質時,發現傳統的傅利葉轉換,難以達到其要求,因此引進小波概念於信號分析中,對信號進行分解。隨後理論物理學家A.Grossman對Morlet的這種信號根據一個確定函數的伸縮,平移系 { a -1/2 Ψ[(x-b)/a] ;a,b?R ,a≠0}展開的可行性進行了研究,為小波分析的形成開了先河。
1986年,Y. Meyer建構出具有一定衰減性的光滑函數Ψj,k(x),其二進制伸縮與平移系 {Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構成L2(R)的規范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構了小波函數的構造及信號按小波轉換的分解及重構。1988年Daubechies建構了具有正交性(Orthonormal)及緊支集(Compactly Supported);及只有在一有限區域中是非零的小波,如此,小波分析的系統理論得到了初步建立。
三、 WAVELET影像壓縮簡介及基礎理論介紹
一、 WAVELET的壓縮概念
WAVELET架在三個主要的基礎理論之上,分別是階層式邊碼(pyramid coding)、濾波器組理論(filter bank theory)、以及次旁帶編碼(subband coding),可以說wavelet transform統合了此三項技術。小波轉換能將各種交織在一起的不同頻率組成的信號,分解成不相同頻率的信號,因此能有效的應用於編碼、解碼、檢測邊緣、壓縮數據,及將非線性問題線性化。良好的分析局部的時間區域與頻率區域的信號,彌補傅利葉轉換中的缺失,也因此小波轉換被譽為數學顯微鏡。
WAVELET并不會保留所有的原始資料,而是選擇性的保留了必要的部份,以便經由數學公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲存(跟波長與頻率有關)。以較少的資料代替原來的資料,達到壓縮資料的目的,這種經由取舍資料而達到壓縮目地的作法,是近代數位影像編碼技術的一項突破。即是WAVELET的概念引入編碼技術中。
WAVELET轉換在數位影像轉換技術上算是新秀,然而在太空科技早已行之有年,像探測衛星和哈柏望遠鏡傳輸影像回地球,和醫學上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現的效果。
以往lossless的編碼法只著重壓縮演算法的表現,將數位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。 將數位化的影像資料轉換成利於編碼的資料型態,控制解碼後影像的品質,選擇適當的編碼法,而且還在擷取圖形資料時,先幫資料「減肥。如此才是WAVELET編碼法主要的觀念。
二、 影像壓縮過程
原始圖形資料 色彩模式轉換 DCT轉換 量化器 編碼器 編碼結束
三、 編碼的基本要素有三點
(一) 一種壓縮/還原的轉換可表現在影像上的。
(二) 其轉換的系數是可以量化的。
(三) 其量化的系數是可以用函數編碼的。
四、 現有WAVELET影像壓縮工具主要的部份
(一) Wavelet Transform(WAVELET轉換):將圖形均衡的分割成任何大小,最少壓縮二分之一。
(二) Filters(濾鏡):這部份包含Wavelet Transform,和一些著名的壓縮方法。
(三) Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內插量化,對編碼的架構有一定的影響。
(四) Entropy Coding(熵編碼器):有兩種格式,一種是使其減少,一種為內插。
(五) Arithmetic Coder(數學公式):這是建立在Alistair Moffat's linear time coding histogram的基礎上。
(六) Bit Allocation(資料分布):這個過程是用整除法有效率的分配任何一種量化。
肆、 WAVELET影像壓縮未來的發展趨勢
一、 在其結構上加強完備性。
二、 修改程式,使其可以處理不同模式比率的影像。
三、 支援更多的色彩。可以處理RGB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。
四、 加強運算的能力,使其可支援更多的影像格式。
五、 使用WAVELET轉換藉由消除高頻率資料增加速率。
六、 增加多種的WAVELET。如:離散、零元樹等。
七、 修改其數學編碼器,使資料能在數學公式和電腦的位元之間轉換。
八、 增加8X8格的DCT模式,使其能做JPEG的壓縮。
九、 增加8X8格的DCT模式,使其能重疊。
十、 增加trellis coding。
十一、 增加零元樹。
現今已有由中研院委托國內學術單位研究,也有不少的研究所的碩士。國外更是如火如荼的展開研究。相信實際應用於實務上的日子指日可待。
伍、 影像壓縮研究的方向
1. 輸入裝置如何捕捉真實的影像而將其數位化。
2. 如何將數位化的影像資料轉換成利於編碼的資料型態。
3. 如何控制解碼影像的品質。
4. 如何選擇適當的編碼法。
5. 人的視覺系統對影像的反應機制。
小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處。
陸、 在印刷輸出的應用
WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續發展潛力無窮,尤其在網路出版方面,其利用價值更高,WAVELET的出現就猶如當時的JPEG出現,在影像的領域中掀起一股旋風,但是WAVELET卻有JPEG沒有的優點,JPEG乃是失真壓縮,且解碼後復原程度有限,能在網路應用,乃是由於電腦的解析度并不需要太高,就可辨識其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價值。
有一點必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數位印刷上。等到WAVELET的應用成熟,再發展其適用的RIP,又是一段時間以後的事了。
在網路出版上已經有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測試版,可是以後會在網路上大量使用,應該是未來的趨勢。對於網路出版應該是一陣不小的沖擊。
圖像壓縮的好處是在於資料傳輸快速,減少網路的使用費用,增加企業的利潤,由於傳版的時間減少,也使印刷品在當地印刷的可能性增高,減少運費,減少開支,提高時效性,創造新的商機。
柒、 結論
WAVELET的理論并不是相當完備,但是據現有的研究報告顯現,到普及應用的階段,還有一段距離。但小波分析在信號處理、影像處理、量子物理及非線性科學領域上,均有其應用價值。國內已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會有正式的定名出現。這也顯示國內的研究速度,遠落在外國的後面,國外已成立不少相關的網站,國內僅有少數的相關論文。如此一來國內要使這種壓縮模式普及還有的等。正式使用於印刷業更是要相當時間。不過對於網路出版仍是有相當大的契機,國內仍是可以朝這一方面發展的。站在一個使用其成果的角度,印刷業界也許并不需要去了解其高深的數理理論。但是在運用上,為了要使用方便,和預估其發展趨勢,影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進者有一參考的依據,也許在不久的將來此一模式會成為主流,到時才不會手足無措。
參考文獻
1.Geoff Davis,1997,Wavelet Image Compression Construction Kit,。
2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(上), 峰資訊股份有限公司。
3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(下), 峰資訊股份有限公司。
4.施威銘研究室,1994,PC影像處理技術(二)圖檔壓縮續篇,旗標出版有限公司。