加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

FPGA設(shè)計經(jīng)驗之圖像處理

05/06 10:40
3293
閱讀需 18 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

大俠好,歡迎來到FPGA技術(shù)江湖,江湖偌大,相見即是緣分。大俠可以關(guān)注FPGA技術(shù)江湖,在“闖蕩江湖”、"行俠仗義"欄里獲取其他感興趣的資源,或者一起煮酒言歡。

今天和大俠簡單聊一聊基于FPGA的圖像處理,之前也和各位大俠聊過相關(guān)的圖像處理,這里面也超鏈接了幾篇,具體如下:圖像邊緣檢測算法體驗步驟(Photoshop,Matlab)、算法系列:基于 FPGA 的圖像邊緣檢測系統(tǒng)設(shè)計(sobel算法)?、FPGA設(shè)計中 Verilog HDL實現(xiàn)基本的圖像濾波處理仿真,需要的可以參考一下,歡迎一起交流學(xué)習(xí)。話不多說,上貨。

使用FPGA做圖像處理優(yōu)勢最關(guān)鍵的就是:FPGA能進(jìn)行實時流水線運算,能達(dá)到最高的實時性。因此在一些對實時性要求非常高的應(yīng)用領(lǐng)域,做圖像處理基本就只能用FPGA。例如在一些分選設(shè)備中圖像處理基本上用的都是FPGA,因為在其中相機從看到物料圖像到給出執(zhí)行指令之間的延時大概只有幾毫秒,這就要求圖像處理必須很快且延時固定,只有FPGA進(jìn)行的實時流水線運算才能滿足這一要求。

所以要了解FPGA進(jìn)行圖像處理的優(yōu)勢就必須理解FPGA所能進(jìn)行的實時流水線運算和DSP,GPU等進(jìn)行的圖像處理運算有何不同。DSP,GPU,CPU對圖像的處理基本是以幀為單位的,從相機采集的圖像數(shù)據(jù)會先存在內(nèi)存中,然后GPU會讀取內(nèi)存中的圖像數(shù)據(jù)進(jìn)行處理。假如采集圖像的幀率是30幀,那么DSP,GPU要是能在1/30秒內(nèi)完成一幀圖像的處理,那基本上就能算是實時處理。

FPGA對圖像進(jìn)行實時流水線運算是以行為單位的。FPGA可以直接和圖像傳感器芯片連接獲得圖像數(shù)據(jù)流,如果是RAW格式的則還可以進(jìn)行差值以獲得RGB圖像數(shù)據(jù)。FPGA能進(jìn)行實時流水線處理的關(guān)鍵是它可以用其內(nèi)部的Block Ram緩存若干行的圖像數(shù)據(jù)。這個Block Ram可以說是類似于CPU里面的Cache,但Cache不是你能完全控制的,但Block Ram是完全可控的,可以用它實現(xiàn)各種靈活的運算處理。這樣FPGA通過緩存若干行圖像數(shù)據(jù)就可以對圖像進(jìn)行實時處理,數(shù)據(jù)就這樣一邊流過就一邊處理好了,不需要送入DDR緩存了之后再讀出來處理。

這樣的數(shù)據(jù)流處理顯然是順序讀取數(shù)據(jù)的,那么也就只能實現(xiàn)那些順序讀取數(shù)據(jù)的算法,也就是圖像處理中那一大類用3x3到NxN的算子進(jìn)行的濾波、取邊緣、膨脹腐蝕等算法??赡艽蠹視X得這些運算似乎都是最基本的圖像處理運算,只是個前端的預(yù)處理,似乎用處不大。但問題是只有FPGA做這樣的運算才是速度最快效率最高的,比如用CPU做一個取邊緣的算法根本就達(dá)不到實時。另外別小看了這種NxN算子法,它可以有各種組合和玩法,可以實現(xiàn)分選多種顏色,甚至分辨簡單形狀等功能。FPGA進(jìn)行的這種算子法處理是并行流水線算法,其延時是固定的,比如用3x3的算子進(jìn)行處理其給出結(jié)果的延時是兩行圖像的時間。還有這個算子法和現(xiàn)在卷積神經(jīng)網(wǎng)絡(luò)中最前面的卷積層運算是類似的。

FPGA中的Block Ram是重要和稀缺資源,能緩存的圖像數(shù)據(jù)行數(shù)是有限的,所以這個NxN的算子中的N不能特別大。當(dāng)然FPGA也可以接DDR把圖像緩存到其中再讀出來進(jìn)行處理,但這種處理模式就和CPU差不多了,達(dá)不到最高的實時性。其實有些我們認(rèn)為需要隨機讀取數(shù)據(jù)的圖像處理算法也是可以并行流水線化的。

在密集運算中,耽誤時間和消耗功耗的操作往往不是運算本身,而是把數(shù)據(jù)從內(nèi)存中搬來搬去。GPU,CPU在進(jìn)行運算時要把數(shù)據(jù)從內(nèi)存中取出來,算好了在放回去。這樣內(nèi)存帶寬往往成了運算速度的瓶頸,數(shù)據(jù)搬運過程中的功耗占的比重也不會小。FPGA則可以通過堆很多計算硬件的方法把要做的運算都展開,然后數(shù)據(jù)從中流過,完成一個階段的運算之后就直接流入第二個階段,不需要把一個計算階段完成后的數(shù)據(jù)再送回內(nèi)存中,再讀出來交給下一個階段的運算。這樣就會節(jié)省很多時間和功耗?,F(xiàn)在用FPGA做圖像處理就是這樣干的,比如先用一個3x3的算子進(jìn)行濾波,再用一個3x3的算子進(jìn)行取邊緣,在FPGA流水線算法中,濾波處理完了數(shù)據(jù)立即就會進(jìn)行取邊緣處理,是不需要像CPU那樣存回內(nèi)存再讀出來的。

FPGA進(jìn)行圖像處理的前景還是挺廣闊的,越來越多的工業(yè)應(yīng)用場合都要求更高的實時性,而這正是FPGA所適合的。還有機器學(xué)習(xí)領(lǐng)域,神經(jīng)網(wǎng)絡(luò)這種層狀的,不需要很隨機的讀取數(shù)據(jù)的運算是比較適合用FPGA來做的。不過FPGA不擅長浮點運算,如果能整出不需要浮點運算的神經(jīng)網(wǎng)絡(luò),那么FPGA在這方面的應(yīng)用將會更大。

前些年用matlab和opencv做圖像處理。近一段時間通過FPGA處理攝像頭視頻數(shù)據(jù),有太多感觸,復(fù)雜的算法先不提及,單是上面文章中提到的一些處理手段及策略,非常受用。

下面就幾個方面簡單列一些:

圖像處理系統(tǒng)設(shè)計注意點:

1.將算法開發(fā)和FPGA實現(xiàn)分離

軟件的圖像處理環(huán)境可以使用大批量的圖像樣本進(jìn)行測試及調(diào)試算法,再將算法映射到硬件上,這樣大大節(jié)省了硬件調(diào)試周期。

2.算法的精度

圖像處理的算法中,大部分需要采用浮點數(shù)運算,而浮點數(shù)運算在FPGA中是非常不劃算的,因此需要轉(zhuǎn)換成定點數(shù)計算,此時會設(shè)計到浮點運算轉(zhuǎn)定點運算時精度下降的問題。

3.軟件和硬件的合理劃分

這里的軟件是指DSP、CPU等等,硬件是指FPGA;一般結(jié)構(gòu)規(guī)則、計算量大的操作如sobel算子、均值濾波可以采用硬件進(jìn)行,不規(guī)則的動態(tài)可變長度循環(huán)的底層算法由軟件進(jìn)行。

圖像處理FPGA 設(shè)計基本方法:

1.陣列結(jié)構(gòu)結(jié)合流水線處理設(shè)計

例如RGB圖像,包括三組數(shù)據(jù),處理時需要并行三通道后,每個通道進(jìn)行分別的串行流水處理。

2.緩存設(shè)計

幀緩存?行緩存?列對齊

3.資源

分辨率?處理窗口?對資源影響成倍增加

基于FPGA設(shè)計框架舉例:

1、灰度直方圖統(tǒng)計

直方圖是圖像的灰度分布統(tǒng)計的一種表示方法,統(tǒng)計目標(biāo)圖像中各個灰度點的像素個數(shù),很多對于圖像的調(diào)整算法都是基于此進(jìn)行的;

如何基于FPGA進(jìn)行統(tǒng)計呢?

1)由于是統(tǒng)計圖像的直方圖,所以一定是統(tǒng)計結(jié)果會在圖像經(jīng)過之后才能產(chǎn)生,因此需要進(jìn)行緩存;

緩存一:統(tǒng)計后的結(jié)果;

緩存二:經(jīng)過統(tǒng)計處理器的圖像數(shù)據(jù),以便后面和直方圖做同步處理。

2)圖像常常用8位、24位、32位來表示一個像素的灰度值。因此,統(tǒng)計種類分別為2^8=256/2^24=16777216/2^32=4294967296,地址位寬根據(jù)此進(jìn)行選擇設(shè)定。根據(jù)不同的精度選擇不同的緩存方式:片內(nèi)或片外緩存。

3)處理流程:

首先根據(jù)當(dāng)前來的灰度值做為讀RAM地址,讀出RAM中對應(yīng)灰度值的的統(tǒng)計值;

第二步將讀出結(jié)果加一并回寫回RAM的當(dāng)前地址中;

第三步重復(fù)操作至當(dāng)前圖像處理結(jié)束;

第四步下一幅圖像到來之前順序按灰度值從0到最大的順序?qū)⒆罱K結(jié)果讀出;

第五步讀出最終結(jié)果后,將RAM清空。

4)處理細(xì)節(jié)

定義參數(shù)?圖像高度IH 圖像寬度IW?像素逐行輸入,因此以行同步脈沖的上升沿作為統(tǒng)計開始,行同步脈沖作為行統(tǒng)計計數(shù)器,行統(tǒng)計計數(shù)器達(dá)到最大高度時,作為統(tǒng)計結(jié)束標(biāo)志。

2.灰度直方圖均衡化處理

1.統(tǒng)計出直方圖,獲取各個像素灰度累加和;

2.乘以均衡系數(shù):(2^DW-1)/IW*IH(像素最大值/圖像的面積)。

3.直方圖線性拉伸處理

此節(jié)暫時略過,不太精通,后續(xù)有時間可以研究再分享一下;

4.線性濾波器

首先需要區(qū)分線性和非線性濾波器的區(qū)別,區(qū)別在于其輸出與輸入之間是否有唯一且確定的函數(shù)傳遞。

線性濾波器分類:

平滑濾波器:主要包括均值濾波器和高斯濾波器等;

銳化濾波器:主要包括SOBEL算子、LAPLAS算子、梯度運算等。

濾波器的物理意義主要是響應(yīng)信號對目標(biāo)信號響應(yīng)后的樣子,也就是響應(yīng)函數(shù)g(i,j)?滑過整個圖像,即對圖像做一個卷積處理,就得到了濾波結(jié)果。

1)均值濾波器概述

用一個圖像區(qū)域的各個像素的平均值來代替原圖像的各個像素值,主要作用是減小銳度,減小噪聲。

均值濾波一般出現(xiàn)在圖像處理的預(yù)處理步驟,

預(yù)處理后,根據(jù)噪聲來源,例如針對椒鹽噪聲做中值濾波處理,針對高斯噪聲做高斯濾波處理

后續(xù)可能繼續(xù)做邊緣提取等復(fù)雜操作處理。

2)均值濾波器設(shè)計

設(shè)計一個濾波器可以理解成設(shè)計一個響應(yīng)函數(shù)g(x,y)=Σi=-rrΣj=-rr?I(x+i,y+j)) / (2r+1)2

數(shù)學(xué)公式很好理解,就是求一個窗口的所有像素灰度值之后后再除以整個窗口的面積也就是像素點個數(shù),求出平均值;

均值濾波的方法將數(shù)據(jù)存儲成3x3的矩陣,然后求這個矩陣。在圖像上對目標(biāo)像素給一個模板,

該模板包括了其周圍的臨近像素(以目標(biāo)像素為中心的周圍 8 個像素,構(gòu)成一個濾波模板,即去掉目標(biāo)像素本身),再用模板中的全體像素的平均值來代替原來像素值。


shift_ram 進(jìn)行數(shù)據(jù)矩陣化,將3x3矩陣的中心像素的周圍八個點求和,采取了流水線的設(shè)計方法,來增加吞吐量,然后再求平均值代替目標(biāo)像素的值。

3)sobel算子

包括X和Y兩個方向的兩套3X3矩陣,使其分別和圖像的X和Y方向進(jìn)行卷積計算(矩陣的卷積計算即將所有元素做乘加計算),兩個方向的卷積結(jié)果求平方根計算,計算結(jié)果如果大于閾值則等于0xffff,如果小于閾值則等于0,最終輸出則是圖像的邊緣。

參考代碼如下:由于算子簡單以及有正負(fù)區(qū)分,因此需要做正值和負(fù)值分別計算后再進(jìn)行相減計算。

//    | -1  0 +1 |//Gx= | -2  0 +2 |//    | -1  0 +1 |////    | -1 -2 -1 |//Gy= |  0  0  0 |//    | +1 +2 +1 |
reg [8:0] p_x_data ,p_y_data ;  // x 和 y 的正值之和reg [8:0] n_x_data ,n_y_data ; // x 和 y 的負(fù)值之和reg [8:0] gx_data  ,gy_data  ; //最終結(jié)果
always  @(posedge clk or negedge rst_n)begin    if(rst_n==1'b0)begin       p_x_data <=0;       n_x_data <=0;       gx_data   <=0;    end    else if(per_href_ff1==1) begin         p_x_data <= p_13 + (p_23<<1) + p_33 ;        n_x_data <= p_11 + (p_12<<1 )+ p_13 ;        gx_data   <= (p_x_data >=n_x_data)? p_x_data - n_x_data : n_x_data - p_x_data ;     end    else begin         p_x_data<=0;         n_x_data<=0;         gx_data <=0;    end  end
always  @(posedge clk or negedge rst_n)begin    if(rst_n==1'b0)begin       p_y_data <=0;       n_y_data <=0;       gy_data   <=0;    end    else if(per_href_ff1==1) begin        p_y_data <= p_11 + (p_12<<1) + p_13 ;        n_y_data <= p_31 + (p_32<<1) + p_33 ;        gy_data   <= (p_y_data >=n_y_data)? p_y_data - n_y_data : n_y_data - p_y_data ;     end    else begin        p_y_data <=0;        n_y_data <=0;        gy_data   <=0;   endend
//求平方和,調(diào)用ip核開平方reg [16:0] gxy; // Gx 與 Gy 的平方和always  @(posedge clk or negedge rst_n)begin    if(rst_n==1'b0)begin        gxy<=0;    end    else begin        gxy<= gy_data* gy_data + gx_data* gx_data ;    endend
wire [8:0] squart_out ; altsquart  u1_altsquart (     //例化開平方的ip核    .radical (gxy),    .q       (squart_out),  //輸出的結(jié)果    .remainder()                       );
//與閾值進(jìn)行比較reg [15:0] post_y_data_r;always  @(posedge clk or negedge rst_n)begin    if(rst_n==1'b0)begin        post_y_data_r<=16'h00;    end    else if(squart_out>=threshold)         post_y_data_r<=16'h00  ;    else         post_y_data_r<=16'hffff  ;    end

5.非線性濾波器?

非線性濾波器通常下是沒有特定的轉(zhuǎn)移函數(shù),統(tǒng)計排序濾波器;

中值濾波?

將 3*3 滑動塊中的灰度值進(jìn)行排序,然后用排序的中間值取代 3*3 滑塊中心的值。示意圖如下圖所示。

第一步:將每一行按最大值、中間值、最小值排列;

第二步:提取出最大值的最小值,中間值的中間值,最小值的最大值;

第三步:將第二步提取出來的三個數(shù)進(jìn)行排序,中間值即我們要求的中間值。

? ?6.圖像分割

圖像分割是將圖像劃分成若干個互不相交的小區(qū)域的過程,將圖像中有意義的特征或應(yīng)用所需要的特征信息提取出來,最終結(jié)果是分割成一些具有某種特征的單元,稱為圖像的基元。

本篇到此結(jié)束,后續(xù)有時間再更新,歡迎一起交流學(xué)習(xí),共同進(jìn)步!

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
A3P400-FG256I 1 Microsemi Corporation Field Programmable Gate Array, 9216 CLBs, 400000 Gates, 350MHz, CMOS, PBGA256, 17 X 17 MM, 1.60 MM HEIGHT, 1 MM PITCH, FBGA-256
$42.14 查看
A3P250-FG144I 1 Microchip Technology Inc Field Programmable Gate Array, 6144 CLBs, 250000 Gates, 350MHz, CMOS, PBGA144
$21.02 查看
XC6SLX9-L1CPG196I 1 AMD Xilinx Field Programmable Gate Array, 715 CLBs, 9152-Cell, CMOS, PBGA196, 8 X 8 MM, 0.50 MM PITCH, LEAD FREE, BGA-196
$204.26 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

任何技術(shù)的學(xué)習(xí)就好比一個江湖,對于每一位俠客都需要不斷的歷練,從初入江湖的小白到歸隱山林的隱世高人,需要不斷的自我感悟自己修煉,讓我們一起仗劍闖FPGA乃至更大的江湖。