圖像處理技術(shù)論文范文
時(shí)間:2023-04-08 05:05:58
導(dǎo)語(yǔ):如何才能寫(xiě)好一篇圖像處理技術(shù)論文,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
基于圖像采集卡的視頻圖像處理系統(tǒng)
計(jì)算機(jī)圖像處理系統(tǒng)從系統(tǒng)層次上可分為高、中、低檔三個(gè)層次,目前一般比較普及的是低檔次的系統(tǒng),該系統(tǒng)由CCD(攝像頭)、圖像采集卡、計(jì)算機(jī)三個(gè)部分組成,其結(jié)構(gòu)簡(jiǎn)單,應(yīng)用方便,效果也比較不錯(cuò),得到的圖像較清晰。目前網(wǎng)上基于VC開(kāi)發(fā)經(jīng)驗(yàn)的文章不少,可是關(guān)于如何在VC開(kāi)發(fā)平臺(tái)上使用圖像采集卡的文章確沒(méi)發(fā)現(xiàn),筆者針對(duì)在科研開(kāi)發(fā)中積累的使用圖像采集卡經(jīng)驗(yàn),介紹如何自己是如何將采集卡集成到圖像開(kāi)發(fā)系統(tǒng)中,希望能夠給目前正需要利用圖像采集卡開(kāi)發(fā)自己的圖像處理系統(tǒng)的朋友有所幫助。
使用的攝像機(jī)采用臺(tái)灣BENTECHINDUSTRIAL有限公司生產(chǎn)的CV-155L黑白攝像機(jī)。該攝像機(jī)分辨率為752x582。圖象采集卡我們采用北京中科院科技嘉公司開(kāi)發(fā)的基于PCI總線的CA-MPE1000黑白圖象采集卡。使用圖像采集卡分三步,首先安裝采集卡的驅(qū)動(dòng)程序,并將虛擬驅(qū)動(dòng)文件VxD.vxd拷貝到Windows的SYSTEM目錄下;這時(shí)候就可以進(jìn)入開(kāi)發(fā)狀態(tài)了,進(jìn)入VC開(kāi)發(fā)平臺(tái),生成新的項(xiàng)目,由于生產(chǎn)廠家為圖像采集卡提供了以mpew32.dll、mpew32.lib命名的庫(kù)文件,庫(kù)中提供了初始硬件、采集圖像等函數(shù),為使用這些函數(shù),在新項(xiàng)目上連接該動(dòng)態(tài)庫(kù);最后一步就是采集圖像并顯示處理了,這一步要設(shè)置系統(tǒng)調(diào)色板,因?yàn)椴杉ㄌ峁┑氖锹銏D形式,既純圖像數(shù)據(jù),沒(méi)有圖像的規(guī)格和調(diào)色板信息,這些需要開(kāi)發(fā)者自己規(guī)定實(shí)現(xiàn),下面是實(shí)現(xiàn)的部分代碼:
CTestView::CTestView()
{
W32_Init_MPE1000();//初始化采集卡
W32_Modify_Contrast(50);//下面的函數(shù)是為了對(duì)采集卡進(jìn)行預(yù)設(shè)置
W32_Modify_Brightness(45);//設(shè)置亮度
W32_Set_HP_Value(945);//設(shè)置水平采集點(diǎn)數(shù)
wCurrent_Frame=1;//當(dāng)前幀為1,獲取的圖像就是從這幀取得的
//設(shè)置采集信號(hào)源,僅對(duì)MPE1000有效
W32_Set_Input_Source(1);
W32_CACardParam(AD_SETHPFREQ,hpGrabFreq);
W32_Set_PAL_Range(1250,1024);//設(shè)置水平采集范圍
W32_Set_VGA_Mode(1);
wGrabWinX1=0;//采集窗口的左上角的坐標(biāo)
wGrabWinY1=0;
firstTime=TRUE;
bGrabMode=FRAME;
bZipMode=ZIPPLE;
/
lpDib=NULL;//存放獲取的圖像數(shù)據(jù)
}
CTestView::~CTestView()
{
W32_Close_MPE1000();//關(guān)閉采集卡
}
////顯示采集的圖象,雙擊鼠標(biāo)采集停止
voidCTestView::OnGraboneframe()
{
//TODO:Addyourcommandhandlercodehere
wCurrent_Frame=1;
//設(shè)置采集目標(biāo)為內(nèi)存
W32_CACardParam(AD_SETGRABDEST,CA_GRABMEM);
//啟動(dòng)采集
if(lpDib!=NULL)
{
GlobalUnlock(hglbDIB);
GlobalFree(hglbDIB);
}
//分配內(nèi)存
hglbDIB=GlobalAlloc(GHND,(DWORD)wImgWidth*(DWORD)wImgHeight);
lpDib=(BYTE*)GlobalLock(hglbDIB);
hdc=GetDC()->GetSafeHdc();
if(lpDib!=NULL)
{
cxDib=wImgWidth;
cyDib=wImgHeight;
SetLogicPal(hdc,cxDib,cyDib,8);
SetStretchBltMode(hdc,COLORONCOLOR);
bGrabMark=TRUE;
while(bGrabMark==TRUE)
{
if(msg.message==WM_LBUTTONDBLCLK)
bGrabMark=FALSE;
W32_ReadXMS2Buf(wCurrent_Frame,lpDib);
SetDIBitsToDevice(hdc,0,0,cxDib,cyDib,0,0,
0,cyDib,(LPSTR)lpDib,
bmi,
DIB_RGB_COLORS);
}
//停止采集
W32_CAStopCapture();
::ReleaseDC(GetSafeHwnd(),hdc);
return;
}
////將下面這個(gè)函數(shù)添加在視圖類的CTestView::OnSize()函數(shù)中,就可以對(duì)系統(tǒng)的調(diào)色板進(jìn)行設(shè)置。
voidWINAPIInitLogicPal(HDChdc,shortwidth,shortheight,WORDbitCount)
{
intj,i;
shortcxDib,cyDib;
LOGPALETTE*pLogPal;
j=256;
if((pLogPal=(LOGPALETTE*)malloc(sizeof(LOGPALETTE)+(j*sizeof(PALETTEENTRY))))==NULL)
return;
pLogPal->palVersion=0x300;
pLogPal->palNumEntries=j;
for(i=0;ipLogPal->palPalEntry[i].peRed=i;
pLogPal->palPalEntry[i].peGreen=i;
pLogPal->palPalEntry[i].peBlue=i;
pLogPal->palPalEntry[i].peFlags=0;
}
hPal=::CreatePalette(pLogPal);
deletepLogPal;
::SelectPalette(hdc,hPal,0);
::RealizePalette(hdc);
cxDib=width;cyDib=height;
if((bmi=(BITMAPINFO*)malloc(sizeof(BITMAPINFOHEADER)+j*sizeof(RGBQUAD)))==NULL)
return;
//bmi為全局變量,用于顯示圖像時(shí)用
bmi->bmiHeader.biSize=40;
bmi->bmiHeader.biWidth=cxDib;
bmi->bmiHeader.biHeight=cyDib;
bmi->bmiHeader.biPlanes=1;
bmi->bmiHeader.biBitCount=bitCount;
bmi->bmiHeader.biCompression=0;
bmi->bmiHeader.biSizeImage=0;
bmi->bmiHeader.biXPelsPerMeter=0;
bmi->bmiHeader.biYPelsPerMeter=0;
bmi->bmiHeader.biClrUsed=0;
bmi->bmiHeader.biClrImportant=0;
for(i=0;ibmi->bmiColors[i].rgbBlue=i;
bmi->bmiColors[i].rgbGreen=i;
bmi->bmiColors[i].rgbRed=i;
bmi->bmiColors[i].rgbReserved=0;
}
}
視頻"畫(huà)中畫(huà)"技術(shù)
"畫(huà)中畫(huà)"這個(gè)概念類似與彩色電視機(jī)"畫(huà)中畫(huà)",就是在一幅大的圖像內(nèi)顯示另外一幅內(nèi)容不同的小的圖像,小圖像的尺寸大小一般地說(shuō)為大圖像尺寸的1/4或1/9,顯示位置在大圖像的右上角。這種技術(shù)不僅在電視技術(shù)中,在可視電話系統(tǒng)也可以發(fā)現(xiàn)這種技術(shù)的身影,它們都是依靠硬件來(lái)實(shí)現(xiàn)的,但是如何在VC開(kāi)發(fā)平臺(tái)上用編程語(yǔ)言來(lái)將該功能添加到自己開(kāi)發(fā)的視頻監(jiān)控軟件,為使用者提供更大的信息量呢?也許讀者最容易想到的是首先顯示大圖像,然后再在一個(gè)固定位置畫(huà)第二幅小圖像,這種技術(shù)技術(shù)如果對(duì)于靜止圖像當(dāng)然沒(méi)有問(wèn)題,但是對(duì)于視頻流,由于每一秒鐘需要畫(huà)25幀,即25幅圖像,這樣一來(lái)計(jì)算機(jī)需要不停的畫(huà)不停的擦除,會(huì)給用戶以閃爍的感覺(jué),如何解決這個(gè)問(wèn)題呢?有的參考書(shū)上將大小圖像分快顯示,這種方法要將待顯示的圖像數(shù)據(jù)與顯示位置的關(guān)系對(duì)應(yīng)起來(lái),容易出錯(cuò)不說(shuō),而且麻煩,且速度慢,為此,我對(duì)該方法進(jìn)行了改進(jìn),得到了滿意的效果。實(shí)現(xiàn)的代碼如下:
voidpictureinpicture()
{
………………………..
CBitmapbitmap,*oldmap;
pData1=(BYTE*)newchar[biWidth*biHeight*3];//biWidth和biHeight為視頻采集卡獲取//的圖像尺寸。
Read(pData1,bih.biWidth*bih.biHeight*3);//該函數(shù)從采集卡中獲取數(shù)據(jù)
CClientDCdc(this);
m_pBMI1=newBITMAPINFO;//自定義的BMP文件信息結(jié)構(gòu),用于后面的圖像顯示
m_pBMI1->bmiHeader.biBitCount=24;
m_pBMI1->bmiHeader.biClrImportant=0;
m_pBMI1->bmiHeader.biClrUsed=0;
m_pBMI1->bmiHeader.biCompression=0;
m_pBMI1->bmiHeader.biHeight=biHeight;
m_pBMI1->bmiHeader.biPlanes=1;
m_pBMI1->bmiHeader.biSize=40;
m_pBMI1->bmiHeader.biSizeImage=WIDTHBYTES(biWidth*8)*biHeight*3;
m_pBMI1->bmiHeader.biWidth=biWidth;
m_pBMI1->bmiHeader.biXPelsPerMeter=0;
m_pBMI1->bmiHeader.biYPelsPerMeter=0;
////////////////////////////////////////////////////////////////////////
pData2=(BYTE*)newchar[biWidth1*biHeight1*3];//申請(qǐng)存放小圖像的緩沖區(qū)
Read(pData2,biWidth1*biHeight1*3);////向該緩沖區(qū)讀數(shù)據(jù)
m_pBMI2=newBITMAPINFO;
m_pBMI2->bmiHeader.biBitCount=24;
m_pBMI2->bmiHeader.biClrImportant=0;
m_pBMI2->bmiHeader.biClrUsed=0;
m_pBMI2->bmiHeader.biCompression=0;
m_pBMI2->bmiHeader.biHeight=biHeight1;
m_pBMI2->bmiHeader.biPlanes=1;
m_pBMI2->bmiHeader.biSize=40;
m_pBMI2->bmiHeader.biSizeImage=WIDTHBYTES(biWidth1*8)*biHeight1*3;
m_pBMI2->bmiHeader.biWidth=biWidth1;
m_pBMI2->bmiHeader.biXPelsPerMeter=0;
m_pBMI2->bmiHeader.biYPelsPerMeter=0;
//下面實(shí)現(xiàn)畫(huà)中畫(huà)的顯示
CDCMemDc;
MemDc.CreateCompatibleDC(&dc);
bitmap.CreateCompatibleBitmap(&dc,biWidth,biHeight);
oldmap=MemDc.SelectObject(&bitmap);
::StretchDIBits(MemDc.m_hDC,0,0,biWidth,biHeight,0,0,—biWidth,biHeight,pData1,m_pBMI1,DIB_RGB_COLORS,SRCCOPY);//首先將大圖像畫(huà)在內(nèi)寸上下文中
::StretchDIBits(MemDc.m_hDC,20,20,biWidth1,biHeight1,_
0,0,biWidth1,biHeight1,pData2,m_pBMI2,DIB_RGB_COLORS,SRCCOPY);//再將小圖像畫(huà)在內(nèi)寸上下文中
::StretchBlt(dc.m_hDC,0,0,bih.biWidth,bih.biHeight,_
MemDc.m_hDC,0,0,bih.biWidth,bih.biHeight,SRCCOPY);//將結(jié)果顯示在屏幕上。
MemDc.SelectObject(oldmap);
deletepData1;
deletem_pBMI1;
deletepData2;
篇2
1.1加強(qiáng)對(duì)Photoshop圖像處理應(yīng)用
案例分析總結(jié)就是一種間接的自我學(xué)習(xí),通過(guò)案例分析總結(jié)可以讓自己展開(kāi)豐富的想象力,加強(qiáng)對(duì)Photoshop圖像處理應(yīng)用。這是一組人居環(huán)境適宜的景觀設(shè)計(jì)效果處理前后變化展示,前一張圖片是用3Dmax配合V-ray插件進(jìn)行渲染的最終效果,為了進(jìn)一步美化效果圖,這是就需要Photoshop圖像處理,結(jié)合中間這一張照片,采用圖層處理、素材插入、調(diào)整圖層、圖層蒙版、創(chuàng)建亮度\對(duì)比度調(diào)整層等方式最終合成想要的效果。在案例分析過(guò)的成中,應(yīng)注意多觀察多總結(jié)多思考,設(shè)計(jì)最終效果的高低,一方面是和自己所擁有的知識(shí)水平有關(guān),另一方面還和自己的審美能力高低有關(guān),這就需要告誡我們平時(shí)多注意學(xué)習(xí),學(xué)習(xí)不僅僅局限在書(shū)本上,還應(yīng)該多參觀欣賞較好的作品,從中得到審美能力的提高。
1.2模仿和創(chuàng)造相結(jié)合,提高Photoshop圖像處理動(dòng)手能力
模仿是人的本能天性,是人類進(jìn)行各種學(xué)習(xí)活動(dòng)的最基本方法。在平時(shí)的Photoshop圖像處理模仿使用中,通常就是通過(guò)網(wǎng)上視頻,如金鷹視頻來(lái)自己分析Photoshop軟件的各個(gè)功能。在視頻觀看的過(guò)程,可以根據(jù)視頻中的實(shí)例操作,最終達(dá)到理解,這個(gè)過(guò)程就是模仿。例如:模仿給圖片添加陰影效果,通常情況下,可以選擇Photoshop菜單欄圖層—圖層樣式—陰影就可以完成。而通過(guò)視頻模仿,就可以快速的通過(guò)浮動(dòng)圖層菜單,選定此圖片圖層,并把鼠標(biāo)快速放到縮略藍(lán)色區(qū)域雙擊就可以打開(kāi)圖層樣式浮動(dòng)菜單完成陰影效果。在提高Photoshop圖像處理動(dòng)手能力上,還要發(fā)揮自己的創(chuàng)造能力。例如給此圖片添加完陰影后,圖層樣式還有內(nèi)外陰影、內(nèi)外發(fā)光、光澤、斜面和浮雕、顏色疊加等方式,我們嘗試可以根據(jù)圖片實(shí)際情況試著添加,達(dá)到最佳效果。這里就需要發(fā)揮創(chuàng)造性對(duì)圖片處理創(chuàng)新性在里面。
1.3結(jié)合科研項(xiàng)目,帶動(dòng)Photoshop圖像處理實(shí)踐能力
如在科研項(xiàng)目:西部山地型小城市人居環(huán)境問(wèn)題及保護(hù)策略研究——以商洛市商州區(qū)為例上,需要收集大量的本地環(huán)境有關(guān)的圖片素材并進(jìn)行美化處理,這就可以親自參與商州區(qū)大氣質(zhì)量惡化、丹江主要河流體固體廢物污染、交通混亂等圖片的處理,
1.4參與企業(yè)設(shè)計(jì),增強(qiáng)Photoshop圖像處理靈活性
參與企業(yè)設(shè)計(jì),就是參與設(shè)計(jì)公司的工作。例如:在商洛市西街片區(qū)的舊城改造過(guò)程中,學(xué)生負(fù)責(zé)收集照片,并對(duì)舊城的原始照片進(jìn)行處理規(guī)范化。
2小結(jié)
篇3
【關(guān)鍵詞】圖像處理 偏微分方程 模型構(gòu)建 處理步驟
一、圖像處理的基本方式
(一)信號(hào)分析處理
信號(hào)處理的方式是利用空間變化的思路,空間變換的方法就是從早期的頻域變換發(fā)展而來(lái)形成了小波變換。小波變換在時(shí)域同時(shí)有良好的的局部分析特征,可以實(shí)現(xiàn)在多個(gè)尺寸上的多分辨特性。小波變換在圖像壓縮中獲得了較好的效果。
(二)隨機(jī)建模的處理
數(shù)字圖像在形成的過(guò)程中有隨機(jī)性,所以二維的圖形實(shí)際是一個(gè)隨機(jī)的場(chǎng)。所及建模的方式是按照隨機(jī)場(chǎng)對(duì)圖像域建模,以此描述圖像域鄰域像素的分布情況,從而完成對(duì)圖形的描述。通常采用的隨機(jī)建模方式有高斯混合模型等。隨機(jī)場(chǎng)模型可以對(duì)圖形的紋理進(jìn)行細(xì)致描述。
(三)偏微分處理
偏微分方程是一種數(shù)學(xué)方式,對(duì)數(shù)字影像進(jìn)行處理,利用空間域內(nèi)的像素灰度值進(jìn)行微分處理,利用二階方程表征圖形中區(qū)域邊界的特征。微分方程具有各項(xiàng)異性的擴(kuò)展特征,在不同的圖像特征上顯示的擴(kuò)展性能也就不同,所以利用方程迭代處理圖形可最大限度的保持邊緣特征,同時(shí)獲得重建的平滑區(qū)域。
二、偏微分方程和圖像處理的應(yīng)用
當(dāng)前利用物理學(xué)和力學(xué)的變分和偏分方程方法的圖像處理技術(shù)在計(jì)算機(jī)圖形處理領(lǐng)域已經(jīng)開(kāi)辟了新的領(lǐng)域,基于偏分方程的圖形處理方式已經(jīng)獲得了重視和良好的效果。其基本的思路就是在一個(gè)偏微分方程模型中發(fā)展一個(gè)圖形,一條曲線、一個(gè)曲面等,利用求解這個(gè)偏微分方程來(lái)獲得圖形處理的期望值。變分和偏微分方程使得數(shù)字圖像處理進(jìn)入了一個(gè)新的領(lǐng)域。
(一)偏微分方程處理的主要領(lǐng)域
對(duì)圖形進(jìn)行去噪處理:圖形去噪的典型分析與計(jì)算方法是高斯低通濾波器,也即是熱擴(kuò)散方程,因?yàn)楦咚篂V波器在去找的過(guò)程中不能保持良好的邊緣特征,所以多數(shù)研究都是對(duì)該特征進(jìn)行改進(jìn),其中較為有效的方式就是由Perona 和 Malik 提出的 P-M 方程,公式如下:
公式中,迭代步長(zhǎng)dt,It是迭代項(xiàng),ΔI則是拉普拉斯算子,c則代表傳導(dǎo)系數(shù)。其中div是散度算子,代表梯度算子, Δ是拉普拉斯斯算子。在實(shí)際的應(yīng)用中為了保證模型的收斂性,通常利用經(jīng)驗(yàn)值,取迭代步長(zhǎng)dt值為0.25。在此基礎(chǔ)上,PDE去噪的基本思路如下:1)在圖像相同質(zhì)量特征的區(qū)域內(nèi)進(jìn)行減弱噪聲擴(kuò)散的處理;2)控制區(qū)域邊界未知不擴(kuò)散,并保持邊緣的基本特征。因?yàn)镻-M是一個(gè)病態(tài)問(wèn)題,所以有研究提出對(duì)梯度值正則化處理,然后獲得相對(duì)穩(wěn)定的P-M方程。有人提出直接使用擴(kuò)散張量作為擴(kuò)散項(xiàng),從而實(shí)現(xiàn)張量偏微分的方程模型。這個(gè)模型可以在一個(gè)方向上獲得快速擴(kuò)散,而在正交的另一個(gè)方向緩慢擴(kuò)散,由此獲得邊緣去噪的效果。
圖形的放大處理:對(duì)圖像進(jìn)行插值放大,獲得超分辨率的分析。偏微分方程可以按照?qǐng)D像邊緣、水平曲線等幾何特征實(shí)現(xiàn)插值放大。所以偏微分方程可以最大限度的保持邊緣的細(xì)節(jié)特征,同時(shí)可以減弱噪聲的影響。在研究中提出基于偏微分方程擬合水平集曲線的圖形像素重構(gòu)。也就研究提出了一種復(fù)擴(kuò)散偏微分方程被放大模式,在減弱鋸齒效應(yīng)的同時(shí),可以銳化邊緣的特征。
圖形的分割處理:圖形的分割也是圖像處理的重要內(nèi)容,計(jì)算機(jī)和圖像處理按照使用的圖像特征進(jìn)行分類處理,可以分為基于邊界的分割、基于區(qū)域的方法,以及混合分割的方法。如按照使用數(shù)學(xué)工具和模型,其主要的方法有:基于聚類的方法;基于統(tǒng)計(jì)學(xué)的方法;基于數(shù)學(xué)形態(tài)的方法;基于偏微分方程的方法,主要有蛇形模型等;基于Graph cut的方法。
(二)圖像處理的偏微分模型
在圖形處理中,偏微分方程模式有很多種,其中一種是在變分原理的基礎(chǔ)上對(duì)函數(shù)進(jìn)行優(yōu)化,這個(gè)方式首先對(duì)一個(gè)特定的圖形處理模式,通過(guò)變分原理實(shí)現(xiàn)對(duì)能量函數(shù)模型的優(yōu)化,這樣就可得到偏微分方程,通過(guò)對(duì)偏微分方程數(shù)值求解由此完成圖形的處理任務(wù)。如:整體變分能量泛函
利用此模式就可完成對(duì)函數(shù)的優(yōu)化。
三、基于偏微分方程的圖形處理的步驟
作為圖像處理的一個(gè)重要工具,在變分和偏微分方程的圖像處理的基本框架和基本步驟如下:1)明確實(shí)際問(wèn)題的出現(xiàn)和處理思路建立,因?yàn)椴煌膽?yīng)用問(wèn)題有不同的處理思路和特征,因此采用的處理方式也就不同,所以在處理圖像問(wèn)題時(shí)應(yīng)先掌握問(wèn)題的關(guān)鍵。2)構(gòu)建相關(guān)數(shù)學(xué)模型,這一步驟是處理圖像的重要步驟,其影響的是處理的過(guò)程和結(jié)果,數(shù)學(xué)模型構(gòu)建將直接影響處理的效果,對(duì)微分方程、變分方法、微分幾何等進(jìn)行合理選擇與組合,以此獲得較好的處理結(jié)果,提高處理的有效性。3)模型分析:主要是對(duì)模型的適應(yīng)性進(jìn)行分析,了解模型解是否存在、解是否唯一、方法是否穩(wěn)定等,4)分析計(jì)算:利用數(shù)學(xué)模式進(jìn)行求解,進(jìn)行微分方程的數(shù)值分析,利用有限差分、有限元、迭代法等進(jìn)行計(jì)算,這一步驟會(huì)影響相關(guān)數(shù)學(xué)求解的收斂性、穩(wěn)定性、計(jì)算量等。5)程序?qū)崿F(xiàn):這個(gè)步驟是解決問(wèn)題的最終步驟,這一步驟的一些問(wèn)題可以導(dǎo)致前面工作的重新修改,必須慎重操作。
四、結(jié)束語(yǔ)
偏微分方程是一種高效的數(shù)學(xué)處理工具,在圖像處理中也獲得了較好的效果。連續(xù)區(qū)域上建立模型,方便對(duì)實(shí)際問(wèn)題的處理和數(shù)值計(jì)算。數(shù)學(xué)上豐富的偏微分方程處理理論和計(jì)算方式,對(duì)圖形處理的理論分析和算法都給予了較大的幫助,同時(shí)不斷完善的計(jì)算和處理方式將幫助偏微分方程提高圖像處理的效果。
參考文獻(xiàn):
[1]李艷霞.基于變分偏微分方程的圖像分解研究與應(yīng)用[D].中國(guó)海洋大學(xué)學(xué)位論文,2009.
篇4
關(guān)鍵詞:PBL模式 數(shù)字圖像處理 實(shí)踐教學(xué)
中圖分類號(hào):TP399 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2013)03-0242-01
在高校教學(xué)體系中,數(shù)字圖像處理成為了包括理工科、農(nóng)醫(yī)科在內(nèi)專業(yè)必選課程或者重點(diǎn)選修課程。作為一門(mén)理論知識(shí)豐富、實(shí)踐性非常強(qiáng)的高校課程,當(dāng)前PBL模式已經(jīng)成為了包括美國(guó)在內(nèi)的多個(gè)國(guó)家的主要教學(xué)模式。
1 PBL模式與數(shù)字圖像處理結(jié)合探索背景
PBL模式作為一種較為先進(jìn)的教學(xué)模式,英文名稱Problem-Based Learning,其含義為問(wèn)題式教學(xué)模式或者基于問(wèn)題的學(xué)習(xí)模式,PBL模式的主要思路是以問(wèn)題為前提進(jìn)行教學(xué)的展開(kāi)活動(dòng),這一教學(xué)方法的特點(diǎn)在于在教師的直接參與和指導(dǎo)之下,將學(xué)生放在主體地位,通過(guò)小組討論的方式,通過(guò)以某一具體問(wèn)題為中心的研究討論和加強(qiáng)學(xué)習(xí)的過(guò)程,將教學(xué)的焦點(diǎn)放在某學(xué)科的重要原理以及關(guān)鍵概念之上,通過(guò)幫助學(xué)生自己構(gòu)建知識(shí)體系的過(guò)程,養(yǎng)成學(xué)習(xí)獨(dú)立學(xué)習(xí)、獨(dú)立思考的基本能力,數(shù)字圖像處理具有其本身獨(dú)特的特色。
其一,該門(mén)課程的理論知識(shí)豐富,知識(shí)點(diǎn)較為深?yuàn)W難懂[1];其二,日常生活中,應(yīng)用到的數(shù)字圖像處理相關(guān)課程知識(shí)點(diǎn)較多,對(duì)學(xué)生綜合能力要求較高,尤其在工科專業(yè)的基礎(chǔ)知識(shí)學(xué)習(xí)中要求較高,需要對(duì)計(jì)算機(jī)、數(shù)學(xué)等學(xué)科知識(shí)進(jìn)行綜合運(yùn)用,例如,湖南省某學(xué)院部分專業(yè)在開(kāi)設(shè)這門(mén)課程時(shí),每一學(xué)期的課時(shí)量為30至40課時(shí),該學(xué)院部分立刻專業(yè)設(shè)置了選修課程的的課時(shí)量。依靠傳統(tǒng)的教學(xué)模式進(jìn)行數(shù)字圖像處理已經(jīng)不適宜當(dāng)前的教學(xué)實(shí)際,須對(duì)高校包括機(jī)械制造專業(yè)、自動(dòng)化等專業(yè)的數(shù)字圖像處理能力進(jìn)行要求,才能全面提升學(xué)生的綜合能力。
2 基于PBL模式的實(shí)踐教學(xué)改革方案探索
2.1 對(duì)數(shù)字圖像處理實(shí)踐教學(xué)方式方法的研究
以上述湖南某城市學(xué)院為例,為推進(jìn)數(shù)字圖像處理的PBL模式改革,該校自行編撰了驗(yàn)證性課程指導(dǎo)實(shí)踐用書(shū),該書(shū)的主要內(nèi)容包括了30多個(gè)實(shí)踐項(xiàng)目,涵蓋了圖像分析、圖像濾波、數(shù)字處理軟件的使用以及圖像分割等多個(gè)板塊知識(shí)點(diǎn),該學(xué)院學(xué)生中計(jì)算機(jī)普及程度廣,所以在進(jìn)行圖像處理實(shí)踐時(shí)可自行下載相關(guān)的支持軟件。改變以往該課程集中實(shí)踐方式,升級(jí)成分散與集中結(jié)合的模式,即第一步學(xué)生利用業(yè)余時(shí)間或者在專門(mén)實(shí)驗(yàn)室內(nèi)完成數(shù)字圖像處理分散實(shí)驗(yàn),第二步教師對(duì)學(xué)生教學(xué)實(shí)踐中產(chǎn)生的問(wèn)題進(jìn)行一對(duì)一面談解決或者利用網(wǎng)絡(luò)通訊工具解決問(wèn)題,第三步,通過(guò)多次的分散式課程實(shí)踐活動(dòng),利用4個(gè)至6個(gè)課時(shí)進(jìn)行集中式教學(xué)。
2.2 突破數(shù)字圖像處理理論教學(xué)模式
其一,確保在對(duì)數(shù)字圖像處理完整性以及整體性進(jìn)行維護(hù)前提下,在實(shí)踐教學(xué)課堂中盡量避免對(duì)數(shù)字處理相關(guān)公式的重復(fù)推導(dǎo)[2],主要對(duì)相關(guān)算法以及關(guān)鍵原理進(jìn)行說(shuō)明,如在對(duì)均衡處理數(shù)字圖像知識(shí)點(diǎn)進(jìn)行講解過(guò)程中,直接引用推導(dǎo)公式,利用均衡化圖像的原理以及關(guān)鍵算法進(jìn)行處理技術(shù)的編程;其二,在對(duì)相關(guān)的信息進(jìn)行篩選之后重點(diǎn)對(duì)處理圖像的算法進(jìn)行編程和實(shí)踐應(yīng)用,在對(duì)圖像處理邊緣檢測(cè)知識(shí)進(jìn)行運(yùn)用過(guò)程中,可以將Hough的變換、路經(jīng)檢測(cè)加強(qiáng)聯(lián)系,更好進(jìn)行編程;其三,在解決實(shí)踐問(wèn)題的過(guò)程中,多進(jìn)行實(shí)例的例舉,可利用2至3個(gè)課時(shí)對(duì)實(shí)踐教學(xué)的背景、已有的實(shí)踐教學(xué)成果的、重要技術(shù)流程、重要算法進(jìn)行演示等。
3 基于PBL模式的數(shù)字圖像處理教學(xué)方案設(shè)計(jì)
仍以湖南某城市學(xué)院信息學(xué)院為例,從PBL模式出發(fā),針對(duì)于數(shù)字圖像處理建立了處理庫(kù),這一項(xiàng)目中涵蓋處理圖像、分析圖像、識(shí)別圖像等多類別項(xiàng)目,例如“門(mén)禁系統(tǒng)視覺(jué)識(shí)別系統(tǒng)”、“指紋識(shí)別”、“二維碼檢測(cè)”等,學(xué)院每學(xué)期建立了不低于36個(gè)的項(xiàng)目,學(xué)生可在這些項(xiàng)目中進(jìn)行選修,另外,以40個(gè)課時(shí)為標(biāo)準(zhǔn),數(shù)字圖形處理理論課程教學(xué)學(xué)時(shí)為30個(gè),實(shí)踐性教學(xué)課時(shí)為10個(gè),每周保證3個(gè)學(xué)時(shí),總共教學(xué)時(shí)長(zhǎng)為13個(gè)教學(xué)周。
第一,在進(jìn)行教學(xué)的前兩個(gè)周內(nèi),將數(shù)字圖像處理課程PBL模式實(shí)踐考察和教學(xué)方式進(jìn)行明確和推介,并將以往的學(xué)生實(shí)踐教學(xué)成果進(jìn)行分享,為學(xué)生在選修過(guò)程中提供參考,學(xué)生進(jìn)行是否選修的決策;第二,在3至4周,擬定學(xué)生課程選修名單,進(jìn)行實(shí)踐性教學(xué)任務(wù)的布置,確定36個(gè)以上的實(shí)踐項(xiàng)目給學(xué)生,學(xué)生自動(dòng)組成項(xiàng)目合作,保持每組在3個(gè)人左右,學(xué)生自行數(shù)字圖像處理選擇題目,對(duì)實(shí)踐項(xiàng)目進(jìn)行圖像加文字型的介紹,盡快確定目標(biāo),盡快對(duì)實(shí)踐應(yīng)用難度進(jìn)行確定以及評(píng)分;第三,在5至6周的時(shí)候確定數(shù)字圖像處理實(shí)踐目標(biāo)書(shū),確定相關(guān)參考資料;第四,在7周至12周時(shí)間內(nèi)實(shí)施實(shí)踐項(xiàng)目,學(xué)生利用課余時(shí)間完成分散型實(shí)驗(yàn),這段時(shí)間內(nèi)適當(dāng)安排集中型實(shí)驗(yàn),對(duì)實(shí)踐項(xiàng)目進(jìn)行驗(yàn)證,在這一過(guò)程中,特別注意積極提出實(shí)踐項(xiàng)目存在的問(wèn)題,及時(shí)檢查問(wèn)題解決的進(jìn)度,教師有針對(duì)地進(jìn)行問(wèn)題解答,幫助實(shí)踐小組完成任務(wù)目標(biāo);第五,在第13周時(shí),組成專業(yè)或者班級(jí)為小組的實(shí)踐項(xiàng)目答辯,實(shí)踐項(xiàng)目的成果進(jìn)行答辯與說(shuō)明;最后,數(shù)字圖像處理課程教師完成總結(jié),學(xué)生對(duì)實(shí)踐項(xiàng)目進(jìn)行報(bào)告,教師根據(jù)實(shí)際情況對(duì)學(xué)生進(jìn)行打分。
4 結(jié)語(yǔ)
基于PBL模式的數(shù)字圖像處理的教學(xué)形式,能幫助高校學(xué)生快速了解和吸收處理數(shù)字化圖像過(guò)程中必要的技術(shù)、方法與原理等知識(shí)點(diǎn)[3],還能幫助學(xué)生掌握數(shù)字圖像處理實(shí)踐項(xiàng)目的實(shí)踐研究方法和思路,提升學(xué)生利用圖像處理的基礎(chǔ)知識(shí)靈活解決生活實(shí)際問(wèn)題能力,提升學(xué)生的學(xué)習(xí)積極性以及創(chuàng)新、實(shí)踐能力,對(duì)于全面提升數(shù)字圖像處理相關(guān)課程的教學(xué)質(zhì)量具有重要作用。
參考文獻(xiàn)
[1]何林錦,翟云波,李彩亭.項(xiàng)目式實(shí)驗(yàn)教學(xué)模式及其可行性評(píng)價(jià)方法[J].實(shí)驗(yàn)室研究與探索,2010,29(2):94-96.
篇5
論文摘要:針對(duì)碩士研究生在學(xué)習(xí)“數(shù)字圖像處理與模式識(shí)別”課程中面臨的理論與實(shí)際脫節(jié)、書(shū)本知識(shí)陳舊和教學(xué)手段單一等問(wèn)題,本文從教材選擇、講授內(nèi)容和手段、講授形式和考核方法等方面進(jìn)行了教學(xué)改革的探討,通過(guò)在教學(xué)活動(dòng)中不斷實(shí)踐探索,使學(xué)生在學(xué)習(xí)中不僅學(xué)到了豐富的理論知識(shí),而且通過(guò)開(kāi)放的實(shí)驗(yàn)環(huán)節(jié)找到理論應(yīng)用到實(shí)際之中的關(guān)鍵所在,同時(shí)帶領(lǐng)學(xué)生放眼于本領(lǐng)域的熱點(diǎn)技術(shù),激發(fā)了大家的研究興趣。本課題已獲得“211工程”三期的資助。
1 緒論
學(xué)生剛從本科階段走入研究生階段,都懷著極大的熱情要投身于科學(xué)研究中,他們需要通過(guò)更多更專業(yè)的課程來(lái)夯實(shí)自身的理論基礎(chǔ),以便使他們能夠在科學(xué)研究工作中充分發(fā)揮自身才華,所以研究生階段的文化課程具有更強(qiáng)的針對(duì)性和實(shí)用性。可反觀研究生課程現(xiàn)狀,選用的教材往往是五年甚至十年之前出版的,其內(nèi)容已非常陳舊,與信息時(shí)代的要求相差甚遠(yuǎn);學(xué)生反映學(xué)到的知識(shí)不知如何在實(shí)際科研中應(yīng)用,不了解本領(lǐng)域最新發(fā)展方向,學(xué)習(xí)過(guò)程單調(diào)枯燥,沒(méi)有達(dá)到研究生課程應(yīng)有的效果。針對(duì)這些問(wèn)題,作者在多年的教學(xué)過(guò)程中不斷總結(jié)原因,不斷進(jìn)行教學(xué)改革探索,并在國(guó)家“211工程”資助下,開(kāi)展了研究生“數(shù)字圖像處理與模式識(shí)別”課程的教學(xué)改革課題研究。
2 教學(xué)改革內(nèi)容
“數(shù)字圖像處理與模式識(shí)別”課程面對(duì)的授課對(duì)象包括電子、自動(dòng)化、計(jì)算機(jī)、光電、機(jī)械、車輛等各個(gè)專業(yè)的碩士研究生,他們?cè)诟髯缘难芯款I(lǐng)域都將面臨圖像處理及識(shí)別的實(shí)際問(wèn)題,為了培養(yǎng)學(xué)生掌握該領(lǐng)域的基礎(chǔ)知識(shí),并能迅速地在研究工作中發(fā)揮作用,必須學(xué)習(xí)本課程,并能靈活應(yīng)用到各自的研究工作中。本課程從數(shù)字圖像處理技術(shù)的整體知識(shí)框架出發(fā),對(duì)圖像進(jìn)行一系列處理技術(shù)的討論,經(jīng)過(guò)參數(shù)分析與模式識(shí)別,使數(shù)字圖像處理與模式識(shí)別技術(shù)融為一體,為各個(gè)應(yīng)用領(lǐng)域的理論研究和實(shí)際應(yīng)用奠定基礎(chǔ)。
2.1為學(xué)生量身打造教材
目前圖像處理領(lǐng)域發(fā)展非常迅速:3D圖像處理技術(shù)、3G可視化圖像通信技術(shù)、高速公路不停車收費(fèi)技術(shù)等都在日常生活中得到廣泛的應(yīng)用,可研究生教材中涉及的教學(xué)內(nèi)容還停留在上世紀(jì)90年代的水平,遠(yuǎn)遠(yuǎn)不能滿足當(dāng)今社會(huì)的需求。為此,作者所在的課題組三位老師撰寫(xiě)的國(guó)家“十一五”規(guī)劃教材《數(shù)字圖像處理及模式識(shí)別(第二版)》,教材更新了一些經(jīng)典算法,同時(shí)根據(jù)我們課題組近年在圖像處理領(lǐng)域的最新科研成果,將新算法新技術(shù)融合到教材當(dāng)中,使學(xué)生能夠接觸到本領(lǐng)域的前沿技術(shù)。另外作為教材的最后一章,作者將一個(gè)實(shí)際科研項(xiàng)目作為典型實(shí)例編入教材中,向?qū)W生展示了如何把教材中涉及的理論方法應(yīng)用到實(shí)際工程之中。通過(guò)學(xué)習(xí)本教材,既可掌握經(jīng)典的圖像處理算法,又接觸到目前比較先進(jìn)的圖像處理算法,同時(shí)又可根據(jù)教材提供的很多應(yīng)用實(shí)例和算法源代碼,促進(jìn)學(xué)生掌握理論知識(shí)與實(shí)際問(wèn)題的結(jié)合方法,盡快地運(yùn)用學(xué)到的理論知識(shí)進(jìn)行創(chuàng)新性科學(xué)研究。該教材也于2008年獲得北京市高等學(xué)校精品教材稱號(hào)。
另外教材附帶了一套自主開(kāi)發(fā)的實(shí)驗(yàn)軟件系統(tǒng),為學(xué)生提供實(shí)驗(yàn)平臺(tái),包含六個(gè)實(shí)驗(yàn):圖像的二維傅里葉變換及性質(zhì)、圖像的編碼、圖像的參數(shù)分析、圖像的平滑與銳化、圖像的運(yùn)動(dòng)模糊及去模糊、圖像的匹配識(shí)別。該軟件界面友好,通用性強(qiáng),結(jié)構(gòu)開(kāi)放,可二次開(kāi)發(fā),可以激發(fā)學(xué)生在完成實(shí)驗(yàn)的基礎(chǔ)上積極動(dòng)腦去完善現(xiàn)有實(shí)驗(yàn),開(kāi)發(fā)新的實(shí)驗(yàn)。
2.2改進(jìn)授課內(nèi)容
根據(jù)研究生的特點(diǎn),課堂上除了講授基礎(chǔ)的理論知識(shí)以外,主要針對(duì)當(dāng)前比較熱門(mén)和先進(jìn)的數(shù)字圖像處理方法,以及學(xué)生們比較感興趣的知識(shí)點(diǎn),以專題研討的形式進(jìn)行研究和討論。例如針對(duì)預(yù)防犯罪分子進(jìn)行犯罪活動(dòng)方面,可以通過(guò)人臉識(shí)別的方法在可視頻監(jiān)控的區(qū)域進(jìn)行自動(dòng)人臉特征提取,并用犯罪分子圖庫(kù)進(jìn)行比對(duì)。大家對(duì)這個(gè)技術(shù)很感興趣,對(duì)技術(shù)細(xì)節(jié)進(jìn)行了熱烈的討論,各抒己見(jiàn),通過(guò)這種專題討論,活躍了課堂氣氛,增加了學(xué)生主動(dòng)參與的機(jī)會(huì),激發(fā)了學(xué)生的學(xué)習(xí)熱情和創(chuàng)造靈感。
同時(shí)教學(xué)中注重設(shè)計(jì)了一些新穎的課題,留給學(xué)生課后思考、調(diào)研,課上教師與學(xué)生進(jìn)行研究和討論,增強(qiáng)教與學(xué)的雙向互動(dòng)和交流,避免被動(dòng)式灌輸知識(shí),激發(fā)學(xué)生的學(xué)習(xí)積極性、主動(dòng)性和創(chuàng)造性。
結(jié)合實(shí)際科研成果,將一些數(shù)字圖像處理系統(tǒng)的實(shí)例引入教學(xué)。例如將嵌入式多通道數(shù)字圖像采集處理系統(tǒng)作為例子,講解系統(tǒng)實(shí)現(xiàn)的原理、圖像處理算法的應(yīng)用及編程實(shí)現(xiàn)過(guò)程等等,這樣既避免了抽象知識(shí)的講授,又滿足了學(xué)生對(duì)數(shù)字圖像處理系統(tǒng)的軟、硬件平臺(tái)設(shè)計(jì)方法的掌握,真正達(dá)到學(xué)以致用。 2.3講授手段綜合應(yīng)用
除了常規(guī)的教學(xué)手段以外,更多地應(yīng)用現(xiàn)代多媒體技術(shù)來(lái)授課,包括展示圖片、播放視頻。恰巧多媒體教學(xué)技術(shù)本身就是多種數(shù)字圖像處理技術(shù)的一個(gè)綜合應(yīng)用,所以利用多媒體教學(xué)技術(shù)來(lái)講課就是本門(mén)課程涉及的各種技術(shù)在實(shí)際生產(chǎn)生活中的一個(gè)很好的應(yīng)用實(shí)例。目前教學(xué)主要采用課堂講授,電子課件與板書(shū)相結(jié)合,課內(nèi)實(shí)驗(yàn)與課外實(shí)驗(yàn)相輔助,摒棄灌輸式教學(xué)方法,倡導(dǎo)啟發(fā)式教育,講授課本知識(shí)的同時(shí)注意拓寬學(xué)生知識(shí)面,加強(qiáng)學(xué)生創(chuàng)新能力的培養(yǎng),使學(xué)生的理論基礎(chǔ)和實(shí)踐應(yīng)用能力同步得到提高,取得了較好的教學(xué)效果,幾位教師的學(xué)生評(píng)價(jià)結(jié)果皆為優(yōu)秀。
通過(guò)搭建一些算法平臺(tái),給學(xué)生提供可選擇、有側(cè)重、可設(shè)計(jì)的實(shí)驗(yàn)環(huán)境,彌補(bǔ)本課程沒(méi)有專門(mén)實(shí)驗(yàn)的缺點(diǎn),通過(guò)這些平臺(tái)可以開(kāi)啟學(xué)生的創(chuàng)新研究和實(shí)踐欲望。實(shí)踐環(huán)節(jié)提供自主開(kāi)發(fā)的圖像采集與跟蹤系統(tǒng)軟硬件實(shí)驗(yàn),學(xué)生可自己對(duì)實(shí)驗(yàn)進(jìn)行設(shè)計(jì)并實(shí)時(shí)驗(yàn)證,另外提供一些比較新穎的實(shí)驗(yàn)題目供學(xué)生選做,在學(xué)習(xí)同時(shí)通過(guò)實(shí)驗(yàn)加深對(duì)知識(shí)的理解和掌握。同時(shí)將相關(guān)課件、資料等放置到網(wǎng)絡(luò),供學(xué)生訪問(wèn)下載,并提供Email信箱與學(xué)生答疑和溝通。
2.4講授人員因需而變
除了授課教師外,根據(jù)當(dāng)前研究熱點(diǎn)和學(xué)生感興趣的方向,邀請(qǐng)具有專門(mén)科研經(jīng)驗(yàn)和知識(shí)的博士生,以研討的形式進(jìn)行某個(gè)知識(shí)點(diǎn)的討論,以拓展學(xué)生的知識(shí)面,實(shí)現(xiàn)寬泛的知識(shí)教育,同時(shí)使學(xué)生了解最前沿的學(xué)科方向。
2008年邀請(qǐng)了張健博士做了“H.264轉(zhuǎn)換編碼研究與改進(jìn)”的專題講座;2009年邀請(qǐng)了姜薇博士做了“人臉識(shí)別算法研究”專題講座。通過(guò)博士生的講座,大家了解了研究生階段的科研工作,極大帶動(dòng)了學(xué)生的求知欲,課堂討論熱烈,很多同學(xué)與兩位博士課下進(jìn)行了多次交流,為他們?cè)趯W(xué)術(shù)上起到啟迪作用。同時(shí),大膽地邀請(qǐng)了一名同年級(jí)的碩士生站到講臺(tái)上,就“基于四元數(shù)FFT的水印嵌入算法”進(jìn)行了專題討論,面對(duì)這個(gè)全新的領(lǐng)域,很多同學(xué)被深深震撼了,同時(shí)感到了壓力和差距,觸動(dòng)學(xué)生從主觀意識(shí)上對(duì)本門(mén)課產(chǎn)生興趣,掀起理論課程聯(lián)系實(shí)際項(xiàng)目的學(xué)習(xí)熱潮。
2.5教學(xué)思想的討論與轉(zhuǎn)變
研究生教學(xué)的目的不是要學(xué)生只掌握書(shū)本的知識(shí),也不是必須進(jìn)行卷面考核。特別是本門(mén)課程的實(shí)踐性很強(qiáng),所以本課程通過(guò)提供幾個(gè)具有綜合性、設(shè)計(jì)性的命題,結(jié)合我們提供的一些平臺(tái),讓學(xué)生自己完成方案設(shè)計(jì)、命題的實(shí)現(xiàn),更鼓勵(lì)同學(xué)自己提出命題來(lái)進(jìn)行研究實(shí)現(xiàn),以期使學(xué)生真正融會(huì)貫通本門(mén)課程的思想精髓,更好地解決理論知識(shí)和科研能力的銜接,也真正實(shí)現(xiàn)本門(mén)課程的以素質(zhì)為基礎(chǔ)、知識(shí)為手段、實(shí)踐為中介、能力為目標(biāo)的教學(xué)宗旨。
3 教學(xué)改革總結(jié)
由于本課題組教師在“數(shù)字圖像處理與模式識(shí)別”這門(mén)課中一直貫穿著先進(jìn)的教育理念,得到了全校學(xué)生的認(rèn)可,教學(xué)效果良好,2010年聽(tīng)課人數(shù)達(dá)到了169人,并有不同專業(yè)的多名博士生進(jìn)行了旁聽(tīng)。
經(jīng)過(guò)了幾位教師的努力,本門(mén)課的教學(xué)改革已見(jiàn)成效,使“教”與“學(xué)”達(dá)到了有機(jī)的平衡和統(tǒng)一,教師知道學(xué)生想學(xué)什么,學(xué)生知道理論知識(shí)如何應(yīng)用,真正達(dá)到學(xué)以致用,并會(huì)在實(shí)際科研工作中總結(jié)問(wèn)題,運(yùn)用理論知識(shí)來(lái)解決實(shí)際問(wèn)題,也達(dá)到了研究生教學(xué)改革的目的。
參考文獻(xiàn):
[1]岡薩雷斯.數(shù)字圖像處理[M].第2版.北京:電子工業(yè)出版社,1998.
篇6
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò) 圖像處理 機(jī)器人 草莓
中圖分類號(hào):TP301.6 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2012)07-0091-02
國(guó)內(nèi)外對(duì)圖像處理技術(shù)和神經(jīng)網(wǎng)絡(luò)理論在果蔬商品化應(yīng)用中的部分成果已進(jìn)入了實(shí)用階段。隨著計(jì)算機(jī)科學(xué)的飛速發(fā)展和在許多領(lǐng)域中的成功應(yīng)用,果蔬采收分級(jí)的實(shí)時(shí)自動(dòng)化已經(jīng)變得完全可能。但是,生物特征的多變性和隨機(jī)性與工業(yè)產(chǎn)品有著很大區(qū)別。在草莓采收、分級(jí)這一過(guò)程中,為了提高檢測(cè)的精度、速度和準(zhǔn)確性,需要解決多種技術(shù)問(wèn)題,如:光源的選擇和設(shè)置;圖像的采集方式和圖像的質(zhì)量;硬件處理速度;模式識(shí)別算法;要求有更多分級(jí)算法的訓(xùn)練樣本等。從長(zhǎng)遠(yuǎn)看,應(yīng)該對(duì)揀選對(duì)象的形狀、表面、光學(xué)、熱學(xué)、化學(xué)、生物學(xué)等各方面的特征和生理機(jī)能進(jìn)行更加深入的研究,這樣才有利于檢測(cè)技術(shù)改進(jìn),促使新的信息采集技術(shù)和傳感技術(shù)的產(chǎn)生。
草莓是一種營(yíng)養(yǎng)豐富的高級(jí)水果,隨著人們生活水平的提高,草莓按其顏色、形狀及大小進(jìn)行揀選分類、包裝將成為趨勢(shì)。因此,草莓形狀的判別的研究和草莓揀選設(shè)備的開(kāi)發(fā)具有很重要的現(xiàn)實(shí)意義。
1、草莓形狀的判別
收割后的草莓按其顏色、大小、形狀均可分為不同的等級(jí)。因此,草莓形狀的判斷是揀選者根據(jù)對(duì)標(biāo)準(zhǔn)草莓規(guī)格的理解和經(jīng)驗(yàn)來(lái)判斷出結(jié)果。本設(shè)計(jì)中草莓形狀的識(shí)別部分采用了神經(jīng)網(wǎng)絡(luò)的識(shí)別技術(shù),神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)功能和很強(qiáng)的模式識(shí)別能力,即使當(dāng)局部網(wǎng)絡(luò)受損時(shí),仍然能夠恢復(fù)原來(lái)信息。神經(jīng)網(wǎng)絡(luò)的信息分布式存儲(chǔ)于聯(lián)結(jié)權(quán)值系數(shù)中,使網(wǎng)絡(luò)具有很高的容錯(cuò)性,而圖像識(shí)別中往往存在噪聲干擾或輸入圖像的部分損失,因此,神經(jīng)網(wǎng)絡(luò)可以很好地解決圖像識(shí)別問(wèn)題。另外,神經(jīng)網(wǎng)絡(luò)的自組織和自學(xué)習(xí)功能,使其對(duì)圖像問(wèn)題的識(shí)別和處理較傳統(tǒng)圖象識(shí)別方法顯示出極大的優(yōu)越性。因此,草莓揀選設(shè)備只要通過(guò)對(duì)標(biāo)準(zhǔn)形狀草莓的學(xué)習(xí)就可得到非常接近人的判別效果。
為此,本論文提出了一種新的算法來(lái)解決草莓揀選的問(wèn)題,該算法是基于圖像處理技術(shù)、神經(jīng)網(wǎng)絡(luò)算法而生成的一種草莓形狀判別算法。并利用該算法開(kāi)發(fā)了草莓揀選設(shè)備。
2、草莓揀選設(shè)備的構(gòu)成
草莓揀選設(shè)備硬件系統(tǒng)組成如圖1所示。CCD攝像機(jī)將所要識(shí)別、解釋的對(duì)象以圖像的形式記錄下來(lái);插入計(jì)算機(jī)內(nèi)部的圖像采集卡可以將攝像機(jī)采集的電信號(hào)轉(zhuǎn)變?yōu)閿?shù)字信號(hào),即圖像數(shù)字化,以便計(jì)算機(jī)對(duì)其進(jìn)行各種必要的處理;照明裝置為圖像采集提供合適的光源,以便對(duì)圖像進(jìn)行處理和分析。
3、草莓形狀圖像分割及特征提取
人工揀選草莓時(shí)很容易根據(jù)草莓果實(shí)部分的形狀特征來(lái)判別其等級(jí),但對(duì)草莓揀選設(shè)備來(lái)說(shuō),草莓是任意放置在傳送帶上的,計(jì)算機(jī)采集到的草莓圖像其方位是不確定的。因此,本設(shè)計(jì)采用了彩色圖像處理技術(shù)。圖2中,(a)圖是圖像卡采集到的草莓圖像信號(hào)以RGB彩色模型顯示在監(jiān)視器上。它的R輝度圖像如圖(b)所示。想要得到草莓的形狀特征圖像,就要對(duì)采集到的草莓彩色圖像做以下處理:
第一步:把彩色圖像轉(zhuǎn)換成黑白的二值圖像,經(jīng)過(guò)濾波、填充、提取邊緣信號(hào)等處理后,最終得到整體輪廓線圖像(c);
第二步:彩色圖像減去R輝度圖像產(chǎn)生目標(biāo)圖像(d);
第三步:目標(biāo)圖像經(jīng)二值和邊緣提取處理后,得到了果實(shí)輪廓線圖像,如(e)所示;
第四步:最后把整體圖像輪廓線圖像和果實(shí)輪廓線圖像這兩種圖像進(jìn)行邏輯運(yùn)算,然后得到曲線型草莓形狀特征圖像,如(f)所示。
4、基于神經(jīng)網(wǎng)絡(luò)的判別
得到的草莓形狀特征可以用一組八參數(shù)來(lái)表示,要?jiǎng)澐諥、B、C等級(jí)就需要控制兩個(gè)空氣驅(qū)動(dòng)器。我們建立的人工神經(jīng)網(wǎng)絡(luò)是基于BP算法的前向三層神經(jīng)網(wǎng)絡(luò),如圖3所示。選用了兩個(gè)結(jié)構(gòu)簡(jiǎn)單的BP網(wǎng)絡(luò),輸入為8,正好每個(gè)參數(shù)對(duì)應(yīng)一個(gè)輸入端單元;輸出為2,每個(gè)輸出單元控制一個(gè)空氣驅(qū)動(dòng)器。在進(jìn)行前向多層神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)時(shí),不斷調(diào)整隱層節(jié)點(diǎn)數(shù),經(jīng)過(guò)試驗(yàn),采用8-4-2結(jié)構(gòu)。
5、軟件程序的功能
判別草莓形狀的系統(tǒng)軟件程序是實(shí)現(xiàn)草莓的揀選功能的關(guān)鍵。系統(tǒng)軟件在功能上劃分為訓(xùn)練部分和判斷部分。訓(xùn)練部分包括圖像處理、特征提取和網(wǎng)絡(luò)訓(xùn)練;判斷部分包括圖像處理、特征的提取和判斷以及草莓的移動(dòng)控制。系統(tǒng)程序用MicrosoftC語(yǔ)言編寫(xiě),程序流程圖如圖4所示。
6、結(jié)語(yǔ)
本文通過(guò)計(jì)算機(jī)圖形處理技術(shù)、模式識(shí)別等理論的研究,結(jié)合神經(jīng)網(wǎng)絡(luò)算法進(jìn)行了草莓形狀判別的設(shè)計(jì),在草莓形狀的有效特征提取和分類識(shí)別方面進(jìn)行了理論上的研究,提出了基于前向三層神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)圖像處理的一種能對(duì)草莓形狀進(jìn)行自動(dòng)判別的新方法,為草莓的揀選機(jī)器人的開(kāi)發(fā)提供了理論基礎(chǔ)。草莓揀選設(shè)備乃至其他水果揀選設(shè)備的開(kāi)發(fā)對(duì)將要進(jìn)入老齡化社會(huì)的我國(guó)來(lái)說(shuō)是很有意義的。
參考文獻(xiàn)
[1]王耀南,李樹(shù)濤,毛建旭.計(jì)算機(jī)圖像處理與識(shí)別技術(shù)[M].北京:高等教育出版社,2001.237~260
[2]曹其新,呂恬生,永田雅輝等.草莓揀選機(jī)器人的開(kāi)發(fā)[J].上海交通大學(xué)學(xué)報(bào),1999,33(7):880~884.
[3]王年,任彬,黃勇等.基于神經(jīng)網(wǎng)絡(luò)的汽車車型圖象自動(dòng)識(shí)別[J].中國(guó)圖象圖形學(xué)報(bào)1999,4(8):669~672.
[4]福利(Foley,J.D.)等著.計(jì)算機(jī)圖形學(xué)原理及實(shí)踐C語(yǔ)言描述[M].北京:機(jī)械工業(yè)出版社,2002.6~36.
[5]徐麗娜.神經(jīng)網(wǎng)絡(luò)控制[M].哈爾濱:哈爾濱工業(yè)出版社,1999.4~34.
[6]田村秀行編著,金喜子,喬雙譯.計(jì)算機(jī)圖像處理[M].北京科學(xué)出版社,2004.86~115.
篇7
關(guān)鍵詞:小波變換,可操縱金字塔,濾波器,紋理
0.引言:紋理特征是圖像的基本特征之一,是一種全局特征,它描述了圖像或者圖像區(qū)域所對(duì)應(yīng)的景物的表面性質(zhì)。包括表面結(jié)構(gòu)組織及其與周圍環(huán)境關(guān)系的許多重要信息,紋理特征是一種統(tǒng)計(jì)特征,具有旋轉(zhuǎn)不變性,并具有較強(qiáng)的抗噪音能力,它被廣泛應(yīng)用于圖像識(shí)別以及圖像檢索技術(shù)中。圖像的紋理特征的提取及其分析方法的采用對(duì)識(shí)別及其檢索的準(zhǔn)確率具有很大的影響。小波變換和可操縱金字塔被廣泛應(yīng)用于圖像處理問(wèn)題中,比如圖像的融合,圖像分割,圖像增強(qiáng),邊緣檢測(cè)等,小波變換和可操縱金字塔同樣可應(yīng)用于圖像的紋理特征分析。
1.圖像紋理特征
紋理特征是圖像的基本特征之一,是一種全局特征,它描述了圖像或者圖像區(qū)域所對(duì)應(yīng)的景物的表面性質(zhì)。通常圖像紋理特征可用這些參數(shù)表征:能量、信息熵、梯度、尺度共生距、峰值、不變性。
2.小波變換與可操縱金字塔
篇8
關(guān)鍵詞:PCB;圖像處理;視覺(jué)檢測(cè)
中圖分類號(hào):TP277文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)07-1648-06
當(dāng)今世界科技發(fā)展日新月異,電子產(chǎn)業(yè)的發(fā)展直接制約著國(guó)民經(jīng)濟(jì)的騰飛與否,而PCB電路板制作工藝的提高對(duì)促進(jìn)電子產(chǎn)業(yè)的發(fā)展至關(guān)重要,能否有效精確地檢測(cè)PCB電路板的缺陷一直都是電子行業(yè)的研究熱點(diǎn)。國(guó)外的印刷電路板自動(dòng)檢測(cè)技術(shù)一直領(lǐng)先于國(guó)內(nèi),國(guó)內(nèi)的很多廠家不得不采用昂貴的外國(guó)技術(shù),雖然近年國(guó)內(nèi)的印刷電路板自動(dòng)檢測(cè)技術(shù)發(fā)展迅速,但大都沒(méi)有取得令人非常滿意的結(jié)果。加入研究這一領(lǐng)域的熱潮,趕超外國(guó)的先進(jìn)技技水平,打斷外國(guó)壟斷技術(shù),對(duì)于發(fā)展國(guó)民經(jīng)濟(jì)具有十分重要的意義。
1 PCB檢測(cè)系統(tǒng)的硬件設(shè)計(jì)
1.1 PCB檢測(cè)系統(tǒng)的硬件組成框圖
雖然本文所做的工作主要是軟件方面,但對(duì)于硬件系統(tǒng)的設(shè)計(jì)也是至關(guān)重要的,它對(duì)于建立有效的計(jì)算機(jī)視覺(jué)識(shí)別檢測(cè)系統(tǒng),起著決定性作用。因此,必須在綜合考慮系統(tǒng)性價(jià)比和系統(tǒng)性能的基礎(chǔ)上,設(shè)計(jì)出合理的硬件系統(tǒng)[9]。PCB檢測(cè)系統(tǒng)的硬件組成框圖如圖1所示:圖1 PCB檢測(cè)系統(tǒng)硬件組成框圖
1.2系統(tǒng)的硬件組成
系統(tǒng)的硬件組成[10]主要包括:計(jì)算機(jī)主機(jī)、CCD攝像機(jī)、圖像采集卡、照明系統(tǒng)及相關(guān)的設(shè)備。
2 PCB電路板缺陷檢測(cè)識(shí)別
PCB電路板在電子工業(yè)中的應(yīng)用越來(lái)越廣泛,如何降低電路板的故障率、提高電路板的質(zhì)量直接影響到整個(gè)產(chǎn)業(yè)的發(fā)展。因此,對(duì)于PCB電路板缺陷的識(shí)別技術(shù)的發(fā)展至關(guān)重要。PCB電路板的缺陷很多[16],主要有短路、斷路、劃痕、凸起、空洞、缺焊、過(guò)焊等等,由于實(shí)驗(yàn)室設(shè)備限制和個(gè)人水平所限,本文主要研究的內(nèi)容是PCB電路板短路與斷路的檢測(cè)識(shí)別
近年來(lái)出現(xiàn)了很多圖像檢測(cè)算法,這些算法大致可分為三大類:有參考算法、無(wú)參考算法以及混合型算法。有參考算法分為兩大類:圖像對(duì)比法和模型對(duì)比法。無(wú)參考算法是一種不需要標(biāo)準(zhǔn)圖像的檢測(cè)算法,它是基于一定的設(shè)計(jì)規(guī)則來(lái)進(jìn)行檢測(cè)的?;旌闲头椒ㄊ菍⒂袇⒖妓惴ㄅc無(wú)參考算法混合使用,從而發(fā)揮出各自的優(yōu)點(diǎn)。比如,模板匹配法與數(shù)學(xué)形態(tài)學(xué)方法結(jié)合使用,或者連接表方法與數(shù)學(xué)形態(tài)學(xué)方法結(jié)合使用等。本文中短路與斷路的檢測(cè)識(shí)別采取了圖像對(duì)比法,即將經(jīng)過(guò)一定處理后的圖像進(jìn)行相減,從而分析相應(yīng)的結(jié)果;而對(duì)焊點(diǎn)缺陷的識(shí)別主要采用模板匹配法與數(shù)學(xué)形態(tài)學(xué)方法結(jié)合使用。
2.1 PCB電路板缺陷檢測(cè)識(shí)別的主要流程圖
圖2為子程序流程圖;圖3為主程序流程圖。
2.2 PCB電路板短路與斷路的檢測(cè)識(shí)別
2.2.1邊緣檢測(cè)
在對(duì)圖像進(jìn)行基本的處理過(guò)后可以將圖像與背景分割開(kāi)來(lái)。邊緣檢測(cè)是圖像處理和計(jì)算機(jī)視覺(jué)中的基本問(wèn)題,邊緣檢測(cè)的目的是標(biāo)識(shí)數(shù)字圖像中亮度變化明顯的點(diǎn)。圖像屬性中的顯著變化通常反映了屬性的重要事件和變化。
這些包括:深度上的不連續(xù);表面方向不連續(xù);物質(zhì)屬性變化;場(chǎng)景照明變化。邊緣檢測(cè)是圖像處理和計(jì)算機(jī)視覺(jué)中,尤其是特征提取中的一個(gè)研究領(lǐng)域。
圖像邊緣檢測(cè)大幅度地減少了數(shù)據(jù)量,并且剔除了可以認(rèn)為不相關(guān)的信息,保留了圖像重要的結(jié)構(gòu)屬性。有許多方法用于邊緣檢測(cè),它們的絕大部分可以劃分為兩類[17]:基于查找一類和基于零穿越的一類?;诓檎业姆椒ㄍㄟ^(guò)尋找圖像一階導(dǎo)數(shù)中的最大和最小值來(lái)檢測(cè)邊界,通常是將邊界定位在梯度最大的方向?;诹愦┰降姆椒ㄍㄟ^(guò)尋找圖像二階導(dǎo)數(shù)零穿越來(lái)尋找邊界,通常是Laplacian過(guò)零點(diǎn)或者非線性差分表示的過(guò)零點(diǎn)。
1)Roberts算子
邊緣,是指周圍像素灰度有階躍變化或屋頂?shù)茸兓哪切┫袼氐募?。圖像的邊緣對(duì)應(yīng)著圖像灰度的不連續(xù)性。顯然圖像的邊緣很少是從一個(gè)灰度跳到另一個(gè)灰度這樣的理想狀況。真實(shí)圖像的邊緣通常都具有有限的寬度呈現(xiàn)出陡峭的斜坡?tīng)睢_吘壍匿J利程度由圖像灰度的梯度決定。梯度是一個(gè)向量,?f指出灰度變化的最快的方向和數(shù)量,如式2-1所示。
?f=(決定的。
因此最簡(jiǎn)單的邊緣檢測(cè)算子是用圖像的垂直和水平差分來(lái)逼近梯度算子,式2-4所示。?f=(f(x,y)-f(x-1,y),f(x,y)-f(x,y-1))(式2-4)
因此當(dāng)我們想尋找邊緣的時(shí)候,最簡(jiǎn)單的方法是對(duì)每一個(gè)像素計(jì)算出(2,4)的向量,然后求出他的絕對(duì)值,然后進(jìn)行閥值操作就可以了。利用這種思想就得到了Roberts算子,由式2-5所示。
R(i,j)=
(式2-5)
它是一個(gè)兩個(gè)2×2模板作用的結(jié)果。
2)Sobel算子
該算法通過(guò)2個(gè)3*3的模板,對(duì)選定的二維圖像中同樣大小窗口進(jìn)行卷積,通常是一個(gè)模板對(duì)一個(gè)邊緣響應(yīng)大,另一個(gè)模板對(duì)水平邊緣響應(yīng)大,兩個(gè)卷積值對(duì)最大值作為該點(diǎn)對(duì)輸出。對(duì)于圖像上的任意點(diǎn)(i,j)進(jìn)行卷積,可得其X方向上的差分由式2-6、式2-7所示。Δx=f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1)-[f(i-1,j-1)+2f(i,j-1)+f(i+1,j-1)](式2-6)Δy=f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1)-[f(i+1,j+1)+2f(i+1,j)+f(i+1,j+1)](式2-7)則輸出圖像公式如式2-8所示。
用sobel算子檢測(cè)階躍邊緣得到的邊緣寬度至少為兩個(gè)寬度。3)Laplacian邊緣檢測(cè)算子
Laplacian算子定義由式2-9所示。
Δ2f(x,y)=
(式2-9)它的差分形式由式2-10所示。
Δ2f(x,y)={[f(x+1,y)-f(x,y)]-[f(x,y)-f(x-1,y)]}+{[f(x,y+1)-f(x,y)]-[f(x,y)-f(x,y-1)]}
=f(x+1,y)+f(x-1,y)+f(x,y-1)+f(x,y+1)+f(x,y+1)+4f(x+1,y)(式2-10)
Laplacian算子是一種各向同性算子,在只關(guān)心邊緣的位置而不考慮其周圍的灰度象素差值時(shí)時(shí)比較合適,Laplacian算子對(duì)孤立象素的響應(yīng)要比對(duì)邊緣或線的響應(yīng)更要強(qiáng)烈,因此只適用于無(wú)噪聲圖像。
原圖像與用三種邊緣檢測(cè)算子處理后的圖像如下所示:圖6 Sobel邊緣檢測(cè)圖7 Laplacian邊緣檢測(cè)
從上面四幅圖分析比較可得出結(jié)論:用Roberts邊緣檢測(cè)得出的圖像較之其他方法更為清晰,噪點(diǎn)更少,圖像更為連續(xù),所以本文中采用Roberts算子來(lái)進(jìn)行邊緣檢測(cè)。
2.2.2閾值分割
閾值分割法是一種基于區(qū)域的圖像分割技術(shù),其基本原理是:通過(guò)設(shè)定不同的特征閾值,把圖像象素點(diǎn)分為若干類。常用的特征包括:直接來(lái)自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征。設(shè)原始圖像為f(x,y),按照一定的準(zhǔn)則f(x,y)中找到特征值T,將圖像分割為兩個(gè)部分,分割后的圖像為:
若取:b0=0(黑),b1=1(白),即為我們通常所說(shuō)的圖像二值化。
在數(shù)字化的圖像數(shù)據(jù)中,無(wú)用的背景數(shù)據(jù)和對(duì)象物的數(shù)據(jù)經(jīng)常放在一起,同時(shí),圖像中還含有各種噪聲,因此可以根據(jù)圖像的統(tǒng)計(jì)性質(zhì),從概率的角度來(lái)選擇合適的閾值。
1)最大方差閾值法
把待處理圖像的直方圖在某一閾值處分割為兩組,當(dāng)被分割成的兩組間的方差最大時(shí),便可以決定閾值了。
設(shè)灰度圖像f(x,y)的灰度級(jí)為0-L,灰度級(jí)I的像素為Ni,則圖中:
總象素?cái)?shù)N=∑j=0 i=LNi(式2-11)灰度級(jí)i出現(xiàn)的概率Pi= 1-ω(K)(式2-16)則兩組間的數(shù)學(xué)期望為ω0μ0ω1μ1=μ(式2-17)兩組間的方差為ρ2(k)
ρ2(k)是K的函數(shù),計(jì)算k取從0,1,2…L時(shí)ρ2(k)的值,當(dāng)多的值為最大時(shí),K即為閾值。
2)雙峰法
根據(jù)圖像的直方圖具有背景和對(duì)象物的兩個(gè)峰,分割兩個(gè)區(qū)域的閾值由兩個(gè)峰值之間的谷所對(duì)應(yīng)的灰度值決定。設(shè)灰度圖像f(x,y)的灰度級(jí)為0-L,灰度i的像素為Pi,分別計(jì)算
因?yàn)閷?shí)際PCB電路板有著許多的劃痕、污點(diǎn)等,使用最大方差閾值法時(shí),會(huì)在處理后的圖像上產(chǎn)生許多誤點(diǎn),而影響實(shí)際結(jié)果的分析,而雙峰法能夠順利地濾除這些干擾,這個(gè)結(jié)論在分析對(duì)比以上圖像時(shí)也可得出。所以本文選用了雙峰法來(lái)進(jìn)行閾值分割。
2.2.3粒子分析與圖像對(duì)比
經(jīng)過(guò)邊緣檢測(cè)和閾值分割的圖像中會(huì)存在許多瑕點(diǎn),這些點(diǎn)會(huì)影響到最后的圖像識(shí)別與分析,有可能會(huì)增加多余的殘留圖像。本文中利用NI VISION ASSISTANT中的REMOVE SMALL OBJECTS功能進(jìn)行去除,如圖11和圖12所示。圖11原圖像圖12粒子分析
將標(biāo)準(zhǔn)PCB圖片減去缺陷缺陷PCB圖片,便可以得到缺陷板的斷路部分的圖像,再利用NI ASSISTANT中的PARTICLE ANALYSIS可以得到斷路部分的具體分析,如圖13示。
將缺陷PCB圖片減去標(biāo)準(zhǔn)PCB圖片,便可以得到缺陷板的短路部分的圖像,與上述相同的方法,便可以得到短路部分的具體分析,如圖14所示。
3結(jié)束語(yǔ)
利用LABVIEW來(lái)進(jìn)行PCB電路板缺陷的識(shí)別與檢測(cè)是一項(xiàng)非常好的課題,它在近些年已經(jīng)得到了一定的發(fā)展,并將得到更大的進(jìn)步。限于本人能力和時(shí)間,本文的研究還未涉及很深的領(lǐng)域,可以在以下方面加以改進(jìn):
1)本文中只利用到NI公司的LABVIEW和IMAQ VISION,更好的設(shè)計(jì)可以再利用其他語(yǔ)言如VISUAL BASIC,C++等編程語(yǔ)言加以輔助設(shè)計(jì),相信可以取得更加令人滿意的結(jié)果。
2)由于實(shí)驗(yàn)設(shè)備等其他因素,本文中只重點(diǎn)研究了PCB電路板短路與斷路的檢測(cè)識(shí)別,PCB電路板的其他缺陷還有待于進(jìn)一步的分析研究、分類和總結(jié),并設(shè)計(jì)出更好的檢測(cè)方法,以真正滿足PCB電路板檢測(cè)的需求。
3)照明設(shè)備的限制在很大程度上影響到了圖像的檢測(cè)效果,為取得PCB缺陷檢測(cè)的進(jìn)一步進(jìn)展,在照明設(shè)備的選擇上必須重視,并且設(shè)計(jì)出更好的圖像采集系統(tǒng)。
4)在識(shí)別與檢測(cè)手段上,可以引入更新更好的方法,而不要局限于在傳統(tǒng)的方法中分析比較,例如基于BP神經(jīng)網(wǎng)絡(luò)的識(shí)別檢測(cè),圖像的模糊決策等將有待于進(jìn)一步研究。
總之,基于LABVIEW的機(jī)器視覺(jué)檢測(cè)系統(tǒng)已經(jīng)取得了不錯(cuò)的進(jìn)展,高速發(fā)展的PCB制造技術(shù)和計(jì)算機(jī)技術(shù)對(duì)于PCB缺陷的檢測(cè)提出了更高的要求,同時(shí)也大大地促進(jìn)了PCB缺陷檢測(cè)技術(shù)的發(fā)展。利用機(jī)器視覺(jué)檢測(cè)在未來(lái)的較長(zhǎng)的一段時(shí)間內(nèi)將占據(jù)檢測(cè)行業(yè)的半壁江山,相信在未來(lái)會(huì)取得更大的發(fā)展。
參考文獻(xiàn):
[1]程學(xué)慶,房曉溪.LabVIEW圖形化編程與實(shí)例應(yīng)用[M].北京:中國(guó)鐵道出版社,2005.
[2]胡仲波.基于虛擬儀器技術(shù)的PCB視覺(jué)檢測(cè)系統(tǒng)[D].南京:南京理工大學(xué)碩士學(xué)位論文,2006.
[3]段峰,王耀南.機(jī)器視覺(jué)技術(shù)及其應(yīng)用綜述[J].自動(dòng)化博覽,2002,19(3).
[4]周長(zhǎng)發(fā).精通Visual C++圖像處理編程[M].北京:電子工業(yè)出版社,2004.
[5]陳錫輝,張銀鴻.LabVIEW 8.20程序設(shè)計(jì)從入門(mén)到精通[M].北京:清華大學(xué)出版社,2007.
[6]鄭偉.圖像法檢測(cè)印刷電路板缺陷[M].西安:西安理工大學(xué),2002.
[7] National Instruments,IMAQ User Manual Concepts[Z].1999.
[8]李強(qiáng).PCB板缺陷自動(dòng)檢測(cè)技術(shù)的分析研究[D].合肥:合肥工業(yè)大學(xué),2002.
[9]傅茂名.基于形態(tài)邊緣檢測(cè)算法的一種改進(jìn)[J].電子科技大學(xué)學(xué)報(bào),2005(2).
[10]王思華.計(jì)算機(jī)視覺(jué)新技術(shù)及其在IC標(biāo)記質(zhì)量檢驗(yàn)系統(tǒng)設(shè)計(jì)中的應(yīng)用[J].電子技術(shù)應(yīng)用,2000(9).
[11]岳永哲.圖像處理技術(shù)在閱卷系統(tǒng)中的應(yīng)用[D].北京:北京工業(yè)大學(xué),2006.
[12] Bruce sehneier.Applied Cryptography protocols,Algorithms,and SourceCode[M].C Jolm Wiley & Sons,Inc,1994.
[13] William work Security Essentials:Applications and Standard[M].Prentice Hall/Pearson,2002.
[14]高育鵬,楊俊,何廣軍.基于圖像識(shí)別的自動(dòng)閱卷系統(tǒng)研究[J].現(xiàn)代電子期刊,2006(22).
[15]楊青燕,彭延軍.基于灰度圖像的答題卡識(shí)別技術(shù)[J].山東科技大學(xué)學(xué)報(bào):自然科學(xué)版,2009(3).
[16]周海濤,韓曉軍.基于數(shù)字圖像處理的答題卡識(shí)別方法研究[J].電腦知識(shí)與技術(shù),2008(28).
[17]周萬(wàn)珍,鄭廣,王建霞,等.數(shù)字圖像處理技術(shù)在客觀題閱卷中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2006(8).
[18]王勝春.基于SVM的信息卡識(shí)別系統(tǒng)[D].長(zhǎng)沙:湖南師范大學(xué),2008.
[19]吳志明.SMT系統(tǒng)中焊點(diǎn)位置的檢測(cè)[D].哈爾濱:哈爾濱工業(yè)大學(xué),2006.
[20]楊敏,王春青,鄒增大,等.表面組裝印刷電路板上焊點(diǎn)信息的自動(dòng)獲取[J].焊接學(xué)報(bào),2005,39(6).
篇9
【摘 要】目前中學(xué)物理教學(xué)與實(shí)驗(yàn)一般只涉及兩小球在直線上的碰撞,二維碰撞運(yùn)動(dòng)是新內(nèi)容。筆者運(yùn)用文獻(xiàn)研究法和實(shí)驗(yàn)方法,分別利用數(shù)碼相機(jī)的“連拍合成技術(shù)”“高速連拍技術(shù)”和“攝像技術(shù)”對(duì)兩球斜碰過(guò)程進(jìn)行圖形獲取、圖像處理、數(shù)據(jù)分析,分析總結(jié)得出盡量減小驗(yàn)證二維動(dòng)量守恒實(shí)驗(yàn)誤差的技術(shù)方法,以便增強(qiáng)課程的科學(xué)性、可操作性與趣味性,進(jìn)而提升學(xué)生的探究能力。
關(guān)鍵詞 視頻分析法;數(shù)碼相機(jī);二維動(dòng)量守恒;拍攝技術(shù);誤差
【中圖分類號(hào)】G434 【文獻(xiàn)標(biāo)識(shí)碼】B
【論文編號(hào)】1671-7384(2015)01-0073-03
在人教版高中物理選修3-5《動(dòng)量守恒定律》一章中,教師用滑塊在氣墊導(dǎo)軌上的直線運(yùn)動(dòng)演示“驗(yàn)證動(dòng)量守恒定律”的實(shí)驗(yàn),這個(gè)實(shí)驗(yàn)研究的是一維碰撞動(dòng)量守恒,但實(shí)際生活中更多的是二維或是三維的斜碰,如臺(tái)球的碰撞、保齡球的碰撞、微觀粒子的碰撞和天體的碰撞等[1]。二維或三維運(yùn)動(dòng)是大學(xué)物理實(shí)驗(yàn)教學(xué)中的重要內(nèi)容[2],在現(xiàn)有的普通物理實(shí)驗(yàn)教學(xué)中,一般只涉及兩小球在直線上的碰撞,二維碰撞運(yùn)動(dòng)是新內(nèi)容。
利用視頻分析法探究小球“二維碰撞動(dòng)量守恒”既有利于學(xué)生對(duì)動(dòng)量守恒物理知識(shí)的完整理解,又有利于學(xué)生掌握利用多媒體技術(shù)及基本的數(shù)字化研究方法。本論文分別利用 “連拍合成技術(shù)”“高速連拍技術(shù)”和“攝像技術(shù)”三種技術(shù)對(duì)小球二維碰撞動(dòng)量守恒進(jìn)行探究實(shí)驗(yàn)。
實(shí)驗(yàn)準(zhǔn)備
1.實(shí)驗(yàn)工具與軟件:CASIO(EX—FH100)數(shù)碼相機(jī)、計(jì)算機(jī)、三腳架、光滑的玻璃平面、水平儀、兩個(gè)顏色不同大小質(zhì)量相同的直徑為25mm的小球、Mr.captor頻閃截屏軟件、幾何畫(huà)板等。
2.實(shí)驗(yàn)環(huán)境與條件:在進(jìn)行實(shí)驗(yàn)之前要保證平面和相機(jī)水平,玻璃面盡量光滑使摩擦力減少到最小。這里我們用到水平儀分別對(duì)相機(jī)與平面進(jìn)行校準(zhǔn),如圖1和圖2。
實(shí)驗(yàn)過(guò)程
用數(shù)碼相機(jī)的“連拍合成技術(shù)”“高速連拍技術(shù)”“攝像技術(shù)”結(jié)合頻閃截屏軟件與幾何畫(huà)板軟件,分別對(duì)兩球斜碰過(guò)程進(jìn)行圖形獲取、圖像處理、數(shù)據(jù)分析。
1.連拍合成技術(shù)
(1)圖像獲取
通過(guò)相機(jī)的BS功能鍵進(jìn)入到情景模式區(qū),選定“連拍影像合成”,如圖3。
拍攝的時(shí)候,相機(jī)會(huì)以5張/秒的連拍速度捕捉一個(gè)連貫的動(dòng)作。兩個(gè)顏色不同、大小質(zhì)量相同的玻璃球作為研究對(duì)象,在光滑平面上,讓綠色小球碰撞藍(lán)色小球,拍攝小球的二維碰撞過(guò)程,獲得連拍合成圖像,如圖4所示。
(2)圖像處理
①將圖片粘貼到“幾何畫(huà)板”中,利用“點(diǎn)工具”將圖片中的綠色小球和藍(lán)色小球分別用綠色圓點(diǎn)和藍(lán)色圓點(diǎn)表示出來(lái)。
②點(diǎn)擊工具欄中的自定義工具項(xiàng)目,選擇圓工具中過(guò)三點(diǎn)的圓(虛線),如圖5所示。選擇圖片中圓表面的任意三點(diǎn),軟件就能將小球圓心標(biāo)識(shí)出來(lái)。
③選擇移動(dòng)箭頭,鼠標(biāo)移動(dòng)到圓上點(diǎn)擊鼠標(biāo)右鍵,會(huì)出現(xiàn)如圖6所示的對(duì)話框,選擇隱藏圓。圓框消失后,將鼠標(biāo)移動(dòng)到圓表面的三個(gè)點(diǎn),點(diǎn)擊右鍵,選擇隱藏點(diǎn),依次將三點(diǎn)全部隱藏,最終圓心就能確定了。
④ 選中各點(diǎn)點(diǎn)擊“度量”菜單中的“橫坐標(biāo)”“縱坐標(biāo)”就可以顯示小球所在位置的坐標(biāo)值,再點(diǎn)擊“顯示”菜單中的“隱藏照片”。
圖像處理結(jié)果如圖7所示。
(3)數(shù)據(jù)分析
選定各點(diǎn)坐標(biāo)再點(diǎn)擊“數(shù)據(jù)”菜單中的“制表”,可以得到橫縱坐標(biāo)的表格。由于玻璃板光滑,可以認(rèn)為小球近似做勻速直線運(yùn)動(dòng),速度可以通過(guò)得到,其中。經(jīng)過(guò)計(jì)算算得在x方向動(dòng)量誤差為9.7%,在y方向動(dòng)量誤差為4.9%,平均誤差為7.3%。在誤差允許的范圍內(nèi),小球二維碰撞過(guò)程的動(dòng)量守恒得到驗(yàn)證。
(4)注意事項(xiàng)
此相機(jī)的連拍速度是5張/秒,如果物體運(yùn)動(dòng)速度太快,相機(jī)合成效果不明顯;物體運(yùn)動(dòng)速度太慢,畫(huà)面重疊,所以在做實(shí)驗(yàn)前要了解相機(jī)的連拍速度,以便對(duì)小球運(yùn)動(dòng)的速度合理控制。
2.高速連拍技術(shù)
按連拍(HS)按鈕,如圖8所示,將連拍速度設(shè)置為40fps,最多連拍幅數(shù)設(shè)定為30,預(yù)先記錄連拍設(shè)置為0.3s。半按快門(mén)鈕,進(jìn)行預(yù)先記錄拍攝,等到理想拍攝時(shí)機(jī)時(shí),完全按下快門(mén)鈕,拍攝想要的圖片。兩個(gè)顏色不同、大小質(zhì)量相同的玻璃球作為研究對(duì)象,在光滑平面讓綠球碰撞靜止的藍(lán)球,連拍小球的二維碰撞過(guò)程,然后通過(guò)幾何畫(huà)板對(duì)圖像進(jìn)行拼接處理。
光滑平面連拍:綠球碰撞靜止的藍(lán)球,如圖9所示。
圖像處理與數(shù)據(jù)分析步驟與連拍合成技術(shù)相同,最后算得誤差平均值為3.5%。
3.視頻頻閃截屏技術(shù)
在拍攝方式中,將動(dòng)畫(huà)方式旋鈕轉(zhuǎn)至(HD/STD),選擇高速動(dòng)畫(huà)(HS),按動(dòng)畫(huà)按鈕開(kāi)始拍攝,分別在光滑平面讓藍(lán)球碰撞靜止的綠球和非光滑平面讓藍(lán)球與綠球互撞,碰撞完成后,再按動(dòng)畫(huà)按鈕結(jié)束拍攝。然后用頻閃截屏軟件Mr.Captor對(duì)拍攝的視頻進(jìn)行頻閃截屏,點(diǎn)擊“選項(xiàng)”菜單中“參數(shù)”命令,將彈出參數(shù)窗體,在“定時(shí)/視頻”中設(shè)置頻閃周期為0.1秒,設(shè)定圖片保存路徑。點(diǎn)擊“ ”按鈕,在屏幕上圈定單擺振動(dòng)的截屏區(qū)域,再點(diǎn)擊鼠標(biāo)右鍵,在彈出的菜單中選取“開(kāi)始定時(shí)捕捉”命令,于是所捕捉的圖片被記錄在相應(yīng)的文件夾中并被自動(dòng)編號(hào)。最后通過(guò)幾何畫(huà)板對(duì)圖像進(jìn)行拼接處理。在進(jìn)行圖像處理時(shí),處理好一張圖片之后,隱藏圖片,拖進(jìn)下一個(gè)圖片,逐個(gè)處理,這樣每個(gè)小球運(yùn)動(dòng)的軌跡就能記錄在幾何畫(huà)板之中了。經(jīng)過(guò)計(jì)算算得平均誤差為26.75%。
三種技術(shù)總結(jié)與對(duì)比
通過(guò)對(duì)這三種技術(shù)進(jìn)行實(shí)驗(yàn),總結(jié)出每種技術(shù)的特點(diǎn)與差異,總結(jié)如表1。
根據(jù)以上分析,得出此實(shí)驗(yàn)誤差與數(shù)碼相機(jī)的配置有極大的關(guān)系。教師可以根據(jù)教學(xué)條件以及課程的需要選擇以上方法探究二維碰撞動(dòng)量守恒問(wèn)題。
隨著科學(xué)技術(shù)的發(fā)展,數(shù)碼設(shè)備已經(jīng)普及到千家萬(wàn)戶。運(yùn)用數(shù)碼相機(jī)探究二維運(yùn)動(dòng)打破了只限于探究一維運(yùn)動(dòng)的常規(guī),并且數(shù)碼相機(jī)攜帶方便,易于學(xué)生課下探究[3]。探究性學(xué)習(xí)包括提出問(wèn)題、收集數(shù)據(jù)、形成解釋、評(píng)價(jià)結(jié)果、檢驗(yàn)結(jié)果等過(guò)程,而運(yùn)用數(shù)碼設(shè)備則可以幫助學(xué)生更便捷地收集數(shù)據(jù)、分析數(shù)據(jù),有助于培養(yǎng)學(xué)生的科學(xué)探究能力。
篇10
關(guān)鍵詞:手寫(xiě)筆體;信息查找;同步掃描;字符分割
中圖分類號(hào):TP311文獻(xiàn)標(biāo)志碼:A文章編號(hào):1009-3044(2010)22-6282-02
1 圖像分割技術(shù)
圖像分割是圖像處理和前期視覺(jué)中的基本技術(shù),是按照?qǐng)D像的某些特征(灰度級(jí)、頻譜、紋理等)將圖像空間劃分成一些區(qū)域,在這些區(qū)域的內(nèi)部,其特性是相同的或者是均勻的,兩個(gè)相鄰區(qū)域的特性則互不相同。圖像分割是有圖像處理轉(zhuǎn)為圖像分析的關(guān)鍵。一方面,它是目標(biāo)圖像表達(dá)的基礎(chǔ),對(duì)特定測(cè)量有重要影響。另一方面,圖像分割也是圖像的目標(biāo)表達(dá)、特征提取和參數(shù)測(cè)量等分割所用的主要方法。[13-14] 對(duì)于一般復(fù)雜圖像,圖像分割較為復(fù)雜,比如Wang等[17]通過(guò)對(duì)生長(zhǎng)區(qū)域進(jìn)行分級(jí),識(shí)別出由同一物體組成的整體區(qū)域,從而獲得物體的輪廓,但是可能導(dǎo)致區(qū)域空洞的出現(xiàn),但由于本系統(tǒng)在去除背景、對(duì)字符分割的這一特定條件下,處理過(guò)程相對(duì)較為簡(jiǎn)單。
到目前為止,所有的圖像分割算法均是針對(duì)某具體問(wèn)題而提出的,并沒(méi)有一種可適用于任何圖像的通用分割算法,這也可以從一個(gè)方面說(shuō)明,為什么能研究出上千種方式各異的圖像分割算法,而且每年都是上百種的速度在遞增。盡管存在著數(shù)量龐大的各種圖像分割方法,但均可以將其分割處理的特點(diǎn)歸納為以下幾條:
1)分割產(chǎn)生的所有區(qū)域之和包括了原始圖像中原有的所有像素,即分割把原始圖像的每個(gè)像素都分到某個(gè)區(qū)域。
2)分割后的結(jié)果互不重疊,即原有像素不能同時(shí)分割到兩個(gè)區(qū)域。
3)分割后的各個(gè)區(qū)域有其獨(dú)有的特性,即同區(qū)域的像素具有某種共性。
4)分割后的不同區(qū)域具有不同的特性,分割后同一區(qū)域內(nèi)任兩像素在該區(qū)域內(nèi)相互連通,即分割后的區(qū)域是一個(gè)連通組元。
2 圖像分割途徑
圖像分割有三種不同的途徑。
1)將各像素劃歸到相應(yīng)物體或區(qū)域的像素聚類方法即區(qū)域法;
2)通過(guò)直接確定區(qū)域間的邊界來(lái)實(shí)現(xiàn)分割的邊界方法;
3)首先檢測(cè)邊緣像素再將邊緣像素連接起來(lái)構(gòu)成邊界形成分割。字符分割是為了便于對(duì)單個(gè)字符進(jìn)行進(jìn)一步的單獨(dú)處理。因?yàn)橐话阕址麍D像均能滿足相鄰文字行列間至少有一行或者一列全為背景象素這一條件。系統(tǒng)在讀進(jìn)來(lái)的圖像中一般會(huì)含有多個(gè)字符,識(shí)別的時(shí)候只能根據(jù)每個(gè)字符的特征來(lái)進(jìn)行判斷,所以還要進(jìn)行字符分割的工作。這一步工作就是把圖像中的字符獨(dú)立的分割出來(lái)。[15]
3 手寫(xiě)體字符任意行分割算法設(shè)計(jì)
3.1 系統(tǒng)提出
本系統(tǒng)提出的“基于個(gè)人手寫(xiě)筆體的信息查找”的概念是一個(gè)全新的概念,它既要求對(duì)于手寫(xiě)體漢字本身結(jié)構(gòu)信息的把握,又對(duì)捕獲單個(gè)字與周邊文字之間相對(duì)位置信息的規(guī)律性提出了要求。而以往人們?cè)凇肮P跡鑒別”等領(lǐng)域所做的工作都是針對(duì)行、列分布較規(guī)范的整段文字或整篇文章進(jìn)行的,對(duì)于如今我們面臨的空間分布極具任意性的個(gè)人手寫(xiě)筆記而言,昔日的經(jīng)典算法僅僅具備一定意義上的參考價(jià)值,謀求一種適用性更強(qiáng)、能夠?qū)€(gè)人手寫(xiě)筆記字符進(jìn)行準(zhǔn)確分割的算法成為了正確查找信息的重要前提。比如圖1這種比較典型的情形,進(jìn)行行、列掃描的嵌套 設(shè)定閾值 將距離小于閾值的相鄰的兩部分進(jìn)行分割,此時(shí)這樣的算法顯然就無(wú)用武之地了。
對(duì)于左右結(jié)構(gòu)或者左中右結(jié)構(gòu)的漢字,分割閾值的設(shè)置與個(gè)人的書(shū)寫(xiě)習(xí)慣是一對(duì)比較難以解決的矛盾,例如《沁園春?長(zhǎng)沙》的“沁”、汕頭的“汕”,前者由于“心”字的左邊一點(diǎn)在垂直投影上與“]”無(wú)重疊部分而恰恰同“シ”有交疊,故而將整字錯(cuò)誤地分割為
而“汕”字則不光是左右被分開(kāi),連三點(diǎn)水最上面的一點(diǎn)也被獨(dú)立劃分為一塊,至于為什么“清”和“澈”就會(huì)被正確地框出呢?實(shí)質(zhì)上是一個(gè)道理,注意用紅色圈出的部分。
由于手寫(xiě)體的隨意性,文字大小不盡相同,這就要對(duì)文字尺寸進(jìn)行歸一化,因此字符分割是非常重要的一步;同時(shí)字符分割又為之后的文字拼接提供了一條簡(jiǎn)單易行的途徑。因此,若我們光從傳統(tǒng)的算法入手,將閾值設(shè)定得較小同時(shí)要求用戶刻意將字間距放大,那顯然這是不人性的設(shè)計(jì)、是治標(biāo)不治本的下策。
3.2 分割算法
綜合考慮漢字結(jié)構(gòu)的分布規(guī)律及書(shū)寫(xiě)的隨意性,本系統(tǒng)采用了如下的字符分割算法:
1)首先對(duì)整幅圖像進(jìn)行掃描,定出上、下、左、右四條邊界線(如圖中箭頭1、2、3、4所示)
2)對(duì)圖像進(jìn)行第二次掃描,此次掃描目的是對(duì)分立的字符進(jìn)行分割。基本思想是認(rèn)為手寫(xiě)的漢字大致是可以被一個(gè)正方形的邊框所包圍的,假設(shè)以列掃描作為外層循環(huán),如圖中3號(hào)箭頭所示,以其掃描到地第一個(gè)像素點(diǎn)的橫坐標(biāo)為“虎”字的左邊界同時(shí)以該像素點(diǎn)的縱坐標(biāo)rectpop.bottom作為列掃描的循環(huán)次數(shù),當(dāng)掃描到如圖5號(hào)箭頭所示位置時(shí),發(fā)現(xiàn)再往右掃一列時(shí)像素點(diǎn)的縱坐標(biāo)便已經(jīng)遠(yuǎn)大于rectpop.bottom,故而馬上進(jìn)行右邊界的分割,之后“虎”字的行掃描繼續(xù),當(dāng)掃描到6號(hào)箭頭所示位置的下一行時(shí),又發(fā)現(xiàn)掃描到的像素點(diǎn)的橫坐標(biāo)遠(yuǎn)大于rectpop.bottom,所以此時(shí)可以將“虎”字的下邊界定出,到此為止,第一個(gè)“虎”字的分割完成,而之后的第二個(gè)“虎”字的分割思想與之如出一轍。至于“威”字的分割,則與之前的兩個(gè)字的分割方法不同,由于掃描在一維上是從單一方向進(jìn)行的,即對(duì)于列地掃描始終定格為從左到右,這就造成了其在空間分布上的獨(dú)立性,換句話說(shuō),對(duì)于該字的掃描就無(wú)法貫徹之前的以具體像素點(diǎn)左邊界的縱坐標(biāo)rectpop.bottom作為列掃描的循環(huán)次數(shù),所以對(duì)于“威”字的掃描實(shí)質(zhì)上是沿襲了整幅大圖像的掃描方式,只不過(guò)該字的右邊界已定(就是整幅圖像的右邊界),而其余三個(gè)邊界則只能老老實(shí)實(shí)地由行列嵌套循環(huán)定出。
又如圖3(i)所示,字與字之間的位置關(guān)系毫無(wú)規(guī)律性可循,系統(tǒng)首先依舊按照設(shè)定的算法進(jìn)行整幅圖像的上、下、左、右四條邊界的確定,將整幅圖拆成如圖(ii)所示的左半部分以及剩余的右半部分,我們發(fā)現(xiàn):(ii)圖的情形與上一例如出一轍,但為什么與(ii)中的“水”字毗鄰的“森”字卻沒(méi)有以它的最底端作為其本身的下邊界而是以2號(hào)箭頭所示位置為其下邊界呢?原因是它的右邊還有字符。
當(dāng)行掃描進(jìn)行到(ii)中的“森”(稱其為森2)字最底端時(shí),掃描線被其右邊的另一個(gè)“森”(稱其為森3)的像素點(diǎn)“擋住去路”,這一信息的反饋使得系統(tǒng)得知行掃描還未結(jié)束,所以確定森2的下邊界就等效為確定森3的下邊界,正如我們所分析的那樣,掃描結(jié)果是森2與森3的下邊界相同且均為整幅圖像的下邊界。
同樣道理,因?yàn)樯?的至高點(diǎn)在森2的最低點(diǎn)上方,而行掃描在劃過(guò)森2的最低點(diǎn)后始終向下尋找森2的下邊界,這就使得森3 的上邊界成為了由前級(jí)附帶確定的因素。所以,整幅圖中,盡管單個(gè)字可以準(zhǔn)確無(wú)誤地分割開(kāi)來(lái),但個(gè)別字邊界的確定卻是不盡如人意的。
圖3字符分割實(shí)例3
4 結(jié)束語(yǔ)
再嚴(yán)密的算法總是在邏輯框架下執(zhí)行一定順序的操作,本算法也同樣如此。我們的本意自然是希望得到如圖(iii)所示的理想結(jié)果,但任何一套算法都是對(duì)規(guī)律的總結(jié),其相對(duì)適用性無(wú)法脫離一般性的約束,而手寫(xiě)體的隨意性恰恰是以特殊性來(lái)考驗(yàn)一般性,所以即使當(dāng)前的算法對(duì)于個(gè)體分割具備了一定程度的正確性,其與我們?cè)O(shè)想的理想狀態(tài)還是有一定距離的。以上兩例充分說(shuō)明本算法中前級(jí)對(duì)后級(jí)有影響,后級(jí)對(duì)前級(jí)同樣有牽制,前后級(jí)字符之間的相互制約構(gòu)成了當(dāng)前分割算法的核心體系。
參考文獻(xiàn):
[1] 唐偉成.手寫(xiě)英文字符識(shí)別系統(tǒng)[D].沈陽(yáng)理工大學(xué)碩士論文,2009.
[2] 朱娜敏.精通Windows程序設(shè)計(jì)――基于Visual C++實(shí)現(xiàn)[M].北京:人民郵電出版社,2009.
[3] 郭一平. 數(shù)字圖像壓縮歷史的分析與檢測(cè)[D]. 大連理工大學(xué)碩士論文,2009
[4] 沈軍.一心兩用.“雙顯”讓游戲電影兩相宜[J].電腦愛(ài)好者,2010(5).
[6] 梁紅飛.四線電阻式觸摸屏測(cè)試系統(tǒng)的研究[M].中南大學(xué)碩士論文,2009.
[7] 趙志強(qiáng).基于GPRS的便攜式信令控制系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[M].同濟(jì)大學(xué)碩士論文,2008.
[8] 何斌.Visual C++數(shù)字圖像處理[M].北京:人民郵電出版社,2005.
[9] 孫鑫.Visual C++深入講解[M].北京:電子工業(yè)出版社,2006.
[10] 師春禮.手寫(xiě)體字符預(yù)處理與識(shí)別系統(tǒng)研究[M].碩士學(xué)位論文.北京:北京郵電大學(xué),1995.
[11] 王麗華.基于神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別系統(tǒng)的研究[M].中國(guó)石油大學(xué)碩士論文,2008.
[12] 蔡櫻.中文手寫(xiě)文稿的二值化與行列切分[J].中文信息學(xué)報(bào),2000,14(1).
[13] 章毓晉.圖像理解與計(jì)算機(jī)視覺(jué)[M].北京:清華大學(xué)出版社,2000.
[14] 靳藩.神經(jīng)計(jì)算與智能基礎(chǔ)[M].重慶:西南交通大學(xué)出版社,2000.
[15] 唐偉成.手寫(xiě)英文字符識(shí)別系統(tǒng)[D].沈陽(yáng)理工大學(xué)碩士論文,2009.
[17] 張宏林.Visual C++數(shù)字圖像模式識(shí)別技術(shù)及工程實(shí)踐[M].北京:人民郵電出版社,2003.
[18] 孫藝峰.基于多種特征的數(shù)字圖像分割理論和方法研究[M]. 遼寧師范大學(xué)碩士論文,2009.
熱門(mén)標(biāo)簽
圖像法論文 圖像時(shí)代 圖像設(shè)計(jì)論文 圖像處理 圖像專業(yè)論文 心理培訓(xùn) 人文科學(xué)概論
相關(guān)文章
2無(wú)人機(jī)圖像采集技術(shù)在森林防火的應(yīng)用
3高校思政課圖像敘事圖本開(kāi)發(fā)和運(yùn)用