摘要:針對(duì)交通標(biāo)志檢測(cè)過程中需同時(shí)滿足高精度和速度的問題,本文提出了一種改進(jìn)的基于區(qū)域全卷積網(wǎng)絡(luò)(R-FCN)的交通標(biāo)志檢測(cè)方法。通過K-means聚類算法對(duì)數(shù)據(jù)集進(jìn)行分析,選擇合適的錨點(diǎn)框。并對(duì)特征提取網(wǎng)絡(luò)ResNet101進(jìn)行結(jié)構(gòu)簡(jiǎn)化,只使用其前25層進(jìn)行特征提取,以縮短檢測(cè)時(shí)間。再將可變形卷積和可變形位置敏感RoI(Regionof Interest)池化層引入模型中,以提高模型對(duì)交通標(biāo)志的感應(yīng)能力。訓(xùn)練過程中使用在線困難樣本挖掘策略,減少簡(jiǎn)單樣本。在德國(guó)交通標(biāo)志檢測(cè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明:改進(jìn)后的模型對(duì)交通標(biāo)志位置信息更加敏感,在AP50時(shí)達(dá)到97.8%,AP75時(shí)為94.7%,檢測(cè)時(shí)間縮短至48ms,整個(gè)模型在精度與速度上都得到了提升。
本文源自計(jì)算機(jī)工程2021-01-27《計(jì)算機(jī)工程》雜志級(jí)別:CSCD,主辦單位:華北計(jì)算技術(shù)研究所,周期:旬刊, 國(guó)內(nèi)統(tǒng)一刊號(hào):11-2127/TP,國(guó)際標(biāo)準(zhǔn)刊號(hào):1002-8331,復(fù)合影響因子為0.984,綜合影響因子為0.518。《計(jì)算機(jī)工程》簡(jiǎn)介:《計(jì)算機(jī)工程》刊登內(nèi)容包括發(fā)展趨勢(shì)/熱點(diǎn)技術(shù)、博士論文、基金項(xiàng)目論文、專題論文、軟件技術(shù)與數(shù)據(jù)庫、安全技術(shù)、多媒體技術(shù)及應(yīng)用、網(wǎng)絡(luò)與通信、人工智能及識(shí)別技術(shù)、工程應(yīng)用技術(shù)與實(shí)現(xiàn)、開發(fā)研究與設(shè)計(jì)技術(shù)等。
關(guān)鍵詞:交通標(biāo)志;區(qū)域全卷積網(wǎng)絡(luò); ResNet101;可變形卷積;可變形位置敏感RoI池化
0概述
交通標(biāo)志檢測(cè)是自動(dòng)駕駛和輔助駕駛的重要組成部分,交通標(biāo)志中含有速度限制,路面狀況等信息,對(duì)汽車起著指導(dǎo)作用,是安全駕駛的重要一步,對(duì)于交通標(biāo)志的研究有著重要的理論和現(xiàn)實(shí)價(jià)值。研究人員對(duì)此提出了多種方法進(jìn)行研究,在深度學(xué)習(xí)模型提出以前,交通標(biāo)志的檢測(cè)方法大體可分為基于交通標(biāo)志的顏色形狀等視覺信息方法[1-5],基于特征提取和機(jī)器學(xué)習(xí)的識(shí)別方法[6-8]。
自從文獻(xiàn)[9]提出AlexNet在ImageNet大賽奪冠,多種深度學(xué)習(xí)模型被提出應(yīng)用于交通標(biāo)志檢測(cè)任務(wù)中。文獻(xiàn)[10]設(shè)計(jì)了一種端到端的全卷積神經(jīng)網(wǎng)絡(luò),在對(duì)其收集的Tsinghua-Tencent 100K 數(shù)據(jù)集檢測(cè)中,展現(xiàn)出強(qiáng)大的魯棒性。文獻(xiàn)[11]對(duì)Faster RCNN[12]中RPN接收域的修改,使模型更好的適應(yīng)交通標(biāo)志這種小目標(biāo)。文獻(xiàn)[13]通過使用多個(gè)11?的卷積核,降低了模型的計(jì)算復(fù)雜度,使檢測(cè)達(dá)到實(shí)時(shí)。文獻(xiàn)[14]提出了一種基于多尺度區(qū)域的卷積神經(jīng)網(wǎng)絡(luò),在RPN中融入上下文信息,能準(zhǔn)確地檢測(cè)出較小的交通標(biāo)志。
由于模型結(jié)構(gòu)設(shè)計(jì)的差異,目標(biāo)檢測(cè)模型所側(cè)重的方面也不相同,一階檢測(cè)器如YOLO[15],SSD[16]等,檢測(cè)速度快,但對(duì)交通標(biāo)志這種小目標(biāo)并不敏感,精度較低,容易產(chǎn)生誤判。二階檢測(cè)器Faster RCNN,F(xiàn)PN[17]等精度高,但速度慢,對(duì)于交通場(chǎng)景這種速度較快的情況,無法及時(shí)將信息傳遞給汽車。對(duì)此,本文基于R-FCN[18]框架,提出了一種改進(jìn)的交通標(biāo)志的檢測(cè)算法。通過對(duì)其特征提取網(wǎng)絡(luò)進(jìn)行簡(jiǎn)化,在不影響準(zhǔn)確率的情況下提高模型檢測(cè)的速度。再添加K-means,在線困難樣本挖掘策略和可變形卷積等技術(shù),以期提高模型的精度。
1交通標(biāo)志檢測(cè)算法框架
1.1 R-FCN算法
R-FCN算法由經(jīng)典的Faster RCNN算法演變而來,同為二階段檢測(cè)器。先通過特征提取網(wǎng)絡(luò)提取圖像特征,輸出特征圖,再經(jīng)過區(qū)域建議網(wǎng)絡(luò)(region proposal network,RPN)對(duì)輸出的特征圖上提取出感興趣區(qū)域。R-FCN與Faster RCNN在RPN之前的步驟相同,兩者最大的不同在于對(duì)感興趣區(qū)域的分類與回歸。
Faster RCNN通過一組全連接層完成對(duì)目標(biāo)的分類和回歸,每個(gè)經(jīng)過RPN提取出來的RoI都需要經(jīng)過全連接層的計(jì)算,這將消耗大量的時(shí)間。而R-FCN則通過額外添加兩組卷積的得到兩張分別為類別和位置的得分圖來對(duì)目標(biāo)進(jìn)行預(yù)測(cè),即將全連接層替換成卷積層進(jìn)行分類和回歸計(jì)算,一定程度上加快了檢測(cè)速度,整個(gè)檢測(cè)框架如圖1所示:
1.2 可變形卷積
傳統(tǒng)的卷積操作通常是基于形狀為3x3,5x5這種形狀規(guī)則的卷積核進(jìn)行特征提取,然而這種傳統(tǒng)的卷積具有自身的局限性,只能提取規(guī)則區(qū)域內(nèi)的特征,無法根據(jù)物體的形狀提取到更細(xì)致的特征,而可變形卷積[19]引入了空間幾何形變的學(xué)習(xí)能力,可以更好地適應(yīng)空間。
可變形卷積可以根據(jù)目標(biāo)的形狀進(jìn)行卷積位置調(diào)整,使卷積的區(qū)域更貼切于物體。具體實(shí)現(xiàn)是通過增加了一組2N(N為卷積核的大小)個(gè)卷積核,產(chǎn)生尺寸與輸入特征圖相同,通道數(shù)為2N的特征圖,又稱為offset field(偏置域)。從offset field上可得到每個(gè)像素點(diǎn)的offsets(偏置矩陣),具體方式如圖2所示。
傳統(tǒng)卷積的計(jì)算方式是與特征圖進(jìn)行固定區(qū)域的卷積計(jì)算,對(duì)于特征圖上每個(gè)點(diǎn)位置0p,其計(jì)算方式如式1所示:
式中:x為輸入特征圖;y為輸出特征圖;0p為卷積計(jì)算點(diǎn);R表示預(yù)采樣偏移,假設(shè)使用3x3卷積核,則??????????1, 1 , 1, 0 ,.... 0,1 , 1,1R? ? ? ?;Pn為R中位置的枚舉。
可變形卷積加入其中,將學(xué)習(xí)到的偏置矩陣offsets與預(yù)采樣偏移R相加,得到新的采樣偏移量,則輸入特征圖上每個(gè)點(diǎn)Po進(jìn)行可變形卷積的表達(dá)式如式2所示:
式中:np?為偏置矩陣offsets對(duì)應(yīng)于常規(guī)卷積網(wǎng)格的偏移量;其余變量與式(1)相同。
1.3 特征提取網(wǎng)絡(luò)
R-FCN通過殘差網(wǎng)絡(luò)(ResNet)對(duì)圖片進(jìn)行特征提取,ResNet[20]自提出以來,被廣泛應(yīng)用于分類,檢測(cè)任務(wù)。通過增加跳線連接,ResNet能夠緩解梯度消失和梯度爆炸的問題。
ResNet的結(jié)構(gòu)如圖3所示,假設(shè)在不加殘差前網(wǎng)絡(luò)需要學(xué)習(xí)的是????H xF x?,這樣一個(gè)恒等映射在神經(jīng)網(wǎng)絡(luò)層數(shù)增加時(shí)將變得很難擬合。而加入殘差結(jié)構(gòu)后神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的是????H xF xx??,即將恒等映射作為網(wǎng)絡(luò)的一部分,那么網(wǎng)絡(luò)真正學(xué)習(xí)的是殘差函????F xH xx??,這比原來的恒等映射更容易擬合。
Fig. 4 Construct the ResNet unit as deformable ResNet structure
本文使用了經(jīng)過預(yù)訓(xùn)練的ResNet-101,在其第conv4_x模塊中融入可變形卷積。具體結(jié)構(gòu)如圖4所示,在殘差結(jié)構(gòu)中加入了額外的72個(gè)256維的卷積核,產(chǎn)生了四組offsets。通過這些新加入的卷積產(chǎn)生的offset的偏置量指引作用下, 對(duì)輸入特征進(jìn)行可變形卷積操作獲得輸出特征。
1.4可變形位置敏感RoI池化
R-FCN中的位置敏感RoI池化在位置敏感得分圖上進(jìn)行,位置敏感得分圖實(shí)質(zhì)上也是特征圖,但卻是有著確切含義的特征圖。位置敏感RoI池化會(huì)將RPN層提取出的感興趣區(qū)域分成kk?個(gè)bins(子區(qū)域),假設(shè)目標(biāo)的總類別數(shù)為C,則位置敏感得分圖的層數(shù)為??21kC?,每一層分別代表著某類物體的某個(gè)部位在整個(gè)圖像中的響應(yīng)值。位置敏感得分圖的層數(shù)受目標(biāo)種類數(shù)影響,當(dāng)目標(biāo)種類增加時(shí),得分圖的通道數(shù)也隨之增加,會(huì)帶了大量參數(shù),增加檢測(cè)的時(shí)間,因此本文只有3類交通標(biāo)志的情況適合于R-FCN位置敏感RoI池化的設(shè)計(jì)。
相比與原始的位置敏感RoI池化,可變形的位置敏感RoI池化通過卷積在位置敏感得分圖上產(chǎn)上了一個(gè)額外的偏置域。這個(gè)偏置域的尺寸與得分圖相同,通道數(shù)是其兩倍,對(duì)應(yīng)于位置敏感得分圖上每個(gè)點(diǎn)在X與Y方向的偏移量,具體方式如圖5所示。將經(jīng)過RPN提取出來的RoI區(qū)域?qū)?yīng)的offsets加入其中,其對(duì)應(yīng)的計(jì)算公式如式3所示:
式中:x為輸入特征圖;y為輸出的RoI;bin為由RoI劃分為??0,k ki j k? ? ?的區(qū)域;ijn是每個(gè)bin區(qū)域中的像素?cái)?shù);0p為RoI左上角的坐標(biāo);p為bin區(qū)域內(nèi)像數(shù)點(diǎn)的枚舉;p?為偏移量offset。
1.5在線困難樣本挖掘
經(jīng)過特征提取網(wǎng)絡(luò)輸出的特征圖會(huì)在RPN的作用下產(chǎn)生大量的ROIs(候選區(qū)域),這些ROIs中正樣本和負(fù)樣本分布并不平衡,簡(jiǎn)單地設(shè)置正負(fù)比例將這些ROIs送入后續(xù)分類與回歸訓(xùn)練使模型無法關(guān)注到困難樣本(預(yù)測(cè)時(shí)與真值標(biāo)簽誤差較大的樣本,這類樣本常使得模型產(chǎn)生誤判現(xiàn)象)。OHEM(在線困難樣本挖掘)[21]會(huì)從這些ROIs中篩選出困難樣本,將篩選得到的這些樣本送入到訓(xùn)練中。
具體操作為設(shè)置兩個(gè)相同的ROI子網(wǎng)絡(luò),兩個(gè)子網(wǎng)絡(luò)結(jié)構(gòu)相同,但在功能上可將其分為只讀子網(wǎng)絡(luò)和可讀可寫子網(wǎng)絡(luò)。只讀子網(wǎng)絡(luò)只負(fù)責(zé)前向計(jì)算,輸出ROIs的損失,然后將這些ROIs的損失值從大到小排序,并通過NMS(非最大值抑制) 算法挑選出前K個(gè)ROIs,將其送入到可讀可寫子網(wǎng)絡(luò)中進(jìn)行參數(shù)的反向傳播,完成網(wǎng)絡(luò)更新。
2實(shí)驗(yàn)分析
2.1 實(shí)驗(yàn)數(shù)據(jù)集
1.6改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)圖
本文實(shí)驗(yàn)主要基于R-FCN網(wǎng)絡(luò)結(jié)構(gòu),為了加檢測(cè)速度,本文在基于ResNet-101的預(yù)練模型上進(jìn)行刪減實(shí)驗(yàn),最后只保留了前25層來實(shí)現(xiàn)對(duì)圖片特征的提取,并將RoI區(qū)域中bin的個(gè)數(shù)從7×7 變?yōu)?×3。以上兩點(diǎn)有效提升了模型的檢測(cè)速度,卻并沒有因?yàn)閰?shù)的減少而影響準(zhǔn)確率。
上述措施雖然能將模型的速度提升,但無法提升模型的準(zhǔn)確率,于是筆者將可變形卷積核和可變形位置敏感RoI池化引入。總共使用了兩個(gè)可變形卷積核,分別置于RPN兩側(cè),將可變形位置敏感RoI池化代替原始的位置敏感RoI池化,改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)如圖6所示。
本文的數(shù)據(jù)集采用的是德國(guó)交通標(biāo)志檢測(cè)數(shù)據(jù)集(German Traffic Sign Detection Benchmark,簡(jiǎn)稱GTSDB)[22]。GTSDB 是在2013 年的國(guó)際神經(jīng)網(wǎng)絡(luò)會(huì)議(IJCNN2013)上發(fā)布的,被用于當(dāng)年的交通標(biāo)志檢測(cè)大賽。該數(shù)據(jù)集包含900張高分辨率的道路交通圖片,其中訓(xùn)練集600張,測(cè)試集300張,圖像大小全部為800×1360像素。圖片中交通標(biāo)志的數(shù)量在0到6個(gè),標(biāo)志多為小目標(biāo),分辨率在16×16到128×128之間,形狀大多數(shù)為三角形和圓形。GTSDB中將43種交通標(biāo)志分為了四大類,即禁令標(biāo)志、指示標(biāo)志、警告標(biāo)志、其他標(biāo)志。而根據(jù)當(dāng)年比賽的規(guī)定,本文只對(duì)前三種標(biāo)志進(jìn)行檢測(cè)。因此本文訓(xùn)練集總共包含666個(gè)標(biāo)志,測(cè)試集包含273個(gè)標(biāo)志。圖7為該數(shù)據(jù)集部分圖片與其檢測(cè)效果圖。
2.2錨點(diǎn)框維度聚類
通過對(duì)數(shù)據(jù)集的分析可知交通標(biāo)志的面積遠(yuǎn)小于原R-FCN的錨點(diǎn)框大小,使用原始的錨點(diǎn)將會(huì)使模型難以擬合那些過小的交通標(biāo)志,因此需要對(duì)交通標(biāo)志數(shù)據(jù)集進(jìn)行聚類分析。
K-means聚類方法用歐氏距離定義損失函數(shù),但在目標(biāo)檢測(cè)算法中更適合采用預(yù)測(cè)框和anchor box的面積重疊度IOU作為度量距離, 則新的度量標(biāo)準(zhǔn)公式為:
d box centriodIOU box centriod??(4)
式中,box表示目標(biāo)框尺寸, centriod表示聚類中心框尺寸。通過改變聚類中心點(diǎn)的個(gè)數(shù)得到不同的平均IOU,結(jié)果如圖8所示。
從圖8可看出當(dāng)聚類個(gè)數(shù)為9時(shí)曲線逐漸平緩,于是選定9個(gè)錨點(diǎn)框,并且通過聚類可知交通標(biāo)志長(zhǎng)寬比的標(biāo)注基本為1:1,錨點(diǎn)框具體大小設(shè)置為(22,22),(27,27),(32,32),(36,36),(40,40),(46,46),(56,56),(70,70),(100,100)。
2.3 實(shí)驗(yàn)評(píng)價(jià)
本文實(shí)驗(yàn)平臺(tái)信息:cpu為Inter Core i7-8700,內(nèi)存16G,gpu為NVIDIA GeForce RTX 2070,顯存8G,操作系統(tǒng)為Ubuntu 16.04,深度學(xué)習(xí)框架為MXNET。
實(shí)驗(yàn)中采用ImageNet數(shù)據(jù)集上訓(xùn)練好的ResNet101,其參數(shù)不參與更新,總共訓(xùn)練15個(gè)epoch,初始學(xué)習(xí)率為0.001,在訓(xùn)練10個(gè)epoch后將學(xué)習(xí)率調(diào)整為0.0001。
本文采用目標(biāo)檢測(cè)中常見的AP50,AP70和AP三個(gè)評(píng)價(jià)指標(biāo)進(jìn)行評(píng)測(cè),AP50,AP70分別表示IOU(預(yù)測(cè)目標(biāo)與實(shí)際目標(biāo)的重疊比)大于0.5和大于0.75時(shí)正確檢出目標(biāo),AP為IOU [0.5:0.05:0.95]共10個(gè)IOU下AP的平均值。使用三個(gè)指標(biāo)能更好的體現(xiàn)出可變形網(wǎng)絡(luò)對(duì)交通標(biāo)志的適應(yīng)能力,評(píng)價(jià)更為全面。
為了選擇適合本文的預(yù)訓(xùn)練模型,本文首先以ResNet101和ResNet50為特征提取網(wǎng)絡(luò)的R-FCN在原模型下進(jìn)行實(shí)驗(yàn),得到以下結(jié)果,如表1所示
經(jīng)對(duì)比發(fā)現(xiàn)預(yù)訓(xùn)練ResNet101網(wǎng)絡(luò)與ResNet50相差不大,ResNet101相比與ResNet50中conv4_x中額外的51層并沒有取得太大優(yōu)勢(shì),意味著對(duì)于本文交通標(biāo)志檢測(cè)任務(wù),ResNet101和ResNet50中的conv4_x的層數(shù)并不能產(chǎn)生太大的影響。于是選用總體偏優(yōu)的ResNet101為特征提取網(wǎng)絡(luò),為了加快檢測(cè)速度,將conv4_x模塊進(jìn)行簡(jiǎn)化,只保留其前三層參數(shù),即整個(gè)特征提取網(wǎng)絡(luò)只剩下35層,實(shí)驗(yàn)結(jié)果如表
對(duì)特征提取網(wǎng)絡(luò)ResNet101進(jìn)行層數(shù)的刪減并沒有對(duì)檢測(cè)結(jié)果產(chǎn)生太大影響,對(duì)ResNet101中conv4_x模塊的簡(jiǎn)化僅造成了微小的變化。說明前25層提取出來的特征圖已經(jīng)包含了足夠交通標(biāo)志的特征信息。
獲得了簡(jiǎn)化的特征提取網(wǎng)絡(luò)后,本文便在簡(jiǎn)化后的模型上進(jìn)行實(shí)驗(yàn),通過聚類錨點(diǎn),可變形卷積和可變形位置敏感ROI層加入其中,在訓(xùn)練過程中采用在線難例挖掘方法,實(shí)驗(yàn)的具體結(jié)果如表3所示。
實(shí)驗(yàn)結(jié)果表明,在AP50時(shí)準(zhǔn)確率提升了1.4%,達(dá)到97.8%。而在嚴(yán)格的AP75時(shí)達(dá)到94.7%,相比原算法提升了6%,總體AP更提升了將近9%。檢測(cè)時(shí)間方面本文相較原始的R-FCN(ResNet101)減少了60ms,速度提升兩倍有余。有效證明了本文保留前25層進(jìn)行實(shí)驗(yàn)的可行性,K-means聚類后錨點(diǎn)框的適應(yīng)性。
交通標(biāo)志信息的標(biāo)注是人工標(biāo)注,其標(biāo)注框都是正方形,加入可變形卷積和可變形位置敏感RoI池化層具體地提取出更多關(guān)于交通標(biāo)志形狀的信息,更加符合交通標(biāo)志圓形,三角形以及矩形的特征,在更嚴(yán)格的AP75和AP評(píng)價(jià)指標(biāo)下準(zhǔn)確率明顯提升。通過添加OHEM技術(shù),著重于困難例的訓(xùn)練,模型的準(zhǔn)確率進(jìn)一步提升。
2.4 模型對(duì)比
在目標(biāo)檢測(cè)領(lǐng)域的研究中,廣大學(xué)者已經(jīng)提出了眾多優(yōu)秀的目標(biāo)檢測(cè)模型,但這些模型都在VOC,COCO數(shù)據(jù)集上做的實(shí)驗(yàn),這兩數(shù)據(jù)集種類多,數(shù)據(jù)量大,所設(shè)計(jì)的模型結(jié)構(gòu)為了適應(yīng)數(shù)據(jù)集其結(jié)構(gòu)會(huì)設(shè)計(jì)的比較龐大。這些模型雖然可以直接用于交通標(biāo)志分類檢測(cè),但其模型結(jié)構(gòu)并不能完全契合交通標(biāo)志檢測(cè)數(shù)據(jù)集,比如其錨點(diǎn)框的大小形狀,因此需要進(jìn)行適應(yīng)性改進(jìn)。
表4對(duì)比了其他經(jīng)典模型在本文數(shù)據(jù)集上的結(jié)果。其中Faster RCNN,R-FCN,F(xiàn)PN特征提取網(wǎng)絡(luò)都為經(jīng)過預(yù)訓(xùn)練的ResNet101,其參數(shù)不參與更新,保持不變,訓(xùn)練與檢測(cè)均為原尺寸。YOLO系列尺寸則為608x608,特征提取網(wǎng)絡(luò)為darknet。CenterNet特征提取網(wǎng)絡(luò)為DLA-34,尺寸為512x512。RetinaNet和Cascade RCNN的特征提取網(wǎng)絡(luò)為ResNet50-FPN,尺寸為原尺寸。各模型的錨點(diǎn)框大小均未進(jìn)行調(diào)整。
從實(shí)驗(yàn)結(jié)果可看出,F(xiàn)PN因?yàn)槠涠喑叨鹊脑O(shè)計(jì),在AP和AP75指標(biāo)時(shí)明顯高于FasterRCNN與R-FCN這種單尺度的模型,證明了多尺度圖像特征金字塔可以有效檢測(cè)出交通標(biāo)志這種小目標(biāo)。但其使用的特征提取網(wǎng)絡(luò)為ResNet101速度偏慢,于是本文在CascadeRCNN選擇了參數(shù)較少ResNet50,并在其上使用FPN架構(gòu)。最終使用了多尺度和多閥值的CascadeRCNN在AP指標(biāo)時(shí)取得最高,達(dá)到了77.2%,但在AP50指標(biāo)時(shí)卻則只有95.5%,還不如未改進(jìn)的R-FCN。原R-FCN由于位置敏感得分圖的設(shè)計(jì),適合于交通標(biāo)志這種有特定形狀的目標(biāo),且本文交通標(biāo)志只有三類,位置敏感得分圖層數(shù)少,一定程度上加快了檢測(cè)的速度,因此原始的R-FCN在速度與精度都有不錯(cuò)的表現(xiàn)。
使用512尺寸的CenterNet在本文所對(duì)比模型具有最快的速度,中心點(diǎn)的設(shè)計(jì)原理也契合交通標(biāo)志這種對(duì)稱的物體,因此其整體表現(xiàn)不錯(cuò)。而使用原尺寸的RetinaNet在AP和AP75指標(biāo)時(shí)同樣具有較強(qiáng)的競(jìng)爭(zhēng)力。YOLOv3與YOLOv4[23]算法則在608尺寸時(shí)和本文所提模型的檢測(cè)速度接近,可以發(fā)現(xiàn)YOLOv4的準(zhǔn)確率明顯高于YOLOv3,是所有對(duì)比模型中準(zhǔn)確率在AP50指標(biāo)時(shí)最接近本文的,但在更嚴(yán)格的AP75和AP評(píng)價(jià)指標(biāo)時(shí),仍然與本文算法有不小的差距。可見本文可變形卷積的引入是有必要的,在速度接近的情況下,本文模型在更嚴(yán)格的評(píng)價(jià)指標(biāo)時(shí)依然擁有著不小的優(yōu)勢(shì)。
3結(jié)束語
針對(duì)交通標(biāo)志的檢測(cè)研究,本文先使用R-FCN算法進(jìn)行研究,發(fā)現(xiàn)原始的R-FCN模型在準(zhǔn)確率上已有良好的表現(xiàn),但速度卻偏低,難以達(dá)到實(shí)時(shí)的要求,因此如何提升R-FCN的檢測(cè)速度和準(zhǔn)確率成為本文關(guān)注的兩個(gè)重點(diǎn)。筆者通過模型簡(jiǎn)化,K-means算法錨點(diǎn)框聚類,并將可變形卷積和可變形位置敏感RoI池化層加入到簡(jiǎn)化后的模型中,在訓(xùn)練過程中使用在線困難例挖掘策略。實(shí)驗(yàn)結(jié)果表明,整個(gè)模型在速度提升的同時(shí)又不失精度,準(zhǔn)確率高于其他經(jīng)典模型,速度接近于實(shí)時(shí),在精度與速度上取得了較優(yōu)的平衡。在未來的工作中,將為模型尋找更適合于交通標(biāo)志檢測(cè)的特征提取網(wǎng)絡(luò),進(jìn)一步提升模型檢測(cè)的速度與精度。
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >