從品牌網(wǎng)站建設(shè)到網(wǎng)絡(luò)營銷策劃,從策略到執(zhí)行的一站式服務(wù)
來源:公司資訊 | 2021.08.16
一、應(yīng)用背景
在第十六屆全國大學(xué)生智能車競賽全國總決賽中,為了適應(yīng)線上總決賽的要求,室內(nèi)視覺AI組的比賽采用了賽道積分與識別積分分離的比賽形式,這樣可以保證比賽過程中更加的緊湊高效。
智能車在識別圖片任務(wù)
為了避免人工對于識別過程的干預(yù),整個識別過程是由計算機(jī)隨機(jī)給出Apriltag,數(shù)字,動物以及水果圖片,由參賽車模自動根據(jù)拍攝的照片給出識別結(jié)果。
由于之前的比賽,Apriltag,數(shù)字,動物以及水果分別位于賽道的不同位置,Apriltag位于賽道上,數(shù)字位于三岔路口,動物和水果則位于賽道兩旁。所以智能車??梢灶A(yù)先根據(jù)車模所處在賽道的不同位置,指導(dǎo)攝像頭所拍攝的圖片中的種類分別屬于哪一大類。然后在分別調(diào)取不同的識別模型和算法來進(jìn)一步處理圖片。
在新的比賽模式下,所有的圖片都是隨機(jī)出現(xiàn),因此,需要預(yù)先判斷圖片屬于哪一大類,然后才能夠調(diào)取原來的識別模型。那么改如何設(shè)計一個簡單的分類算法,將獲取的圖片先劃分到三大類(Apriltag,數(shù)字以及動物與水果)呢?
本文下面就討論一個利用圖片的像素顏色來進(jìn)行分類的簡單算法。
二、原始數(shù)據(jù)
1、數(shù)據(jù)庫來源
在第十六屆智能汽車競賽AI視覺組分賽區(qū)數(shù)據(jù)集發(fā)布給出了應(yīng)用在智能車競賽中的四類圖片的數(shù)據(jù)集合以及下載的方式。
智能車競賽數(shù)據(jù)集合:
AprilTag:25h9系列0~9
數(shù)字:0~9
動物圖片:五個子類:牛(93)、狗(101)、豬(88)、貓(99)、馬(95)
水果圖片:橙子(86)、榴蓮(75)、蘋果(88)、葡萄(89)、香蕉(93)
數(shù)據(jù)庫總體數(shù)量927張圖片。
三、圖片顏色
1、基本識別方案
為了建立一個非常簡單的Apriltag,數(shù)字、動物和水果的分類器,需要結(jié)合已知先驗知識,借助于簡化的模式識別的方法建立分類器;
拋開對于圖片內(nèi)的形態(tài)識別特征,轉(zhuǎn)換使用基于像素的統(tǒng)計規(guī)律,這樣可以大大提高檢測速度;
因此,計劃使用圖片的顏色空間的統(tǒng)計特性來區(qū)分三類。
由于Apriltag,數(shù)字都是黑白的圖片;利用這一點可以用于區(qū)分水果與動物;
Apriltag與數(shù)字在黑白的占空比方面不同,可以利用圖片的灰度分布統(tǒng)計來,或者平均灰度來區(qū)分這兩類。
2、圖片的RGB轉(zhuǎn)換HSV
根據(jù)黑白圖片與參賽圖片之間關(guān)系,可以把Apriltag,數(shù)字分布與動物水果進(jìn)行區(qū)分。為了有效區(qū)分彩色圖片與黑白圖片,則需要將圖片從RGB轉(zhuǎn)換到HSV空間。在HSV(Hue,Saturation,Value)中,S分量表示色彩的保護(hù)度,也就是顏色距離白色與純色之間的差異度量。通常取0%~100%,S值越大顏色就越飽和。
3、利用平均色飽和度區(qū)分彩色與黑白圖片
如果取一個閾值Smin?S_{\min}Smin作為區(qū)別黑白與彩色圖片的閾值,Smin?S_{\min}Smin越大,對于黑白圖片的誤判成彩色圖片概率就越低,但對于彩色圖片誤判成黑白圖片的概率就越大。
當(dāng)閾值取10的時候,判斷黑白照片與彩色照片的正確率大約為95%,當(dāng)閾值取20的時候,正確率已經(jīng)下降到90%以下了。
由于使用攝像頭攝取圖片的時候,存在一定的圖片白平衡失真,上面色飽和閾值不能夠設(shè)置太高,否則就會使得黑白圖片被誤判成彩色圖片。
4、圖片灰度
如果僅僅通過色保護(hù)度來區(qū)分黑白圖片(Apriltag,數(shù)字)與彩色照片(動物和水果)會存在比較大的誤差。下面還可以通過圖片的灰度分布差異來進(jìn)一步區(qū)分黑白圖與彩色圖片。
對比黑色圖片(Apriltag,數(shù)字)圖片的亮度分布,它的分布主要集中在最高值與最低值,中間分布很少。因此,可以利用這個差異進(jìn)一步區(qū)分黑白圖片與彩色圖片。
如果取35作為閾值,使用次級亮度平均值來區(qū)分黑白圖與彩色圖片,可以達(dá)到100%的正確率。
五、利用S,V區(qū)分設(shè)置分類器
為了提高分類器的適應(yīng)性,可以考慮聯(lián)合圖片的S,V來區(qū)分黑白圖與彩色圖。計算圖片的平均色飽和度值SaveS_{ave}Save以及次級平均亮度值VaveV_{ave}Vave。選擇兩個合適的閾值:STS_TST以及VTV_TVT,對于同時滿足:Save六、區(qū)分Apriltag與數(shù)字
根據(jù)圖片的平均色保護(hù)度以及次級平均亮度可以將黑白圖片與動物水果圖片區(qū)分開來。那么如何區(qū)分Apriltag與數(shù)字呢?
如果對于前面給出的APriltag和數(shù)字亮度值的分布來看,可以看到Apriltag的黑色背景值比白色背景多,而數(shù)字則恰好反過來,它的白色背景像素多余黑色背景像素。利用這一點差異,可以對于黑白圖片中的黑色像素(也就是V值低于圖片平均灰度的像素)的個數(shù)進(jìn)行統(tǒng)計,如果黑色像素的個數(shù)高于所有像素個數(shù)的50%,則是Apriltag圖片,反之則是數(shù)字圖片。
※算法總結(jié)※
對于全國大學(xué)生智能車競賽競賽室內(nèi)視覺AI組用于識別Apriltag,數(shù)字,動物以及水果任務(wù),本文提出了基于圖片像素的HSV空間的統(tǒng)計值,建立了一個簡單的大類分類器。利用這個分類器可以非常精確的在第一時間吧圖片分成Apriltag,數(shù)字以及彩色圖片(動物和水果),然后在利用不同的識別模型進(jìn)一步識別。
由于這個過程應(yīng)用了對于圖片庫的先驗知識,一方面可以繼續(xù)應(yīng)用原來已經(jīng)建立好的Apriltag、數(shù)字、動物以及水果識別模型,另一方面也可以提高整個識別的效率。
對于本文前面提到的算法中的閾值,需要根據(jù)實際采集到的圖片進(jìn)行進(jìn)一步優(yōu)化,使得最終的識別效率達(dá)到最高。