四川圖像識(shí)別模塊分析

來(lái)源: 發(fā)布時(shí)間:2024-09-22

目前,有許多功能性AI工具可以幫助我們進(jìn)行圖像標(biāo)注,其中慧視SpeedDP是針對(duì)AI零基礎(chǔ)用戶的低門檻AI開(kāi)發(fā)平臺(tái),提供從數(shù)據(jù)標(biāo)注、模型訓(xùn)練、測(cè)試驗(yàn)證到RockChip嵌入式硬件平臺(tái)模型部署的可視化AI開(kāi)發(fā)功能。SpeedDP提供豐富的算法參數(shù)設(shè)置接口,滿足不同用戶業(yè)務(wù)場(chǎng)景的定制化需求。此外,慧視SpeedDP開(kāi)發(fā)平臺(tái)支持本地化服務(wù)器部署,數(shù)據(jù)敏感的用戶也無(wú)需擔(dān)心數(shù)據(jù)信息泄露的問(wèn)題。目前慧視SpeedDP開(kāi)發(fā)平臺(tái)主要提供目標(biāo)檢測(cè)算法的開(kāi)發(fā)功能,不同的用戶可針對(duì)自己的業(yè)務(wù)場(chǎng)景進(jìn)行AI算法的定制化開(kāi)發(fā)以及算法模型的快速迭代優(yōu)化。RK3399圖像處理板是我司自主研發(fā)的圖像識(shí)別模塊板,該板卡采用國(guó)產(chǎn)高性能CPU。四川圖像識(shí)別模塊分析

圖像識(shí)別模塊

YOLO系列算法是目標(biāo)識(shí)別領(lǐng)域很重要的技術(shù)之一,因?yàn)樾阅軓?qiáng)大、消耗算力較少,一直以來(lái)都是實(shí)時(shí)目標(biāo)檢測(cè)領(lǐng)域的主要范式。該框架被***用于各種實(shí)際應(yīng)用,包括自動(dòng)駕駛、監(jiān)控和物流等行業(yè)的目標(biāo)識(shí)別。自今年2月YOLOv9發(fā)布以后,近期,清華又推出了YOLOv10,作為計(jì)算機(jī)視覺(jué)領(lǐng)域的突破性框架,具備實(shí)時(shí)的端到端目標(biāo)檢測(cè)能力,通過(guò)提供結(jié)合效率和準(zhǔn)確性的強(qiáng)大解決方案,延續(xù)了YOLO系列的傳統(tǒng)。據(jù)悉,YOLOv10在各種模型規(guī)模上都實(shí)現(xiàn)了SOTA性能和效率。例如,YOLOv10-S在COCO上的類似AP下比RT-DETR-R18快1.8倍,同時(shí)參數(shù)數(shù)量和FLOP大幅減少。與YOLOv9-C相比,在性能相同的情況下,YOLOv10-B的延遲減少了46%,參數(shù)減少了25%。監(jiān)控視頻圖像識(shí)別模塊公司成都慧視有工業(yè)級(jí)板卡RK3588.

四川圖像識(shí)別模塊分析,圖像識(shí)別模塊

要解決這個(gè)難題,慧視光電的算法工程師給出了小目標(biāo)識(shí)別算法的方案,通過(guò)加強(qiáng)目標(biāo)特征、數(shù)據(jù)增廣、放大輸入圖像、使用高分辨率的特征、設(shè)計(jì)合適的標(biāo)簽分配方法,以讓小目標(biāo)有更多的正樣本、利用小目標(biāo)所處的環(huán)境信息或者其他容易檢測(cè)的物體之間的關(guān)系來(lái)輔助小目標(biāo)的檢測(cè)。此外,利用自研的深度學(xué)習(xí)算法開(kāi)發(fā)平臺(tái),通過(guò)不斷的深度學(xué)習(xí),能夠讓AI更加精細(xì)的識(shí)別目標(biāo)。這個(gè)方法在瑞芯微RK3588、RV1126、RK3399pro等系列圖像跟蹤板上得到了較好地驗(yàn)證。因此,將這個(gè)算法用在無(wú)人機(jī)高空識(shí)別領(lǐng)域,完全能夠彌補(bǔ)傳統(tǒng)算法的不足,達(dá)到更加穩(wěn)定鎖定跟蹤的目的。

慧視光電開(kāi)發(fā)的Viztra-HE030圖像處理板采用了工業(yè)級(jí)芯片RK3588,內(nèi)部植入公司自主研發(fā)的智能圖像算法,架構(gòu)更先進(jìn),核心數(shù)8核(4大4?。?,算力6.0TOPS,支持豐富的輸出接口,同時(shí)支持H264、H265兩類視頻編碼??蓪?shí)時(shí)對(duì)目標(biāo)進(jìn)行識(shí)別或者人為的的鎖定,同時(shí)可以根據(jù)輸出目標(biāo)的靶量信息,對(duì)目標(biāo)進(jìn)行實(shí)時(shí)跟蹤。這是達(dá)成目的的硬件條件。在算法領(lǐng)域,則需要一些特殊的算法。無(wú)人機(jī)執(zhí)行任務(wù)時(shí)飛在高空,地面的物體就會(huì)顯得較小,小目標(biāo)通常指圖像中像素面積小于32*32的物體,一般的AI算法難以實(shí)現(xiàn)精細(xì)鎖定跟蹤。AI算法賦能下的圖像處理板能夠進(jìn)行目標(biāo)識(shí)別。

四川圖像識(shí)別模塊分析,圖像識(shí)別模塊

無(wú)人機(jī)搭載如光電吊艙等帶有攝像頭的設(shè)備后,達(dá)到了實(shí)現(xiàn)智能識(shí)別的硬件條件,但是傳統(tǒng)的攝像頭只能獲取圖像,并不具備AI識(shí)別的功能。無(wú)人機(jī)AI識(shí)別算法的關(guān)鍵還是在于模仿人眼一樣進(jìn)行視覺(jué)處理,然后AI進(jìn)行智能提取和分析圖像,再和訓(xùn)練模型進(jìn)行快速比對(duì),從而在無(wú)人機(jī)快速飛行的過(guò)程中做到實(shí)時(shí)目標(biāo)識(shí)別。要想實(shí)現(xiàn)目標(biāo)識(shí)別需要的硬件支持就是AI圖像處理板。圖像處理板通過(guò)算法的賦能,就能夠?qū)δ繕?biāo)區(qū)域的物體進(jìn)行AI識(shí)別分析,從而做出判斷。由于無(wú)人機(jī)作業(yè)的環(huán)境復(fù)雜,因此對(duì)于圖像處理板的要求需要進(jìn)一步提升。成都慧視開(kāi)發(fā)的Viztra-HE030圖像處理板,采用了工業(yè)級(jí)芯片RK3588,采用先進(jìn)架構(gòu),8核(4大4?。┨幚?,算力能夠達(dá)到6.0TOPS。同時(shí),慧視光電能夠根據(jù)需求環(huán)境定制豐富的輸出接口?;垡旳I板卡可以用于大型公共停車場(chǎng)。云南自主研發(fā)圖像識(shí)別模塊提供商

慧視光電的RK3399是一款什么樣的板卡?四川圖像識(shí)別模塊分析

我國(guó)家的機(jī)動(dòng)車數(shù)量龐大,但是停車位的建設(shè)卻沒(méi)有很好的跟上節(jié)奏,這也就導(dǎo)致許多車在出行時(shí)找不到停車位,車主也就不得不臨時(shí)將車停放在路邊。隨著路邊停放車輛的不斷增多,原本寬敞的道路也就變得狹窄,嚴(yán)重時(shí)甚至?xí)碌盟共煌ā4送?,一些大車由于阻擋視野,還容易造成“鬼探頭”等事故。通常情況下,交管部門會(huì)利用路邊的抓拍設(shè)備進(jìn)行違停抓拍或者巡邏車進(jìn)行巡邏,但是從實(shí)際效果來(lái)看,作用并不明顯。于是,無(wú)人機(jī)被派上用場(chǎng)。四川圖像識(shí)別模塊分析