云南自主研發(fā)圖像識(shí)別模塊解決方案

來(lái)源: 發(fā)布時(shí)間:2024-08-22

隨著AI的快速發(fā)展,對(duì)應(yīng)的軟硬件也得到了快速的普及,蘋果公司已經(jīng)推出了新一代的具有AI功能的系列產(chǎn)品,Intel也推出了具有AI能力的新一代芯片。無(wú)論是無(wú)人機(jī)用吊艙產(chǎn)品還是邊海防用轉(zhuǎn)臺(tái)產(chǎn)品,如果前端沒有具有AI能力的圖像處理板卡或智能跟蹤設(shè)備,沒有高性能的AI算法,很難在激烈的競(jìng)爭(zhēng)中獲得優(yōu)勢(shì)。特別是針對(duì)一些特定場(chǎng)景或特定目標(biāo)的檢測(cè)跟蹤性能提升,圖像算法工程師的壓力與日俱增。按照傳統(tǒng)的做法,需要經(jīng)過數(shù)據(jù)采集、人工標(biāo)注、模型訓(xùn)練、模型部署、效果評(píng)估等流程。無(wú)人機(jī)小吊艙可以采用慧視RK3399圖像處理板實(shí)現(xiàn)遠(yuǎn)程目標(biāo)鎖定。云南自主研發(fā)圖像識(shí)別模塊解決方案

圖像識(shí)別模塊

YOLO系列算法是目標(biāo)識(shí)別領(lǐng)域很重要的技術(shù)之一,因?yàn)樾阅軓?qiáng)大、消耗算力較少,一直以來(lái)都是實(shí)時(shí)目標(biāo)檢測(cè)領(lǐng)域的主要范式。該框架被***用于各種實(shí)際應(yīng)用,包括自動(dòng)駕駛、監(jiān)控和物流等行業(yè)的目標(biāo)識(shí)別。自今年2月YOLOv9發(fā)布以后,近期,清華又推出了YOLOv10,作為計(jì)算機(jī)視覺領(lǐng)域的突破性框架,具備實(shí)時(shí)的端到端目標(biāo)檢測(cè)能力,通過提供結(jié)合效率和準(zhǔn)確性的強(qiáng)大解決方案,延續(xù)了YOLO系列的傳統(tǒng)。據(jù)悉,YOLOv10在各種模型規(guī)模上都實(shí)現(xiàn)了SOTA性能和效率。例如,YOLOv10-S在COCO上的類似AP下比RT-DETR-R18快1.8倍,同時(shí)參數(shù)數(shù)量和FLOP大幅減少。與YOLOv9-C相比,在性能相同的情況下,YOLOv10-B的延遲減少了46%,參數(shù)減少了25%。貴州RV1126開發(fā)板圖像識(shí)別模塊供應(yīng)商慧視光電開發(fā)的慧視AI圖像處理板,采用了國(guó)產(chǎn)高性能CPU。

云南自主研發(fā)圖像識(shí)別模塊解決方案,圖像識(shí)別模塊

要解決這個(gè)難題,慧視光電的算法工程師給出了小目標(biāo)識(shí)別算法的方案,通過加強(qiáng)目標(biāo)特征、數(shù)據(jù)增廣、放大輸入圖像、使用高分辨率的特征、設(shè)計(jì)合適的標(biāo)簽分配方法,以讓小目標(biāo)有更多的正樣本、利用小目標(biāo)所處的環(huán)境信息或者其他容易檢測(cè)的物體之間的關(guān)系來(lái)輔助小目標(biāo)的檢測(cè)。此外,利用自研的深度學(xué)習(xí)算法開發(fā)平臺(tái),通過不斷的深度學(xué)習(xí),能夠讓AI更加精細(xì)的識(shí)別目標(biāo)。這個(gè)方法在瑞芯微RK3588、RV1126、RK3399pro等系列圖像跟蹤板上得到了較好地驗(yàn)證。因此,將這個(gè)算法用在無(wú)人機(jī)高空識(shí)別領(lǐng)域,完全能夠彌補(bǔ)傳統(tǒng)算法的不足,達(dá)到更加穩(wěn)定鎖定跟蹤的目的。

無(wú)人機(jī)吊艙除了在安防巡檢、應(yīng)急救援等領(lǐng)域有應(yīng)用前景外,隨著2024上半年低空經(jīng)濟(jì)的大力發(fā)展,吊艙迎來(lái)了又一大應(yīng)用市場(chǎng)。利用無(wú)人機(jī)載物運(yùn)輸,具有便利高效的特點(diǎn),它能夠彌補(bǔ)傳統(tǒng)運(yùn)輸?shù)牟蛔?,提高交通運(yùn)輸?shù)男屎挽`活性,能夠有效連接城區(qū)與郊區(qū)、城與城之前的資源互送,做到資源的協(xié)調(diào)調(diào)配。低空經(jīng)濟(jì)以無(wú)人機(jī)為載體,載動(dòng)物品進(jìn)行低空運(yùn)輸,這個(gè)過程中就可以用到無(wú)人機(jī)吊艙,慧視無(wú)人機(jī)吊艙內(nèi)置攝像頭+AI圖像處理板,能夠清晰獲得無(wú)人機(jī)前方畫面,在運(yùn)輸時(shí)能夠?qū)崿F(xiàn)避障等操作。慧視光電開發(fā)的VIZ-GT07D三軸雙光慣性穩(wěn)定吊艙,集成了640×512高分辨率紅外相機(jī)、1300萬(wàn)像素的全高清可見光相機(jī)和陀螺穩(wěn)定平臺(tái)。超小的體積和重量,攜行方便,無(wú)論是白天還是夜間,都能夠獲取清晰的視頻畫面,為無(wú)人機(jī)運(yùn)輸提供便利。精確的遠(yuǎn)程打擊可以采用慧視Rk3399圖像處理板。

云南自主研發(fā)圖像識(shí)別模塊解決方案,圖像識(shí)別模塊

校園安全不僅關(guān)乎孩子們的安全,還關(guān)乎整個(gè)社會(huì)的發(fā)展。我們需要給孩子們一個(gè)安全的學(xué)習(xí)環(huán)境!基于這樣的共識(shí),成都慧視就推出了校園安全的守護(hù)方案。在校園各個(gè)角度安裝AI攝像頭,這類攝像頭搭載了慧視光電開發(fā)的Viztra-LE034等圖像處理板,內(nèi)置高精度的目標(biāo)識(shí)別跟蹤算法,能夠增加校園內(nèi)安全管理的預(yù)警能力。AI攝像頭由各視頻監(jiān)控點(diǎn)和視頻報(bào)警設(shè)備組成,其中各監(jiān)控點(diǎn)利用視頻監(jiān)測(cè)、采集重要場(chǎng)所發(fā)生異常情況的信息和其他有效信息,并控制攝錄系統(tǒng)快速采集圖像信息;所有這些視頻可以通過數(shù)據(jù)傳輸系統(tǒng)傳輸給視頻報(bào)警系統(tǒng),通過視頻分析算法進(jìn)行分析、篩選、分類整理、完成設(shè)定的配置和報(bào)警相應(yīng)的功能。成都慧視有工業(yè)級(jí)板卡RK3588.云南自主研發(fā)圖像識(shí)別模塊解決方案

慧視RK3588圖像跟蹤板支持圖像識(shí)別模塊識(shí)別目標(biāo)(人、車)。云南自主研發(fā)圖像識(shí)別模塊解決方案

IDEA研究院團(tuán)隊(duì)推出了GroundingDINO? 1.5,它能夠?qū)崿F(xiàn)端側(cè)實(shí)時(shí)識(shí)別。在圖像和文本的語(yǔ)義理解上表現(xiàn)出色,能夠快速、準(zhǔn)確地根據(jù)語(yǔ)言提示檢測(cè)和識(shí)別圖像中的目標(biāo)對(duì)象。作為當(dāng)前性能比較好的開集檢測(cè)模型,GroundingDINO? 1.5Pro可以幫助構(gòu)建海量的具有物體級(jí)別語(yǔ)義信息的多模態(tài)數(shù)據(jù),從而有效地助力多模態(tài)大模型的訓(xùn)練。它可以將長(zhǎng)文本描述中的短語(yǔ)與圖像中的具體對(duì)象或場(chǎng)景精確匹配,以增強(qiáng)AI對(duì)視覺內(nèi)容和文本之間關(guān)系的理解。目前,成都慧視利用AI圖像處理板和YOLO算法來(lái)實(shí)現(xiàn)對(duì)物體的實(shí)時(shí)監(jiān)測(cè),其中,開發(fā)的Viztra-HE030圖像處理板采用了瑞芯微全新一代高性能芯片RK3588,擁有四大四小八核處理器,算力水平能夠達(dá)到6.0TOPS,在我司定制多種視頻接口后,可實(shí)時(shí)對(duì)目標(biāo)進(jìn)行識(shí)別或者人為的的鎖定,同時(shí)可以根據(jù)輸出目標(biāo)的靶量信息,對(duì)目標(biāo)進(jìn)行實(shí)時(shí)跟蹤。云南自主研發(fā)圖像識(shí)別模塊解決方案