甘肅視覺算法圖像識別模塊技術(shù)

來源: 發(fā)布時間:2025-04-19

在2024年的巴黎奧運會上,AI的應(yīng)用成為了競技之外的另一個焦點,讓運動員、觀眾、管理人員體驗到了和以往賽事與眾不同的氛圍。其中,安全作為不可避免的話題,成為本次AI作用比較大的領(lǐng)域之一。前期建設(shè)時,就采用了智能體育館的方案,配有先進的傳感器和物聯(lián)網(wǎng)設(shè)備,通過對實時人流的大量數(shù)據(jù)分析,來預(yù)測觀眾接下去會去看什么,優(yōu)化下一場場館的安保、座位等事務(wù),提升觀眾體驗,提高安保水平。另一方面,攝像頭收集畫面時,還會對監(jiān)控畫面的每一個人進行安全識別分析,針對于“禁區(qū)”除了常規(guī)的面部識別外,還會對每個進入場館或者在場館附近徘徊逗留的人進行AI分析,來發(fā)現(xiàn)潛在的威脅和異常。然后一旦出現(xiàn)可疑人員或者物品,就可以立即向現(xiàn)場安保發(fā)去坐標(biāo),從而提升整個場館內(nèi)外的總體安全性。分別是利用RV1126開發(fā)而成的Viztra-LE026圖像處理板;甘肅視覺算法圖像識別模塊技術(shù)

圖像識別模塊

瑞芯微推出的RK3588系列圖像處理板作為國產(chǎn)化板卡的性能前列,成為了各領(lǐng)域研究開發(fā)的優(yōu)先,它能在諸多行業(yè)實現(xiàn)目標(biāo)檢測、識別以及跟蹤等功能,具有重要的研究開發(fā)價值。特別是對于高校而言,將RK3588作為課題進行研究開發(fā),是一個不錯的選擇。但是在這些功能實現(xiàn)過程中,算法的能力就十分重要,如何讓算法更加精細(xì)的識別檢測例如人、車、船等目標(biāo)成為首要解決的問題。要想讓AI算法更能精確的識別檢測目標(biāo),可以利用AI的深度學(xué)習(xí)能力,讓AI不斷學(xué)習(xí)這些目標(biāo)的特征,從而達(dá)到精細(xì)識別的能力。這個過程,可以通過大量的數(shù)據(jù)標(biāo)注,來訓(xùn)練AI。但大量待標(biāo)注工作,常常讓開發(fā)者頭疼。如果采用傳統(tǒng)方式用人工挨個挨幀標(biāo)注,將會耗費大量時間精力,讓成本不可控。成都運動軌跡圖像識別模塊板高性能的圖像識別處理板RV1126。

甘肅視覺算法圖像識別模塊技術(shù),圖像識別模塊

無人機夜間工作時需要依靠紅外機芯進行高清成像,而想要具備AI檢測識別的能力則可以通過植入圖像處理板。成都慧視可以根據(jù)需求提供整套的建設(shè)方案,實現(xiàn)快速集成開發(fā)?;垡昖iztra-LE026圖像處理板+MiNO?17紅外機芯的組合方案,兩款產(chǎn)品均使用小巧設(shè)計,整體組合重量在30g左右,并且都采用小功耗設(shè)計,用在無人機領(lǐng)域不會過多增加負(fù)擔(dān)。在算法的賦能下,能夠?qū)崿F(xiàn)穩(wěn)定的目標(biāo)檢測識別。Viztra-LE026圖像處理板重量在10g左右,采用了瑞芯微全國產(chǎn)化芯片RV1126,能夠輸出2.0TOPS的算力,功耗不高于4W。能夠以30Hz幀率跟蹤像素2*2的目標(biāo),能夠識別像素為12*12的目標(biāo),且識別率高于85%。而MiNO?17紅外機芯重量在20g左右(凈重5g(不含鏡頭)),像素分辨率為640*512,采用9/13/25mm三種定焦設(shè)計,支持18中偽彩選擇,功耗小于0.75W。

“啟明935A”系列芯片已經(jīng)成功點亮,并完成各項功能性測試,達(dá)到車規(guī)級量產(chǎn)標(biāo)準(zhǔn)。啟明935A是行業(yè)首顆基于Chiplet(芯粒/小芯片)異構(gòu)集成范式的自動駕駛芯片,但并非單一芯片,而是一個家族系列。啟明935HUBChiplet可以和不同數(shù)量的大熊星座AIChiplet互相搭配,再結(jié)合靈活的封裝方式,快速形成不同性能等級的SoC芯片。它還支持高帶寬的PBLink多芯互連,雙芯雙向帶寬128GB/s,四芯雙向帶寬64GB/s。啟明935A每顆芯片都支持比較大20路的1080p60攝像頭輸入,可應(yīng)用于各類端側(cè)AI部署。得益于大熊星座NPU天然支持Transformer結(jié)構(gòu),初步支持的模型有Yolo系列、ResNet50、PSPNet、PointNet++、TrafficSign_Retinanet、BevDet、miniCPM、Unet_ResNet50、PointPillars、PillarNest、M2track、BevFusion、PaliGemma、LLaMa-3B、8B等等。如何提升目標(biāo)識別的精度?

甘肅視覺算法圖像識別模塊技術(shù),圖像識別模塊

無人機能夠通過高空拍攝快速獲取大范圍、多角度的地面信息。但是傳統(tǒng)的攝像頭只能獲取視頻數(shù)據(jù),對于許多需要進行數(shù)據(jù)分析的行業(yè)來說顯然不夠智能化,從無人機視頻數(shù)據(jù)中快速獲取提煉大量有價值的信息,不僅能夠提升工作效率,還能夠減少不小的成本支出。這就是無人機的AI識別能力。通過識別算法,在無人機工作時就對目標(biāo)范圍進行AI檢測識別,從而提煉所需信息。這就需要對無人機進行智能化改造,可以在傳統(tǒng)無人機吊艙中植入成都慧視開發(fā)的高性能AI圖像處理板,如利用RK3588深度開發(fā)而成的Viztra-HE030圖像處理板,6.0TOPS的算力能夠快速處理無人機識別到的復(fù)雜畫面信息,這樣就有了硬件基礎(chǔ),剩下的就需要對自身算法進行不斷優(yōu)化提升。成都慧視共開發(fā)有三款圖像處理板。運動圖像識別模塊板卡

如何高效進行安防巡檢工作?甘肅視覺算法圖像識別模塊技術(shù)

而這個過程中,如何讓無人機理解并提取分析圖像很關(guān)鍵,這就需要高精尖的目標(biāo)識別算法。成都慧視開發(fā)的AI智能算法分析是一種計算機的“分析”和“識別”技術(shù),是一種計算機“視覺”科技,也就是把攝像機當(dāng)作人的“眼睛”,智能設(shè)備終端作為人的“大腦”,讓視頻系統(tǒng)具有人一樣的判斷危險或者其他特殊情況發(fā)生的能力。圖像處理板和這樣的目標(biāo)識別算法的合力之下,就可實時對目標(biāo)進行識別或者人為的的鎖定,同時可以根據(jù)輸出目標(biāo)的靶量信息,對目標(biāo)進行實時跟蹤。這就是無人機實現(xiàn)智能識別的一種高效方法,通過實時的目標(biāo)識別處理無人機獲取的數(shù)據(jù),讓無人機的工作更加高效。甘肅視覺算法圖像識別模塊技術(shù)