圖像識別技術(shù)在可以被廣泛應(yīng)用之前,一個重要的挑戰(zhàn)是,怎樣才能知道一個模型對未曾出現(xiàn)過的場景仍然具有很好的泛化能力。在目前的實踐中,數(shù)據(jù)集被隨機劃分為訓(xùn)練集和測試集,模型也相應(yīng)地在這個數(shù)據(jù)集上被訓(xùn)練和評估。需要注意的是,在這種做法中,測試集擁有和訓(xùn)練集一樣的數(shù)據(jù)分布,因為它們都是從具有相似場景內(nèi)容和成像條件的數(shù)據(jù)中采樣得到的。然而,在實際應(yīng)用中,測試圖像或許會來自不同于訓(xùn)練時的數(shù)據(jù)分布。這些未曾出現(xiàn)過的數(shù)據(jù)可能會在視角、大小尺度、場景配置、相機屬性等方面與訓(xùn)練數(shù)據(jù)不同。慧視光電推出的深度學(xué)習(xí)算法開發(fā)平臺SpeedDP就能夠通過不斷的訓(xùn)練,達到快速圖像標(biāo)注的目的,讓AI能夠更加精確的識別目標(biāo)。RK3588圖像處理板是工業(yè)級別的。山西智慧交通圖像識別模塊研發(fā)
圖像識別技術(shù)的高價值應(yīng)用就發(fā)生在你我身邊,例如視頻監(jiān)控、自動駕駛和智能醫(yī)療等,而這些圖像識別進展的背后推動力是深度學(xué)習(xí)。深度學(xué)習(xí)的成功主要得益于三個方面:大規(guī)模數(shù)據(jù)集的產(chǎn)生、強有力的模型的發(fā)展以及可用的大量計算資源。對于各種各樣的圖像識別任務(wù),精心設(shè)計的深度神經(jīng)網(wǎng)絡(luò)已經(jīng)遠(yuǎn)遠(yuǎn)超越了以前那些基于人工設(shè)計的圖像特征的方法。盡管到目前為止深度學(xué)習(xí)在圖像識別方面已經(jīng)取得了巨大成功,但在它進一步廣泛應(yīng)用之前,仍然有很多挑戰(zhàn)需要我們?nèi)ッ鎸?。山西智慧交通圖像識別模塊研發(fā)慧視AI算法是無人設(shè)備的“眼睛”。
深度學(xué)習(xí)是機器學(xué)習(xí)的一個分支,只在近十年內(nèi)才得到廣泛的關(guān)注與發(fā)展。它與機器學(xué)習(xí)不同的,它模擬我們?nèi)祟愖约喝プR別人臉的思路。比如,神經(jīng)學(xué)家發(fā)現(xiàn)了我們?nèi)祟愒谡J(rèn)識一個東西、觀察一個東西的時候,邊緣檢測類的神經(jīng)元先反應(yīng)比較大,也就是說我們看物體的時候永遠(yuǎn)都是先觀察到邊緣。就這樣,經(jīng)過科學(xué)家大量的觀察與實驗,總結(jié)出人眼識別的模式是基于特殊層級的抓取,從一個簡單的層級到一個復(fù)雜的層級,這個層級的轉(zhuǎn)變是有一個抽象迭代的過程的。深度學(xué)習(xí)就模擬了我們?nèi)祟惾ビ^測物體這樣一種方式,首先拿到互聯(lián)網(wǎng)上海量的數(shù)據(jù),拿到以后才有海量樣本,把海量樣本抓取過來做訓(xùn)練,抓取到重要特征,建立一個網(wǎng)絡(luò),因為深度學(xué)習(xí)就是建立一個多層的神經(jīng)網(wǎng)絡(luò),肯定有很多層。有些簡單的算法可能只有四五層,但是有些復(fù)雜的,像剛才講的谷歌的,里面有一百多層。當(dāng)然這其中有的層會去做一些數(shù)學(xué)計算,有的層會做圖像預(yù)算,一般隨著層級往下,特征會越來越抽象。
隨著相關(guān)技術(shù)的迅猛發(fā)展,城市智慧治安防控模式也在不斷革新,主要以無人巡邏車、無人機為主要載體。無人巡邏車主要承擔(dān)城區(qū)巡邏防控、遠(yuǎn)程喊話、安防宣傳、視頻巡控等工作任務(wù),這種無人機不需要太大的體積通過搭載AI圖像處理板等傳感器,通過AI智能算法和圖像處理板的共同作用實現(xiàn)智能避障,達到自主巡邏、AI智慧識別的目的。像成都慧視開發(fā)的高性能AI圖像處理板Viztra-HE030,采用先進架構(gòu),8核處理器,算力能夠達到6.0TOPS,能夠?qū)崟r檢測無人巡邏車視野范圍內(nèi)的物體,輔助進行信息收集、避障等操作?;垡旳I圖像處理板是高精度識別的板卡。
YOLO系列算法是目標(biāo)識別領(lǐng)域很重要的技術(shù)之一,因為性能強大、消耗算力較少,一直以來都是實時目標(biāo)檢測領(lǐng)域的主要范式。該框架被***用于各種實際應(yīng)用,包括自動駕駛、監(jiān)控和物流等行業(yè)的目標(biāo)識別。自今年2月YOLOv9發(fā)布以后,近期,清華又推出了YOLOv10,作為計算機視覺領(lǐng)域的突破性框架,具備實時的端到端目標(biāo)檢測能力,通過提供結(jié)合效率和準(zhǔn)確性的強大解決方案,延續(xù)了YOLO系列的傳統(tǒng)。據(jù)悉,YOLOv10在各種模型規(guī)模上都實現(xiàn)了SOTA性能和效率。例如,YOLOv10-S在COCO上的類似AP下比RT-DETR-R18快1.8倍,同時參數(shù)數(shù)量和FLOP大幅減少。與YOLOv9-C相比,在性能相同的情況下,YOLOv10-B的延遲減少了46%,參數(shù)減少了25%。慧視RK3399圖像跟蹤板支持圖像識別模塊識別目標(biāo)(人、車)。云南國產(chǎn)化圖像識別模塊系統(tǒng)
RK3399圖像處理板識別概率超過85%。山西智慧交通圖像識別模塊研發(fā)
試想一下,當(dāng)你走到一家超市,沒有排隊稱重,沒有傳統(tǒng)的掃碼收銀機,也沒有手機掃碼支付,只有一臺擁有5個攝像頭的收銀機,被AI賦能的智能零售技術(shù)相比于舊的零售業(yè)中所使用的人工結(jié)算方法,條形碼掃碼,以及沒有被大量使用的RFID技術(shù),智能零售可以讓客戶驗到更便捷、更快速的稱重、掃碼、結(jié)賬過程,用戶好感度由此提升,人臉識別與顧客會員體系掛鉤。顧客到店里,超市會提供更好的服務(wù),結(jié)賬時的自動識別商品,會更加節(jié)省人們的時間,讓購物更加便捷。隨著商品識別發(fā)展,機器人也可以整理貨架、分揀貨物、移動貨位,代替人類做一些簡易的、重復(fù)性的工作,生產(chǎn)效率會提升很多。山西智慧交通圖像識別模塊研發(fā)