隨著AI大模型、多模態(tài)感知、深度學習等技術的突破,智能視覺技術已成為驅動安防行業(yè)革新的核心引擎。據(jù)行業(yè)數(shù)據(jù)顯示,2023年中國AI安防市場規(guī)模已突破728億元,計算機視覺技術在人臉識別、行為分析、風險預測等場景中滲透率超60%。預計到2030年,全球3D監(jiān)控攝像機的市場規(guī)模將達約7.92億美元,相對于2022年的市場規(guī)模,復合增長率將超20%。


在活動上,芯明空間智能產(chǎn)品總監(jiān)劉億明博士分享了「空間智能芯片解鎖AI安防大模型:3D視覺與智能感知的革新實踐」主題演講,聚焦芯明在空間智能芯片領域的核心技術突破和在AI安防領域的創(chuàng)新應用,探討如何通過智能感知技術重構安防系統(tǒng)的智能,推動AI安防從“看見”向“看懂”“預判”的質變升級。
劉博士說:“多維度、缺乏前瞻性、缺乏主動性等是目前AI安防應用的痛點,常見的解決途徑之一是采用Transformer構架的視覺語言模型,而高性能的視覺語言模型正在變得越來越小型化。例如微軟的Florence-2 模型,其大小僅有0.7B,這就為在邊緣端用一顆芯片部署提供了可能性?!?br />
芯明自研系列空間智能芯片是目前全球唯一單芯片集成芯片化實時3D立體視覺感知、AI(人工智能)、SLAM(實時定位建圖)的系統(tǒng)級芯片。其自帶的3D視覺處理器,可以在不增加算力和硬件復雜度的基礎上高效的為模型提供深度信息,極大的地提高小模型的理解力,泛化力和精準度。
劉博士表示,搭載視覺語言模型的芯明空間智能單芯片解決方案能夠幫助客戶降低系統(tǒng)成本,更快實現(xiàn)量產(chǎn);更多的3D視覺數(shù)據(jù)信息,也能夠有效解決由于3D視覺數(shù)據(jù)集不足而造成的模型發(fā)展受限問題。此外,模型的發(fā)展同樣可以推動更多的3D監(jiān)控部署,通過數(shù)據(jù)模型的相互推動,助力行業(yè)步入高速發(fā)展階段。
“可以預見,在不遠的將來,越來越多的監(jiān)控系統(tǒng)將具備3D視覺能力,甚至成為主流和標準,”劉博士說。