加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 說“安防+AI”過時,言之尚早
    • 大模型時代,安防行業(yè)做好準備了嗎?
    • “新安防、真智能”,安防的下一個十年屬于智能
    • 結(jié)語
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

安防進入大模型時代,依圖「求索」新十年

2023/12/21
3852
閱讀需 19 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者 | 劉路遙 ,編輯?| 余快

自2016年始,中國的AI視覺創(chuàng)業(yè)俯拾皆是。

他們因AI而齊聚,從最頂尖的學術(shù)象牙塔中走出,希望用AI之鑰,革新傳統(tǒng)產(chǎn)業(yè)塵封已久的商業(yè)模式。

然而,回看這場探夢之旅,絕大部分高調(diào)入場者,最終都黯然收場,只有寥寥數(shù)家企業(yè)沖破封鎖,其中佼佼者成為人們口中的“AI四小龍”。

最初的高光過后,外界對AI公司高融資、高研發(fā)、高虧損的質(zhì)疑不斷升溫。

在有關(guān)四小龍失速的討論中,技術(shù)光環(huán)褪去,資本熱情消散,政策風險提高,是最人盡皆知的原因。

從同一CV戰(zhàn)線,到分頭走向不同道路,事到如今又面對同樣一個問題——哪里才有新的生機?

市場的轉(zhuǎn)機,往往發(fā)生在技術(shù)演進的剎那。

在被定義為中國“大模型元年”的2023年,命運的齒輪又開始重新轉(zhuǎn)動。

藉由AIGC的風口,AI賽道一改頹勢,重新占據(jù)各類熱門話題的榜首。

在重新拉開的新賽事中,AI的老玩家們必然不會缺席。

說“安防+AI”過時,言之尚早

2016年,當阿爾法狗在棋盤游戲上奪走人類最后的榮光,AI賽道的投融資開始熱得發(fā)燙。

起初幾年,初創(chuàng)公司們備受風險投資的寵愛,資本爭搶著上前買單,企業(yè)只需醉心實驗室研發(fā),便能坐看估值升高。

然而幾年過去,眼看著企業(yè)在融資、研發(fā)、虧損的泥沼中沒完沒了,商業(yè)化落地又遲遲難以大規(guī)模鋪開,資本逐漸板起面孔,不再愿意聽著故事為虧損買單。

理想中,技術(shù)帶來的饋贈之下,這是一場“眾人拾柴火焰高”的合作共贏,但事實上,大家合力助推的不僅僅是浪涌,同時還有盛大的泡沫。

隨之而來的,是市場關(guān)于AI商業(yè)模式的探討,能否驗證自身商業(yè)化能力,成為評判一家AI企業(yè)新的考核標準。

短短幾年,風向急速扭轉(zhuǎn),原因在于AI這一極具顛覆性技術(shù)帶來的暢想,掩蓋了新技術(shù)在價值轉(zhuǎn)化過程中會遇到的困難。

安防是AI最早落地的場景之一,通過人臉識別、行為分析等技術(shù),監(jiān)控系統(tǒng)得以提高效能。但同時,安防行業(yè)的碎片化特點,讓標準化、通用化難以實現(xiàn),導致AI企業(yè)在追求算法和精度的過程中,陷入高度定制化的盈利困局。

尤其隨著雪亮工程建設(shè)尾期結(jié)束,安防行業(yè)也遇到發(fā)展瓶頸,于是有人問,問題是不是出在安防行業(yè),換一個行業(yè),問題是不是會迎刃而解?

一個事實是:AI確實遇到了商業(yè)化落地難題,但安防是AI應(yīng)用落地的起點,大模型時代的開啟,安防仍然是一個不錯的起點。

智能化的視角下,智能本質(zhì)上解決機器學習人類的認知、視覺、運動、意識、記憶五個方面。人工智能的核心技術(shù)包括語言智能、視覺智能、運動智能。

而視覺智能最大的應(yīng)用場景就在公安,也即狹義的安防市場。

一直以來,AI視覺的落地都在經(jīng)歷同一個過程,從公安起步,到政府,再到企業(yè),大模型的落地也不會例外。

在依圖科技副總裁許焰看來,智能化的每一次進展,都脫離不了以安防為起點,“在政府各部門中,公安部門的信息化一直做得非常超前,對視頻數(shù)據(jù)的利用在業(yè)務(wù)上存在剛需,對技術(shù)理解最深刻,最愿意用新技術(shù)解決面臨的問題?!?/p>

以往問題的癥結(jié)在于,AI原有技術(shù)路線始終難以突破成本瓶頸;如今以大模型為代表的新一輪AI風口的出現(xiàn),相當于為價值和成本的兼顧難題提供一個極佳的解法。

大模型的到來,也為處在轉(zhuǎn)型迷茫期,重新思考自身價值和出路的AI企業(yè),帶來了新的生機。

早期成立的AI公司有客戶基礎(chǔ),拿依圖來說,公安行業(yè)大部分都是其老客戶,一旦依圖有新技術(shù),落地轉(zhuǎn)化將非??臁?/p>

更重要的,上一波AI公司在商業(yè)化上吃過苦,早已不再只談技術(shù)領(lǐng)先,他們明白,只有將領(lǐng)先的技術(shù)與業(yè)務(wù)場景相結(jié)合,并做到低成本,才是真正解決用戶痛點。

大模型時代,安防行業(yè)做好準備了嗎?

大模型時代到來,安防行業(yè)做好準備了嗎?

如果用一句話總結(jié),可以說是:安防市場的需求與技術(shù)浪潮撞了個滿懷。

在這一輪新的AI風口上,四小龍都紛紛趕考多模態(tài)大模型:商湯發(fā)布了“日日新大模型”,云從發(fā)布了“從容大模型”,曠視也發(fā)布了輕量級LLM模型推理框架...今天,依圖的“天問”多模態(tài)大模型雖正式發(fā)布較晚,但事實上已經(jīng)得到了客戶的積極認可,目前在已在30多個項目中部署應(yīng)用,落地進程更進一步。

這些AI的老玩家們,從上一輪廝殺中,頑強活了下來,如今藉由此前積累的數(shù)據(jù)和行業(yè)認知,從視覺切入多模態(tài)大模型,是一次水到渠成的向外拓展。

近兩年,安防行業(yè)發(fā)展進入瓶頸期,增長乏力,放眼安防行業(yè)的主要參與者們,無人不渴望變化,紛紛在廣度、深度兩個方向?qū)で笃凭种馈?/strong>

廣度上,狹義上的安防市場,從以抓逃布控為主體的公共安全業(yè)務(wù),走向更綜合的城市治理類業(yè)務(wù);與此同時,泛安防市場借助視覺智能化技術(shù),向前進入更大的ToB企業(yè)市場,同時增加非視頻投入,通過擴充產(chǎn)品線,尋求更大的增長空間。

深度上,企業(yè)仍以視頻為核心,在智能技術(shù)上進一步投入感知智能、認知智能,部屬大模型能力。

這兩個方向的開掘,都與視頻的智能化緊密結(jié)合。

從早期“看得見",到“看得清",再到今天大模型賦能下的“看得懂",視頻智能化經(jīng)歷了L1-L5五個階段的進化:

從圖片的結(jié)構(gòu)化標簽到視頻的語義理解;

從眾多的判別式任務(wù)模型到視覺為基礎(chǔ)的多模態(tài)大模型;

從端側(cè)攝像頭AI算力到云邊側(cè)集中式服務(wù)器AI算力;

從人、車的識別到長尾物體的識別;

從標簽式篩選交互到基于語義的人機多模態(tài)交互。

在L5階段,大家基本達成一個重要共識:以Transformer為基礎(chǔ)的大模型統(tǒng)一了視頻和大數(shù)據(jù)的底層框架,也開啟了視頻智能化情境理解的新時代。

意味著面對同一個指令,整個流程將從割裂的兩個步驟簡化成一個步驟,并且由于省略了中間過程,預測準確性將極大提升。

以統(tǒng)計A路口過去十天的擁堵狀況為例,以往的做法是,先通過攝像頭做解析產(chǎn)生大量結(jié)構(gòu)化數(shù)據(jù),再到數(shù)據(jù)庫環(huán)節(jié)匹配結(jié)果;而視覺和大數(shù)據(jù)的融合,將非結(jié)構(gòu)化的視頻和結(jié)構(gòu)化的數(shù)據(jù)庫做了融合,變成用一個模型統(tǒng)一解決,具體到操作,只需語音指揮即可,“過去10天A路口特別擁堵,請將該路口的攝像頭調(diào)取出來”。

換言之,大模型時代,當數(shù)據(jù)從一端流入,結(jié)果就會從另一端直接流出。

于公安行業(yè),將是一場警務(wù)信息化系統(tǒng)的大改造。

首先,大模型將帶來視頻智能化建設(shè)的重大轉(zhuǎn)變。

視頻智能化建設(shè)分兩種模式:一是圖片流,前端相機直接做智能化,然后把圖片回傳后端做進一步分析,缺點是大量信息被丟失;一是視頻流,前端攝像頭負責捕捉,后端進行視頻分析,雖然保留了視頻中的所有語義,行為能被完整刻畫,但由于沒有大模型的加持,視頻完整語義的價值并沒有被完全挖掘和使用。

走視頻流的智能化路線,是對客戶更加負責的選擇,“圖片流只能做人臉識別,隨著業(yè)務(wù)需求增長,圖片流建設(shè)模式就會變成斷頭路,只能換新相機;而視頻流對前端建設(shè)有利舊保護,只需后端升級算法即可?!?/p>

考慮到大模型只能部署在后端,未來視頻流智能化或?qū)⒊蔀橹髁鳌?/p>

其次,是IT基礎(chǔ)設(shè)施的重大變化。

前面已經(jīng)提到,傳統(tǒng)的信息化技術(shù),通過前端攝像機會產(chǎn)生大量結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)存在數(shù)據(jù)庫里,數(shù)據(jù)庫則存在硬盤里。

大模型時代,所有數(shù)據(jù)經(jīng)過模型處理,會生成蘊含對視頻語義完整理解的特征向量,特征向量存在向量數(shù)據(jù)庫里,向量數(shù)據(jù)庫存在顯存里。

在從傳統(tǒng)數(shù)據(jù)庫變到向量數(shù)據(jù)庫的過程中,基礎(chǔ)設(shè)施層面,也將從過去建CPU為主的數(shù)據(jù)庫系統(tǒng),到建設(shè)GPU為主的向量搜索系統(tǒng)。

基于這一認知,依圖在2022年發(fā)布了求實服務(wù)器。

對于這款服務(wù)器的誕生,許焰如此解釋:“進入到向量時代,超融合架構(gòu)的服務(wù)器威力非常大,依圖求實服務(wù)器有一個最大的特點,內(nèi)存即顯存,因為即便英偉達的A100也只有40G的顯存,但求實服務(wù)器內(nèi)存可以到512G,甚至1T?!痹S焰介紹。

再者,從生產(chǎn)過程講,有了預訓練大模型,用戶需求端到端的時間以及成本會被極大壓縮。

一方面,用大模型技術(shù)替代過去小模型,可以極大壓縮生產(chǎn)過程周期,降低算法研發(fā)成本,讓客戶更快享受到技術(shù)的紅利。

比如,當用戶要做一個“騎電瓶車不戴頭盔”的需求時,AI公司需要先收集數(shù)據(jù)做訓練,需求提出到滿足,至少一到兩個月。

有了預訓練大模型后,只需輸入“騎電瓶車不帶頭盔”的指令,就能生成算法,一周時間即可達到之前一兩個月才有的效果,并且時間越長,模型精度越高。

另一方面,通過算法和算力的端到端的整合,也會帶來成本最小化。

許焰舉例,“過去做1萬路視頻智能化,得用16個機柜,現(xiàn)在算法和算力實現(xiàn)端到端整合后,只用一個機柜就可以解決所有問題,但整體成本下降了80%?!?/p>

最后,從業(yè)務(wù)層面講,傳統(tǒng)的指揮中心、移動警務(wù)、偵查破案等都會發(fā)生重大變化。

比如指揮中心可以直接通過語音調(diào)取攝像頭,如“幫我調(diào)取所有公園的視頻”、“幫我調(diào)取所有現(xiàn)在擁堵路段的視頻”;移動警務(wù)也將變成,民警在路上巡邏上時,不再需要在執(zhí)法儀上打字,而可以高效率地通過語音輸入指令,如“請查詢前方戴黑色帽子的人的身份?!?/p>

“新安防、真智能”,安防的下一個十年屬于智能

“依圖一直堅信安防市場會從監(jiān)控走向智能?!?/p>

如果說依圖有什么明顯區(qū)別于其他公司的地方,就在于其始終認可安防市場的價值,并用十年時間堅守安防市場。

談到依圖對安防市場的貢獻,許焰滿是自豪:

“自2012年成立至今,在安防智能化發(fā)展的各個階段,依圖都代表業(yè)界最前沿水平。依圖之所以堅信安防是個好市場,一個原因也在于依圖在安防市場做到了盈利,持續(xù)為客戶創(chuàng)造價值。”

這種價值具體表現(xiàn)為,時至今日,依圖是安防行業(yè)第一個推出可實戰(zhàn)可商用的多模態(tài)大模型的公司。

“第一個”寫起來雖然簡單,但對于依圖而言,背后是沉甸甸的付出。

2018年,依圖提出“新安防,真智能”的口號,至今未變。

彼時,視覺智能化快速發(fā)展,人臉識別開始進入規(guī)?;涞仉A段。依圖的“新安防”口號,為公安業(yè)務(wù)流程的變革而發(fā);“真智能”口號的提出,則強調(diào)了“真正的智能”給安防行業(yè)帶來的差異化的用戶價值。

進入大模型時代,公安的業(yè)務(wù)流程、智能化程度躍遷到了新的階段,但依圖這句口號的內(nèi)核依然沒有變化。

真正讓人動容之處在于,依圖并沒有淪為“口號專家”,而是將口號掛在了實際行動上。

一直以來,客戶看似不合理的追求六個字:高價值、低成本。

滿足這個需求并不容易,尤其在AI這一有著極高技術(shù)和渠道門檻的賽道。

但依圖對這句話的信奉和踐行,是AI公司中難得一見的扎實。

支撐依圖“安防是好市場”背后的商業(yè)邏輯正是,追求價值最大化、成本最小化。

依圖2017年開始布局芯片板塊,2019年5月9日發(fā)布首款云端AI芯片“求索”,用于視覺推理領(lǐng)域。

當時的發(fā)布會現(xiàn)場,依圖通過四塊“求索”芯片,實時比對現(xiàn)場觀眾,演示十分鐘內(nèi),無一起誤報。

依圖之所以向上做芯片,在于看到了算法性能高速發(fā)展和機器算力提升緩慢的矛盾,這一矛盾導致AI公司們要么犧牲算法性能,削足適履;要么沒有先進算法,空耗資源。

而隨著中美科技競爭的加劇,美國對中國芯片的封鎖制裁力度持續(xù)升級,國產(chǎn)化具有高性價比的芯片產(chǎn)品在此刻顯得尤為重要,依圖的選擇似乎又更具有前瞻性:做硬件和算法的端到端的整合,可以給用戶最高性價比的后端智能化產(chǎn)品。

如果說,以前因為缺乏統(tǒng)一的模型結(jié)構(gòu)導致芯片和算法公司難以匹配,在一定程度上說明人工智能芯片還不太成立,那么到今天,這個阻礙已經(jīng)消失了。

2019年,依圖開始投入以Transformer為基礎(chǔ)的大模型技術(shù),如今回看這一決定,其意義在于,選對了公司未來幾年的發(fā)展路徑。

當企業(yè)選擇的方向更準確,研發(fā)的效率就會更高效,成本更低,對客戶而言就是更高的性價比,最終實現(xiàn)雙贏。

“到今天,依圖的多模態(tài)大模型已經(jīng)在全國30多個項目中部署應(yīng)用?!睋?jù)許焰介紹,依圖“天問”多模態(tài)大模型,有以下三大特點:

其一,視頻語義搜索能力,支持用自然語言搜索各類視頻。

類似“堵塞消防通道的車”、”積水的路面“、”無人看管的紅色行李箱“等表達都可以快速找出對應(yīng)的視頻。

其二,零樣本、冷啟動。

比如要創(chuàng)建一個騎車不戴頭盔的算法,只需輸入“騎車不戴頭盔”,就能生成算法,并且算法一旦上線,便能在線上做分鐘級的訓練,越用精度越高。

其三,內(nèi)置了大量凝結(jié)依圖對行業(yè)認知的算法。

通過針對性的將特定數(shù)據(jù)放入訓練模型中,如大客流、重點區(qū)域防控等典型算法,來提高模型性能。

今年以來,依圖的天問大模型收到不少令許焰印象深刻的反饋。

某城市交通事故頻發(fā),該市客戶找到依圖做城市路口的常規(guī)違章和不文明行為判定,要求用天問大模型賦能利舊的前端攝像頭。

依圖做了闖紅燈、超速、不禮讓行人、騎車不戴安全帽、違法掉頭、壓實線等各種各樣的算法,系統(tǒng)上線第一天,準確度只有60%-70%,一周結(jié)束后精度基本達到100%,并且成本比以往的建設(shè)成本下降了 60% - 70%。

在許焰的回憶中,“當時這個客戶特別興奮,因為依圖用一周時間,解決了該城市交通治理極大的痛點?!?/strong>

除了大型項目,多模態(tài)大模型的意義還在于解鎖長尾算法。

以往,大量中小型客戶,由于支付能力不強,此前對AI沒有剛需,未來借助大模型的遷移和通用能力,可以降低成本門檻,這些用戶也能用上用好大模型。

結(jié)語

路漫漫其修遠兮,吾將上下而求索。

2019年,依圖發(fā)布第一款AI芯片,從屈原的《楚辭》中找到“求索”一名,表達了對人工智能技術(shù)、人工智能產(chǎn)業(yè)落地探索的熱情。

與此同時,依圖也開啟了將Transformer技術(shù)用于視覺領(lǐng)域的研究,并同樣從《楚辭》中找到“天問”一名,賦予彼時還尚出世的視覺多模態(tài)大模型。

時至今日,依圖在國產(chǎn)化算力上有了“求索”和“求實”,在大模型算法上有了“天問”。十年AI路,依圖所打造的“全棧AI技術(shù)”和"一站式AI解決方案提供商“的形象也越發(fā)清晰,完整。

在大模型時代,依圖對安防智能化依然信心滿滿,秉持著為”價值最大化,成本最低化“的運營理念,投入堅決。隨著視覺多模態(tài)大模型產(chǎn)品的商用推出和規(guī)?;渴穑缊D又一次站在了AI新時代的浪尖。

大模型時代必然會產(chǎn)生新的商業(yè)模式和應(yīng)用場景,在依圖的第二個十年,我們期待它能再一次引領(lǐng)行業(yè),再一次把“新安防,真智能”的口號變成現(xiàn)實。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風險等級 參考價格 更多信息
ATXMEGA128A1-CUR 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, PBGA100, 9 X 9 MM, 1.20 MM HEIGHT, 0.80 MM PITCH, GREEN, CBGA-100
$10.58 查看
ATXMEGA256D3-AUR 1 Microchip Technology Inc IC MCU 8BIT 256KB FLASH 64TQFP
$6.07 查看
PIC32MX575F512L-80I/PT 1 Microchip Technology Inc 32-BIT, FLASH, 80 MHz, RISC MICROCONTROLLER, PQFP100, 12 X 12 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-100

ECAD模型

下載ECAD模型
$8.67 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜