加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • 產(chǎn)業(yè)新動(dòng)力:ReID 的價(jià)值與門(mén)檻
    • 用電子編織現(xiàn)實(shí):依圖這樣改變 ReID
    • 挑戰(zhàn)與機(jī)遇:ReID 的未來(lái)路徑
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

富蘭克林的風(fēng)箏:ReID產(chǎn)業(yè)化拉開(kāi)的計(jì)算視覺(jué)新序幕

2020/04/05
93
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

請(qǐng)大家跟我想象一下,假如你的世界里突然沒(méi)有了電,會(huì)是怎樣?沒(méi)有了鬧鐘和手機(jī),沒(méi)有了燈光與網(wǎng)絡(luò),也沒(méi)有了電腦地鐵和飛機(jī)……

一切現(xiàn)代生活的便利,都源于 1752 年 6 月的一個(gè)雷雨天,富蘭克林放飛了他的風(fēng)箏,讓世界“看到”了電——當(dāng)時(shí)被認(rèn)為是最神秘、也是最危險(xiǎn)的力量之一。

近幾年來(lái),人們面對(duì)城市中日益增多的智慧攝像頭,或多或少都會(huì)懷抱著如同“雷電”一樣的警惕。無(wú)數(shù)科幻電影都告訴我們,當(dāng)走在路上的自己被電腦錄入,出行軌跡就有可能被隨時(shí)偵查到……

顯然,這并不是因?yàn)?a class="article-link" target="_blank" href="/e/1592241.html">人工智能(人臉識(shí)別)技術(shù)太強(qiáng)大,而是因?yàn)樗€不夠強(qiáng)大,至少在大眾應(yīng)用層面是如此。舉個(gè)例子,想要在精準(zhǔn)識(shí)別與個(gè)人隱私之間達(dá)到平衡,行人重識(shí)別(Person Re-identification,簡(jiǎn)稱 ReID)就是一個(gè)非常有用的計(jì)算視覺(jué)技術(shù)。

因?yàn)樗軌蛲ㄟ^(guò)質(zhì)量并不高的人臉圖片,快速檢索出不同攝像頭下的同一個(gè)目標(biāo)任務(wù)。

這會(huì)帶來(lái)什么改變呢?

首先,人的臉和指紋一樣獨(dú)特,而 ReID 技術(shù)無(wú)需依賴高精度的人臉圖像,也就避免了人們?cè)诠矆?chǎng)合被采集個(gè)人信息的憂慮;同時(shí),ReID 分辨率夠高,在一些人臉識(shí)別無(wú)效的情況下,可以起到替代作用。

因此,ReID 也成為計(jì)算視覺(jué)科技企業(yè)們攻關(guān)的對(duì)象。最近,依圖科技在 ReID 領(lǐng)域取得突破,刷新全球工業(yè)界三大權(quán)威數(shù)據(jù)集當(dāng)前最優(yōu)成績(jī)(SOTA),算法性能達(dá)到業(yè)界迄今最高標(biāo)準(zhǔn)。

這一標(biāo)準(zhǔn)意味著什么,能否成為 ReID 產(chǎn)業(yè)化的關(guān)鍵契機(jī)?

產(chǎn)業(yè)新動(dòng)力:ReID 的價(jià)值與門(mén)檻

本杰明·富蘭克林和他的風(fēng)箏實(shí)驗(yàn),代表了人類(lèi)邁出了現(xiàn)代文明旅程的第一步。在那之前,沒(méi)人能想象有電的生活;而今天,數(shù)十億人已經(jīng)無(wú)法想象沒(méi)有電的生活了。

時(shí)代的需求和社會(huì)風(fēng)俗的推動(dòng)(很多時(shí)候是阻撓),總會(huì)有人為技術(shù)的進(jìn)程助力。ReID 即是如此。

相信大部分人都不會(huì)否認(rèn),人臉識(shí)別 / 計(jì)算視覺(jué)在城市中的應(yīng)用,正在給生活帶來(lái)越來(lái)越多的便利。

比如通過(guò)智能攝像頭來(lái)識(shí)別車(chē)流、車(chē)牌,實(shí)現(xiàn)高效率、低成本的安防;在火車(chē)站、機(jī)場(chǎng)等公共場(chǎng)所部署 AI,實(shí)現(xiàn)犯罪分子的偵查和捕獲;幫助無(wú)人購(gòu)物超市和商店提高用戶體驗(yàn);

再比如大家最熟悉的手機(jī)相冊(cè),想要讓系統(tǒng)在不侵犯隱私的情況下實(shí)現(xiàn)照片聚類(lèi),ReID 都是不可或缺的技術(shù)。

2018 年,特朗普政府決定在美國(guó)南部墨西哥邊境追查非法入境者時(shí),大眾就擔(dān)心 ICE 和其他移民機(jī)關(guān)可能會(huì)把人臉識(shí)別應(yīng)用,從而導(dǎo)致錯(cuò)誤辨識(shí)某個(gè)人并使其被錯(cuò)誤拘留?因?yàn)樵诋?dāng)時(shí),人臉識(shí)別對(duì)于有色人群或女性的識(shí)別錯(cuò)誤率依然很高。

既然 ReID 技術(shù)能夠讓智能生活變得更精準(zhǔn)有序,那為什么久攻不下呢?這恐怕要從三個(gè)技術(shù)難點(diǎn)說(shuō)起。

1. 數(shù)據(jù)缺失。

我們知道,當(dāng)前大多數(shù)攝像頭的成像質(zhì)量、分辨率、環(huán)境變化等差異都很大。在交通運(yùn)輸、工業(yè)制造和城市規(guī)劃等實(shí)際場(chǎng)景下,99%的圖像都是不含人臉或人臉部分是極其模糊的,僅有幾個(gè)像素大小,這也導(dǎo)致在許多任務(wù)中,人臉識(shí)別算法經(jīng)常失效,需要 ReID 頂上。

而一個(gè)高精準(zhǔn)的 ReID 模型,要識(shí)別同一個(gè)人在多個(gè)攝像頭下的畫(huà)面,意味著其訓(xùn)練需要足夠龐大、且具備連續(xù)性的行為數(shù)據(jù)。但與其他計(jì)算視覺(jué)任務(wù)相比,ReID 領(lǐng)域的公開(kāi)數(shù)據(jù)集所含的 ID 數(shù)量比較小,不同攝像頭的數(shù)據(jù)中同一個(gè)人的外觀也可能發(fā)生巨大變化,這些都給算法分析造成了阻礙,需要在算法設(shè)計(jì)上做很多創(chuàng)新與研發(fā)。

2. 計(jì)算壓力。

如前所述,ReID 往往被部署到規(guī)模人群的行為軌跡分析上,這意味著系統(tǒng)需要處理的數(shù)據(jù)規(guī)模成倍增長(zhǎng)。即使是采取 1:N 級(jí)(單一特征對(duì)比多種特征)的人臉識(shí)別,用來(lái)失蹤人口搜索等。加上角度、光線等復(fù)雜性,特征提取、對(duì)比、判斷都需要龐大的算力來(lái)支撐。

但現(xiàn)有的智能攝像機(jī)在本地終端無(wú)法部署足夠大的算力,往往會(huì)選擇將數(shù)據(jù)上傳到云端,再進(jìn)行識(shí)別和處理,不僅會(huì)造成一定的時(shí)延,延誤眾多關(guān)鍵任務(wù);也有可能導(dǎo)致城市大腦“數(shù)據(jù)擁塞”,延宕整個(gè)系統(tǒng)的效率。

3. 成本限制。

那么,為什么不考慮為攝像頭等邊緣終端加上芯片呢?答案就是貴。高通量計(jì)算芯片往往意味著更高的性能和穩(wěn)定性,制程上自然也要求更小的納米數(shù),而 ReID 需要在泛工業(yè)場(chǎng)景中部署,如果為城市或工廠中的每個(gè)攝像頭都加載這樣高算力的 ReID 芯片,無(wú)疑是一筆巨大的開(kāi)支,這也限制了 ReID 算法在大規(guī)模商業(yè)化場(chǎng)景中的落地。

顯然,想要讓 ReID 從一種技術(shù)遠(yuǎn)景完全照進(jìn)現(xiàn)實(shí),其所面對(duì)的困難和障礙并不小。這也是為什么,我們一直關(guān)注著致力于用 ReID 改善體驗(yàn)的公司。

用電子編織現(xiàn)實(shí):依圖這樣改變 ReID

如果說(shuō)富蘭克林的風(fēng)箏讓人類(lèi)開(kāi)始與電建立了聯(lián)系。那么,電力真正開(kāi)始產(chǎn)生規(guī)模經(jīng)濟(jì),是從喬治·威斯汀豪斯(George Westinghouse)開(kāi)始。他以交流電系統(tǒng)擊敗了愛(ài)迪生的直流電系統(tǒng),從而讓發(fā)電廠與遠(yuǎn)距離的用戶連接在一起。

而依圖在 ReID 中的表現(xiàn),正如這場(chǎng)世紀(jì)對(duì)壘一樣,對(duì) ReID 的現(xiàn)實(shí)落地起到了關(guān)鍵作用。

為什么這么說(shuō)呢?

首先,依圖升級(jí)了 ReID 算法的開(kāi)發(fā)流程。通過(guò)結(jié)合 AutoML 等前沿技術(shù),依圖創(chuàng)新性地實(shí)現(xiàn)了模型參數(shù)的自動(dòng)搜索與迭代,改變了算法依賴研究員手工設(shè)計(jì)與調(diào)優(yōu)的傳統(tǒng)開(kāi)發(fā)流程。不僅降低了模型的訓(xùn)練成本,也讓算法的泛化性更強(qiáng)。

其次,進(jìn)一步提升了 ReID 算法的識(shí)別性能。依圖自研算法在業(yè)界最具影響力的三大 ReID 數(shù)據(jù)集 Market1501、DukeMTMC-ReID、CUHK03 上,將兩大關(guān)鍵指標(biāo)“首位命中率”(Rank-1 Accuracy),以及“平均精度均值”(Mean Average Precision,mAP)6 項(xiàng)數(shù)據(jù)全部提升,達(dá)到了更高的 mAP,目前達(dá)到了工業(yè)界第一,從而進(jìn)一步穩(wěn)固了中國(guó) AI 在該任務(wù)上的領(lǐng)跑地位。

此外,ReID 算法的實(shí)用潛力持續(xù)進(jìn)階。在實(shí)戰(zhàn)應(yīng)用中,依圖還依托自研的 AI 芯片 QuestCore(求索), 在僅憑穿著、步態(tài)特征的條件下,將 ReID 做到 2017 年——2018 年人臉識(shí)別的精度。當(dāng)時(shí),機(jī)場(chǎng)、火車(chē)站等公共場(chǎng)合已經(jīng)開(kāi)始大規(guī)模使用人臉識(shí)別進(jìn)行安防保障了。這意味著,ReID 也有望被以低成本的解決方案,盡快進(jìn)入現(xiàn)實(shí)場(chǎng)景之中,讓人們無(wú)懼且享受計(jì)算視覺(jué)帶來(lái)的順暢體驗(yàn)。

目前看來(lái),依圖的創(chuàng)新將帶給 ReID 算法更好的成本比,以及更絲滑的應(yīng)用體驗(yàn),平衡了理想技術(shù)與現(xiàn)實(shí)困境之間的關(guān)系。

挑戰(zhàn)與機(jī)遇:ReID 的未來(lái)路徑

必須承認(rèn)的是,要讓城市換一種“眼睛”看行人,并不是一件容易的事。

一方面,各個(gè)城市攝像頭體系的建設(shè)標(biāo)準(zhǔn)、密度,以及進(jìn)度都各不相同,要讓它們共同點(diǎn)亮 ReID 的“技能樹(shù)”,實(shí)現(xiàn)全面替換,還有許多與技術(shù)成熟度無(wú)關(guān)的挑戰(zhàn);

還要面對(duì)復(fù)雜實(shí)景的挑戰(zhàn)。即使 ReID 算法的首位命中率足夠高,只意味著算法能夠在特定的幾個(gè)場(chǎng)景數(shù)據(jù)集下準(zhǔn)確找出最容易識(shí)別或者匹配的那張。但現(xiàn)實(shí)中的場(chǎng)景遠(yuǎn)比這有限的幾個(gè)數(shù)據(jù)復(fù)雜的多,數(shù)據(jù)模糊、建筑物遮擋、天氣的改變等等,都會(huì)影響模型的實(shí)際表現(xiàn)。所以現(xiàn)在認(rèn)為 ReID 模型能夠應(yīng)付真實(shí)任務(wù),還為時(shí)過(guò)早。

這也是為什么,盡管依圖科技刷榜 SOTA,算法性能達(dá)到了業(yè)界目前的最高標(biāo)準(zhǔn),但依圖的研發(fā)人員耿直地說(shuō),學(xué)術(shù)界的這三個(gè)數(shù)據(jù)集不能遠(yuǎn)遠(yuǎn)不代表工業(yè)界的最好水平,更精彩的表現(xiàn)還要放眼于實(shí)戰(zhàn)之中。

因?yàn)楸荣愔兴捎玫臄?shù)據(jù)集,早已限定好了規(guī)模和分布,屬于“應(yīng)試作業(yè)”;而在依圖實(shí)際落地的 ReID 項(xiàng)目中,還會(huì)遭遇更加復(fù)雜的數(shù)據(jù)、環(huán)境、參數(shù),是“奧數(shù)級(jí)別”的挑戰(zhàn)難度。

另外必須正視的一點(diǎn)是,要讓終端攝像頭完成高通量的實(shí)時(shí)計(jì)算,僅僅依靠研發(fā)端的突破還遠(yuǎn)遠(yuǎn)不夠,城市環(huán)境中是否具有足夠的邊緣計(jì)算節(jié)點(diǎn),是否有邊緣計(jì)算數(shù)據(jù)中心提供澎湃的算力支持,這些都需要整個(gè)產(chǎn)業(yè)鏈乃至城市決策者的共同合作。

由此不難發(fā)現(xiàn),在抵達(dá) ReID 產(chǎn)業(yè)化的旅程中,科技企業(yè)起到了怎樣的作用呢?

以依圖為例,一方面,通過(guò)將自身科研優(yōu)勢(shì)與新興算法相結(jié)合,加快 AI 算法的落地。

比如依圖就將自身在芯片研發(fā)上的硬件能力,與通用化算法相結(jié)合,實(shí)現(xiàn)了軟硬件協(xié)同開(kāi)發(fā),不僅取得了刷榜的好成績(jī),更關(guān)鍵的是激活了 ReID 與芯片端的融合可能,讓更多的算力需求被釋放,從而帶動(dòng)芯片產(chǎn)業(yè)乃至整個(gè)社會(huì)智能的進(jìn)程。

正如人臉識(shí)別逐漸滲透到社會(huì)的各個(gè)角落,ReID 算法也將成為智能生活不可或缺的一部分。借助 AI 芯片 QuestCore?(求索)和 ReID 模型應(yīng)用,依圖將催化出多大的商業(yè)富礦,構(gòu)筑基于 ReID 的新產(chǎn)業(yè)鏈。

1752 年,富蘭克林爬上屋頂放飛一只風(fēng)箏的時(shí)候,可能并沒(méi)有想到,他將改變整個(gè)世界的科技認(rèn)知與生產(chǎn)基礎(chǔ)設(shè)施。

而 ReID 對(duì)城市計(jì)算視覺(jué)應(yīng)用的迭代,也將為人類(lèi)帶來(lái)新的視角與光輝,并在不遠(yuǎn)的未來(lái)成為與我們生活休戚相關(guān)的一部分。

廟堂之高,與江湖之遠(yuǎn)的疊加,就是依圖乃至整個(gè) AI 產(chǎn)業(yè)所扎根的廣袤土壤。

依圖科技

依圖科技

依圖從事人工智能創(chuàng)新型研究,致力于將先進(jìn)的人工智能技術(shù)與行業(yè)應(yīng)用相結(jié)合,建設(shè)更加安全、健康、便利的世界。

依圖從事人工智能創(chuàng)新型研究,致力于將先進(jìn)的人工智能技術(shù)與行業(yè)應(yīng)用相結(jié)合,建設(shè)更加安全、健康、便利的世界。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜