加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
logo

有事離開?不用擔(dān)心

掃一掃繼續(xù)用手機(jī)看

微信掃碼
不再提醒
  • 點(diǎn)贊
  • 評(píng)論
  • 分享
  • 視訊介紹
    • 視頻云和倚天710的結(jié)合是一段美好的旅程
    • 社會(huì)視頻化是一種大趨勢
    • 視頻產(chǎn)業(yè)發(fā)展迅猛,倒逼技術(shù)快速迭代
    • 視頻云需要怎樣的CPU?
    • 寫在最后
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

社會(huì)視頻化“狂飆”,倒逼視頻云技術(shù)加速迭代

2023/04/03
6000
閱讀需 13 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

以技術(shù)驅(qū)動(dòng)創(chuàng)新,以芯力量擁抱數(shù)智未來。平頭哥《芯事》訪談對(duì)話科技創(chuàng)新者、引領(lǐng)者,探索創(chuàng)芯之路,共建硬核算力,賦能科技創(chuàng)新。

本期《芯事》人物:致凡 —— 阿里云視頻云技術(shù)團(tuán)隊(duì)負(fù)責(zé)人

視頻云和倚天710的結(jié)合是一段美好的旅程

2022年北京冬奧會(huì),阿里云承接了一項(xiàng)重要的任務(wù),那就是支撐冬奧全面上云。為此,阿里云視頻云推出了全新的云上創(chuàng)新解決方案——阿里云聚“Alibaba Cloud ME”,這也是全球第一次在奧運(yùn)會(huì)上實(shí)現(xiàn)異地全息會(huì)面,是一次打破時(shí)空之距的革命性創(chuàng)新。

在感嘆云上沉浸之旅的精妙之余,我們不禁要問,阿里云視頻云上路即狂奔的硬實(shí)力是什么?除了使命必達(dá)的奮斗精神和強(qiáng)大的軟件、算法支撐能力以外,阿里云視頻云總經(jīng)理致凡還提到了倚天710。

當(dāng)我們將目光投射到倚天710上,會(huì)發(fā)現(xiàn)它誕生于2021年,是一款由平頭哥自研的云芯片,經(jīng)過一年多時(shí)間的硬件部署和業(yè)務(wù)驗(yàn)證,倚天710實(shí)例已成功應(yīng)用到阿里巴巴集團(tuán)的核心業(yè)務(wù)中,并服務(wù)多家知名互聯(lián)網(wǎng)及科技公司。正是基于前期優(yōu)良的表現(xiàn),阿里云在2022年的云棲大會(huì)上宣布:未來2年,阿里云20%的新增算力將使用自研CPU

當(dāng)然,沒有一款芯片生來就如此強(qiáng)大,致凡告訴與非網(wǎng):“視頻和倚天710的結(jié)合是一段美好的旅程,但中間還是經(jīng)歷了非常多的事情?!?/p>

致凡解釋:“由于視頻業(yè)務(wù)的增長速度是非常快的,而要研制一顆視頻芯片的周期卻非常長,所以在一開始的時(shí)候大家是抱著試一試的心態(tài),配合來做這件事。當(dāng)?shù)谝话嫘酒?a class="article-link" target="_blank" href="/tag/%E6%B5%81%E7%89%87/">流片回來后,沒有做過任何優(yōu)化跑出來的性能和速度都跟不上傳統(tǒng)架構(gòu)CPU,但由于Arm架構(gòu)帶來的原生優(yōu)勢,再加上阿里云和平頭哥的同學(xué)雙方坐在一起,在了解芯片內(nèi)部構(gòu)成的基礎(chǔ)上去做了很多算法調(diào)優(yōu)后,能夠讓代碼在芯片上跑得更快。同時(shí),倚天710還針對(duì)特定算法場景進(jìn)行了指令集加速與優(yōu)化,比如像SVE等矢量計(jì)算技術(shù),其中BF16/INT8 mmla指令可實(shí)現(xiàn)高效的矩陣乘法運(yùn)算,還支持Hash、CRC32等加速指令,可以讓單條指令并行處理更多數(shù)據(jù),大幅提升視頻編解碼、AI編解碼增強(qiáng)等場景性能,這是一個(gè)兩邊一起迭代的過程?!?/p>

所以,從最早的性能不如傳統(tǒng)架構(gòu)CPU,到現(xiàn)在已經(jīng)遠(yuǎn)遠(yuǎn)的超過傳統(tǒng)架構(gòu)CPU,倚天710的“蛻變”是一步一個(gè)腳印走過來的。致凡認(rèn)為:“這是一個(gè)非常好的案例,阿里視頻云的業(yè)務(wù)跟平頭哥的芯片設(shè)計(jì)能夠完美地結(jié)合在一起,利用各自的優(yōu)勢讓芯片設(shè)計(jì)出來,在視頻行業(yè)中發(fā)揮更大的作用?!?/p>

談起平頭哥和阿里云視頻云業(yè)務(wù)的這次合作,就不能不提到一個(gè)大的產(chǎn)業(yè)背景,即視頻云的爆發(fā)式增長。至于什么是視頻云?“視頻云就像是音視頻行業(yè)的水和電,是底層的基礎(chǔ)設(shè)施,可以大大簡化視頻從采集、處理、編碼、傳輸?shù)椒职l(fā)的鏈路?!敝路残蜗蟮谋扔髟偾‘?dāng)不過。

社會(huì)視頻化是一種大趨勢

從2017年開始,短視頻的熱度持續(xù)上升,加上近三年疫情下直播、視頻會(huì)議、線上教學(xué)等領(lǐng)域的崛起,社會(huì)視頻化成為一種大趨勢。

根據(jù)CNNIC發(fā)布的第50次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》數(shù)據(jù)顯示,截至2022年6月,我國移動(dòng)互聯(lián)網(wǎng)接入流量達(dá)1241億GB,同比增長20.2%;另根據(jù)思科發(fā)布的數(shù)據(jù)顯示,視頻內(nèi)容約占互聯(lián)網(wǎng)總流量的90%,占移動(dòng)網(wǎng)絡(luò)總流量的64%。

結(jié)合這兩組數(shù)據(jù),我們可以得出視頻正在成為互聯(lián)網(wǎng)流量的主角。而爆炸性的數(shù)據(jù)量又將會(huì)對(duì)算力和存儲(chǔ)提出更大的挑戰(zhàn)。于是視頻云的價(jià)值被凸顯出來,并呈現(xiàn)出了一種不可逆的發(fā)展態(tài)勢。在這樣的大背景下,全球以互聯(lián)網(wǎng)公司為主的科技企業(yè)紛紛轉(zhuǎn)型,開啟視頻云技術(shù)的探索之旅,并在安防監(jiān)控、遠(yuǎn)程醫(yī)療、零售電商以及金融機(jī)構(gòu)等典型場景中得到落地。

當(dāng)前,視頻云產(chǎn)業(yè)已經(jīng)形成了相對(duì)穩(wěn)定的頭部戰(zhàn)隊(duì),包括國外的微軟、AWS,以及國內(nèi)的阿里云、騰訊云、華為云、百度云、金山云、字節(jié)、快手、深網(wǎng)等。

關(guān)于國內(nèi)視頻云的市場體量方面,根據(jù)IDC發(fā)布的數(shù)據(jù)顯示,2022上半年中國視頻云市場規(guī)模達(dá)到50.5億美元,同比增長15.7%,預(yù)計(jì)到2026年,市場規(guī)模接近300億美元。值得一提的是,該報(bào)告同時(shí)還指出,阿里視頻云連續(xù)4年蟬聯(lián)中國視頻市場份額第一,并且滲透率還在不斷增加。

視頻產(chǎn)業(yè)發(fā)展迅猛,倒逼技術(shù)快速迭代

對(duì)于視頻云產(chǎn)業(yè)來講,以在線視頻為例,從最早國外的Livestream、國內(nèi)的斗魚直播到現(xiàn)在已經(jīng)經(jīng)歷了25年的歷史,其實(shí)從技術(shù)的角度來看,整個(gè)行業(yè)發(fā)展的速度沒有想象中的快。比如,視頻編碼從H.264到H.265,再到H.266,平均10年升級(jí)一代。為什么速度不是很快?因?yàn)樗鉀Q的問題比較多:算力、網(wǎng)絡(luò)傳輸、標(biāo)準(zhǔn)等等。

但是,我們看到今天的視頻產(chǎn)業(yè)發(fā)展非常迅猛,這也倒逼技術(shù)要去完成快速迭代。這幾年已經(jīng)初顯效果,比如現(xiàn)在編碼器的升級(jí)迭代速度是5年,以前是10年,預(yù)計(jì)后面可能是3年。

為什么這里要強(qiáng)調(diào)編碼?事實(shí)上,視頻云是一個(gè)算力密集型行業(yè),視頻信息量很大,假如采用和文本、圖片一樣的壓縮模式,那么還原度是不夠的,所以視頻必須進(jìn)行編碼處理。編碼要是做不好,不僅會(huì)損失視頻質(zhì)量,還會(huì)帶來傳輸難度高的問題。

從MPEG2開始,每一代視頻編碼的升級(jí),其壓縮率大約可以提升50%,遠(yuǎn)低于視頻分辨率每更新一代提升4倍的速度,即使這樣,每一代升級(jí)對(duì)CPU算力的需求,以及算法復(fù)雜度都會(huì)提高至少10倍以上,這對(duì)芯片的架構(gòu)、芯片底層的指令集優(yōu)化、芯片的存儲(chǔ)器和CASH結(jié)構(gòu)都會(huì)帶來新的挑戰(zhàn),很多核心的算法要用新的指令集重新寫一遍,這意味著視頻編碼和芯片成長是需要同步的。

視頻云需要怎樣的CPU?

通過前面的介紹,我們了解到視頻編碼對(duì)算力的要求很高,因?yàn)槲覀兂3T噲D用算力換存儲(chǔ),用算力換傳輸帶寬,所以我們希望算力越高越好。

那么如何提升CPU的算力?首先要選擇好的內(nèi)核架構(gòu)。在視頻領(lǐng)域,傳統(tǒng)架構(gòu)已經(jīng)有三十幾年的歷史了,目前市占率依然能達(dá)到90%以上的份額,但裹挾著沉重的向后兼容包袱。而Arm作為一種精簡指令集,不僅沒有歷史包袱,還可以根據(jù)需求增加很多寄存器,同時(shí)從內(nèi)存CASH結(jié)構(gòu)的設(shè)計(jì)和指令集的設(shè)計(jì)上面,能夠更貼合需要大算力的視頻處理需求。

此外,不管是Hyper-Threading還是其他,采用傳統(tǒng)架構(gòu)的CPU走的都是提高主頻的路子,在視頻處理時(shí)就會(huì)遇到一些問題,比如視頻壓縮的時(shí)候會(huì)分成I幀、P幀、B幀,每一幀的算力并不是平均分配的,就會(huì)帶來對(duì)算力需求不穩(wěn)定的問題。所以為了讓芯片不跑超頻,就可能會(huì)做一些降頻處理,這時(shí)候它的算力就可能達(dá)不到相應(yīng)的編碼需求。在實(shí)際業(yè)務(wù)中,由于視頻業(yè)務(wù)不是單機(jī)運(yùn)行的,會(huì)有很多的服務(wù)器集群配合來處理,為了防止CPU跑超等復(fù)雜情況的出現(xiàn),就不得不把服務(wù)器集群的水位降低,這是傳統(tǒng)架構(gòu)CPU比較大的問題。

然而Arm整體的設(shè)計(jì)是比較穩(wěn)定的,不管任務(wù)有多復(fù)雜,都能實(shí)現(xiàn)穩(wěn)定輸出,做到良好的資源調(diào)配和水位調(diào)配,不用預(yù)留很多冗余來防止芯片跑超,這對(duì)于to B業(yè)務(wù)來說非常重要。

除了主頻高以外,傳統(tǒng)架構(gòu)CPU的核不多,通常是兩個(gè)vCPU/HT共享一個(gè)物理核、1份ALU,但Arm可以實(shí)現(xiàn)128/256/512或更多的核,類似GPU的設(shè)計(jì),如此一來,對(duì)于不同應(yīng)用場景而言,就可以用少核應(yīng)對(duì)低算力需求的場景,多核應(yīng)對(duì)高算力需求的場景,實(shí)現(xiàn)更優(yōu)的業(yè)務(wù)調(diào)配,降低投入成本。以倚天710為例,它采用了ARMv9架構(gòu),內(nèi)含128核CPU,主頻最高可達(dá)3.2GHz,可適配云的不同應(yīng)用場景。

與此同時(shí),隨著數(shù)據(jù)上云越來越多,對(duì)于數(shù)據(jù)中心而言,功耗性能也是非常重要的,對(duì)運(yùn)營者來說,低功耗就意味著低成本,在這方面,Arm相比于傳統(tǒng)架構(gòu)也有著獨(dú)特優(yōu)勢。這也是除了軟件層面的優(yōu)化以外,為什么倚天710能同時(shí)兼顧性能和功耗的重要原因之一。

以上要素疊加,就讓視頻云的頭部企業(yè)阿里云與倚天710 的結(jié)合看起來水到渠成。當(dāng)前,倚天710已大規(guī)模部署并提供云上服務(wù),根據(jù)實(shí)踐反饋,倚天710讓阿里云平臺(tái)的算力性價(jià)比提升了超30%,單位算力功耗降低了60%,這是一個(gè)相當(dāng)大的進(jìn)步。

寫在最后

縱觀視頻云產(chǎn)業(yè),人們對(duì)體驗(yàn)的極致追求,將成為視頻云持續(xù)深耕的動(dòng)力。在云應(yīng)用場景下,CPU的發(fā)展之路將循著算力、I/O、網(wǎng)絡(luò)協(xié)議適配、推理能力、從無到有的創(chuàng)造能力不斷演進(jìn)下去。

未來,Arm會(huì)成為視頻云中一種重要的架構(gòu),整體份額一定會(huì)增加,但不會(huì)是唯一的架構(gòu),傳統(tǒng)架構(gòu)、異構(gòu)的ASIC和FPGA都會(huì)有一席之地。而對(duì)于Arm架構(gòu)而言,未來的改進(jìn)方向是降低功耗、提高算力、做好專用性和通用性的選擇平衡。

同時(shí),我們要意識(shí)到,未來視頻對(duì)算力的挑戰(zhàn)是非常高的,簡單地靠 CPU的升級(jí)已經(jīng)滿足不了需求,需要一些特殊的處理,包括越來越多的AI算法、專用算法,比如模型搜索的算法等,再把通用的模塊部分地固化在芯片里面,極大地提升視頻處理的效率。

所以在視頻云市場,人們總是在做權(quán)衡,云芯片廠商要處理好芯片能效和通用性的關(guān)系,云服務(wù)商要在算力有限的情況下使用很多快速算法。而正如致凡強(qiáng)調(diào)的:“我們的愿景都是一樣的,就是讓視頻普惠各行各業(yè),從而反哺視頻行業(yè),實(shí)現(xiàn)更茁壯的發(fā)展。

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
STM32F767ZIT6 1 STMicroelectronics High-performance and DSP with FPU, Arm Cortex-M7 MCU with 2 Mbytes of Flash memory, 216 MHz CPU, Art Accelerator, L1 cache, SDRAM, TFT, JPEG codec, DFSDM

ECAD模型

下載ECAD模型
$25.18 查看
ATXMEGA128D4-MH 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, PQCC44, 7 X 7 MM, 1 MM HEIGHT, 0.50 MM PITCH, GREEN, PLASTIC, MO-220VKKD-3, VQFN-44
$5.3 查看
FS32K146HAT0MLLT 1 NXP Semiconductors RISC Microcontroller

ECAD模型

下載ECAD模型
$11.53 查看
阿里巴巴

阿里巴巴

阿里巴巴集團(tuán)經(jīng)營多項(xiàng)業(yè)務(wù),另外也從關(guān)聯(lián)公司的業(yè)務(wù)和服務(wù)中取得經(jīng)營商業(yè)生態(tài)系統(tǒng)上的支援。業(yè)務(wù)和關(guān)聯(lián)公司的業(yè)務(wù)包括:淘寶網(wǎng)、天貓、聚劃算、全球速賣通、阿里巴巴國際交易市場、1688、阿里媽媽、阿里云、螞蟻金服、菜鳥網(wǎng)絡(luò)等。

阿里巴巴集團(tuán)經(jīng)營多項(xiàng)業(yè)務(wù),另外也從關(guān)聯(lián)公司的業(yè)務(wù)和服務(wù)中取得經(jīng)營商業(yè)生態(tài)系統(tǒng)上的支援。業(yè)務(wù)和關(guān)聯(lián)公司的業(yè)務(wù)包括:淘寶網(wǎng)、天貓、聚劃算、全球速賣通、阿里巴巴國際交易市場、1688、阿里媽媽、阿里云、螞蟻金服、菜鳥網(wǎng)絡(luò)等。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜