云邊端三位一體 Arm撐起AI的一片天!下代CPU/GPU強(qiáng)勢(shì)來(lái)襲
- 來(lái)源:快科技
- 作者:上方文Q
- 編輯:一只小編輯OVO
AI人工智能經(jīng)過(guò)長(zhǎng)達(dá)70年的進(jìn)化,在最近幾年,趁著生成式AI的東風(fēng),迎來(lái)了一波史無(wú)前例的爆發(fā)。
僅僅在過(guò)去的18個(gè)月內(nèi),就有150多個(gè)基礎(chǔ)AI模型面世,涵蓋語(yǔ)音、圖像、文字與視頻生成等等。
無(wú)論是云側(cè)、邊緣側(cè)還是端側(cè),AI已經(jīng)無(wú)處不在,滲透到了我們生活、工作的每一個(gè)角落,顛覆了一個(gè)又一個(gè)行業(yè)領(lǐng)域。
在這場(chǎng)空前的變革中,Arm計(jì)算平臺(tái)可以說(shuō)扮演著非常核心的角色。
畢竟,無(wú)論是消費(fèi)電子、智能手機(jī)、智能汽車(chē)、數(shù)據(jù)中心乃至是PC,Arm的身影無(wú)處不在,基于Arm架構(gòu)的芯片累計(jì)出貨量已經(jīng)超過(guò)3100億顆,遠(yuǎn)超任何其他架構(gòu)平臺(tái)。
2025年臺(tái)北電腦展前夕,Arm高級(jí)副總裁兼終端事業(yè)部總經(jīng)理Chris Bergey發(fā)表了主題演講,并與聯(lián)發(fā)科技、NVIDIA兩大關(guān)鍵合作伙伴進(jìn)行了深入探討。
Bergey指出,現(xiàn)階段,AI的演化速度是空前的,僅僅在過(guò)去一年的變化就令人驚嘆。歸納起來(lái)可以發(fā)現(xiàn)三個(gè)顯著的趨勢(shì):
一是AI模型變得更高效、更聰明、更專(zhuān)精。
不再一味追求更龐大的參數(shù)量,也不再一味吃掉更強(qiáng)大的硬件算力,即便是小尺寸模型也能勝任不同工作。
二是云側(cè)AI正迅速向邊緣側(cè)、端側(cè)延伸。
尤其是在端側(cè)高效運(yùn)行AI、利用AI,已經(jīng)毋庸置疑,而且云邊端AI的融合日漸深入、難分彼此。
三是AI智能體大規(guī)模涌現(xiàn),實(shí)體AI也衍生出了新的機(jī)遇。
AI智能體已經(jīng)出現(xiàn)了非常成功的商業(yè)落地項(xiàng)目,尤其是AI編程、AI客服最為典型,甚至有的創(chuàng)業(yè)公司在不到100人的情況下,利用AI就實(shí)現(xiàn)了上億美元的營(yíng)收;
實(shí)體AI方面,具身機(jī)器人、機(jī)器狗、配送機(jī)器人等快速崛起,雖然距離人類(lèi)智能水平還差很遠(yuǎn),但已經(jīng)在某種程度上可以自主運(yùn)行。
當(dāng)然,AI以各種形式在各行各業(yè)的應(yīng)用,都離不開(kāi)強(qiáng)大的底層基礎(chǔ)架構(gòu),而對(duì)于構(gòu)建AI系統(tǒng)的基礎(chǔ)要素,Arm認(rèn)為有三個(gè)關(guān)鍵因素:
一是云邊端無(wú)處不在的獨(dú)特平臺(tái)。
AI的運(yùn)行往往不限于某一個(gè)范圍,比如在端側(cè)、邊緣側(cè)越來(lái)越流行,但很多工作負(fù)載又離不開(kāi)云側(cè),或者兼而有之,因此一個(gè)高度可移植的平臺(tái)對(duì)于推動(dòng)AI發(fā)展的靈活性是至關(guān)重要的。
二是更高的能效比。
AI對(duì)于電力能源的消耗有目共睹,尤其是在數(shù)據(jù)中心的大規(guī)模AI訓(xùn)練,能耗已經(jīng)從兆瓦級(jí)(MW)躍升至吉瓦級(jí)(GW),而其中50%以上來(lái)自機(jī)架和半導(dǎo)體設(shè)備。如何提高能效、降低能源消耗,已經(jīng)是生死攸關(guān)的話題。
三是軟件開(kāi)發(fā)生態(tài)。
沒(méi)有強(qiáng)大、優(yōu)秀的軟件生態(tài),再好的AI硬件性能也無(wú)法釋放出來(lái),無(wú)法形成生產(chǎn)力而真正服務(wù)于人。
說(shuō)到軟件生態(tài),Arm無(wú)疑擁有獨(dú)特的優(yōu)勢(shì),坐擁全球最大的開(kāi)發(fā)生態(tài),匯聚了超過(guò)2200萬(wàn)名軟件開(kāi)發(fā)者,同時(shí)基于Arm架構(gòu)芯片出貨量迄今已超過(guò)3100億顆。
如此級(jí)別的軟硬件規(guī)模,就帶來(lái)了一個(gè)良性循環(huán):大量基于Arm架構(gòu)的硬件設(shè)備推動(dòng)了豐富的Arm軟件生態(tài),而反過(guò)來(lái),強(qiáng)大的軟件生態(tài)又進(jìn)一步催生了更多的硬件發(fā)展機(jī)會(huì)。
去年,Arm進(jìn)一步推出了Kleidi軟件庫(kù),讓開(kāi)發(fā)者能在各種AI模型與工作負(fù)載上,無(wú)論是音頻、圖像、文字、視頻,都能獲得最佳的性能表現(xiàn)。
尤其是,它可以讓AI工作負(fù)載利用最新的Armv9架構(gòu)加速運(yùn)行,同時(shí)具備面向未來(lái)硬件架構(gòu)的可持續(xù)性。
迄今為止,Arm Kleidi已經(jīng)在搭載Arm架構(gòu)的設(shè)備上累計(jì)安裝超過(guò)80億次,還在持續(xù)增長(zhǎng)中。
值得一提的是,Kleidi也與大量全球主流的AI框架進(jìn)行了集成,包括ExecuTorch、PyTorch、Angel、llama.cpp、MediaPipe、MNN、ONNX Runtime等等,以及中國(guó)騰訊混元的Angel機(jī)器學(xué)習(xí)框架。
說(shuō)回到硬件,此前Arm在數(shù)據(jù)中心領(lǐng)域的布局或許還不為大眾所熟知。
事實(shí)上,Arm已經(jīng)在數(shù)據(jù)中心領(lǐng)域深耕了10多年,取得了相當(dāng)?shù)某晒?
比如全球最大的云服務(wù)提供商亞馬遜云科技(AWS),早就開(kāi)發(fā)了基于Arm架構(gòu)的Graviton處理器,并演化多代。AWS此前表示,在他們?nèi)ツ瓴渴鸬腃PU中,超過(guò)50%是基于Arm架構(gòu)的Graviton。
在這其中,既有相當(dāng)一部分AWS自家的工作負(fù)載,也有大量的外部客戶。AWS曾表示,其超過(guò)90%的重要客戶(不包括 Amazon)都在使用Arm的先進(jìn)架構(gòu),并受益于其更高的能效。
這些客戶都是業(yè)界耳熟能詳?shù)钠髽I(yè),比如SAP、Epic Gams、Discovery等等。
除了AWS Graviton,還有大量的數(shù)據(jù)中心處理器采用了Arm架構(gòu),比如微軟Cobalt、谷歌Axion、Ampere AmpereOne(甲骨文持股)、NVIDIA Grace、阿里倚天,等等。
在這些Arm計(jì)算平臺(tái)的加持之下,不但大量的云服務(wù)商將自家的工作轉(zhuǎn)移到Arm平臺(tái),還有越來(lái)越多的第三方廠商將其服務(wù)轉(zhuǎn)向了Arm平臺(tái),帶來(lái)了超過(guò)40%的能效提升。
預(yù)計(jì)在2025年,出貨到頭部超大規(guī)模云服務(wù)提供商的算力中,有近50%將基于Arm架構(gòu)。
而在這里有一款產(chǎn)品尤為值得一提,那就是NVIDIA DGX Spark,一臺(tái)桌面級(jí)的AI超級(jí)計(jì)算機(jī),體積只有一臺(tái)迷你機(jī)大小,是全球最小的同類(lèi)產(chǎn)品。
它搭載了一顆超級(jí)芯片NVIDIA GB10,基于NVIDIA Blackwell GPU 和Grace CPU。
其中,CPU部分包含來(lái)自Arm的10個(gè)Cortex-X925核心、10個(gè)Cortex-A725核心,GPU部分則具備高達(dá)1PFlops的AI算力,也就是每秒1千萬(wàn)億次浮點(diǎn)運(yùn)算。
此外,它還有超高帶寬的NVLink-C2C片間互連,通過(guò)針對(duì)AI所需的帶寬、I/O密度進(jìn)行深度優(yōu)化,實(shí)現(xiàn)了更高效的計(jì)算性能,還為之搭配了128GB LPDDR5高帶寬高能效內(nèi)存、4TB SSD高速存儲(chǔ)。
有了這樣的超高算力,DGX Spark可以在本地運(yùn)行多達(dá)2000億參數(shù)的AI模型。
在今年的臺(tái)北電腦展上,NVIDIA宣布聯(lián)合宏碁、華碩、戴爾、技嘉、惠普、聯(lián)想、微星等品牌,共同打造DGX Spark、DGX Station系統(tǒng)。
NVIDIA還分享了Grace CPU的最新發(fā)展勢(shì)頭,在??松梨?ExxonMobil)、Meta等實(shí)現(xiàn)了一系列的實(shí)際部署,大大提升了AI工作負(fù)載的性能和效率。
在消費(fèi)級(jí)市場(chǎng)上,2025年將有超過(guò)40%的PC、平板都運(yùn)行在Arm架構(gòu)之上。
比如NVIDIA、聯(lián)發(fā)科技聯(lián)合打造的N1系列處理器正蓄勢(shì)待發(fā),并得到了華碩、戴爾、聯(lián)想、惠普、微星等眾多品牌的支持。
聯(lián)發(fā)科技近期還推出了Kompanio Ultra SoC處理器,更進(jìn)一步提升了Chromebook設(shè)備的性能水平,使得新一代Chromebook Plus筆記本具備先進(jìn)的AI與多媒體處理能力。
生態(tài)方面,Arm PC也取得了飛速發(fā)展,目前全球大多數(shù)主流應(yīng)用都已經(jīng)推出了原生適配Arm的版本。
目前,全球99%的智能手機(jī)都采用Arm架構(gòu),因此Arm計(jì)算平臺(tái)的每一步發(fā)展,都影響深遠(yuǎn)。
比如去年發(fā)布的超大核Arm Cortex-X925,具備業(yè)內(nèi)最高水平的IPC性能與進(jìn)步幅度,相比上代提升了多達(dá)15%。
IPC對(duì)于處理器而言是至關(guān)重要的一個(gè)參數(shù),因?yàn)镮PC與頻率的乘積,決定了整個(gè)平臺(tái)的性能。
相較于單純依賴提高頻率來(lái)提升性能容易造成功耗與能效的失衡,提升IPC可以更高效地實(shí)現(xiàn)性能、能效的雙重增強(qiáng),而對(duì)于移動(dòng)設(shè)備而言,控制功耗無(wú)疑是一個(gè)關(guān)鍵考量因素。
聯(lián)發(fā)科技天璣9400系列就是Cortex-X925落地的典型代表,配合全大核設(shè)計(jì),帶來(lái)了無(wú)可比擬的性能與能效。
小米最新發(fā)布的玄戒O1,作為第一款國(guó)產(chǎn)3nm手機(jī)芯片,同樣采用了Cortex-X925。
最后,Arm官方預(yù)告了將在今年稍晚推出的Arm Lumex CSS 解決方案,該方案將集成兩款面向移動(dòng)端市場(chǎng)的新一代CPU和GPU產(chǎn)品。
其中CPU代號(hào)“Travis”,定位旗艦CPU,將再次帶來(lái)兩位數(shù)的IPC性能提升,同時(shí)通過(guò)最新的SME(可伸縮矩陣擴(kuò)展),進(jìn)一步加速AI處理能力。
GPU代號(hào)“Drage”,將進(jìn)一步提升圖形渲染能力,帶來(lái)更沉浸的長(zhǎng)時(shí)間游戲體驗(yàn),還有更豐富的多媒體處理能力。
可以說(shuō),當(dāng)下這個(gè)AI蓬勃發(fā)展的時(shí)代是一場(chǎng)千載難逢的機(jī)會(huì),必將重新定義科技如何影響世界。
要想真正讓這場(chǎng)革命落地到人們生活、工作的方方面面,真正實(shí)現(xiàn)AI的價(jià)值,離不開(kāi)持續(xù)的科技創(chuàng)新,以及世界級(jí)生態(tài)系統(tǒng)的深度合作。
從云到邊緣再到端,從手機(jī)平板、PC到汽車(chē)、物聯(lián)網(wǎng)、數(shù)據(jù)中心,Arm計(jì)算平臺(tái)正處于這場(chǎng)革命轉(zhuǎn)型的核心。
作為未來(lái)的基石,Arm不但推動(dòng)著AI無(wú)處不在,更將一步步塑造、變革AI的未來(lái)。

- 阿里云首款A(yù)I原生開(kāi)發(fā)環(huán)境工具AI IDE今日上線
- 國(guó)產(chǎn)機(jī)器人操作系統(tǒng)鴻道發(fā)布:支持華為、龍芯、英偉達(dá)等
- 我國(guó)新一代人造太陽(yáng)創(chuàng)運(yùn)行新紀(jì)錄 達(dá)10的20次方量級(jí)
- 持續(xù)近10年 中國(guó)最長(zhǎng)的航天任務(wù)開(kāi)始了!天問(wèn)二號(hào)詳解
- 印度科技公司新型傳感器問(wèn)世 能見(jiàn)度極差環(huán)境探測(cè)200米
- 80PLUS認(rèn)證新增“Ruby”等級(jí):電源轉(zhuǎn)換效率要達(dá)到96.5%

-
傳奇歲月
-
原始傳奇
-
斗羅大陸(我唐三認(rèn)可0.1折)
-
太閣立志2
-
奇門(mén)(0.1折仙俠不用閃)
-
深淵契約
-
貓狩紀(jì)0.1折
-
靈劍仙師(斗破蒼穹)
玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門(mén)評(píng)論
全部評(píng)論