久久精品无码视频|精产国品色情一二三区在线观看|国产性爱自拍视频|亚洲av韩国av|日韩美女一级AAA大片|少妇无码激情诱惑|日韩AV在线播放有码|一级黄片一级黄片|av上一页亲亲久草av|aaa在线观看国产做爱

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
芯片 正文
發(fā)私信給趙之齊
發(fā)送

0

八位AI算力CEO:2026,算力舊規(guī)則正在作廢

本文作者: 趙之齊   2026-02-28 18:26
導(dǎo)語:AI越厲害,面臨的瓶頸越“降維”。

作者 | 趙之齊 劉伊倫

編輯 | 包永剛


自DeepSeek在去年春節(jié)出圈以來,春節(jié)已然成了AI行業(yè)的“狂歡季”。

各大晚會(huì)連番登臺(tái)的機(jī)器人、科技從業(yè)者們?cè)诖a堆里守歲,本身就是一種隱喻:AI正逐漸長成社會(huì)運(yùn)轉(zhuǎn)中不能停下的“基礎(chǔ)設(shè)施”。

站在馬年的新起點(diǎn),雷峰網(wǎng)對(duì)話了算力產(chǎn)業(yè)鏈上八家標(biāo)桿企業(yè)的CEO,探討AI給算力產(chǎn)業(yè)帶來的種種邏輯重塑。

有趣的是,如今,行業(yè)看待AI的方式正在經(jīng)歷一場集體“降維”:當(dāng)技術(shù)紅利階段性觸達(dá)天花板,真正決定行業(yè)生死的命題變得更加具體且真實(shí)——

電力缺口、存儲(chǔ)產(chǎn)能瓶頸、算力利用率與成本、硬件連接與算法協(xié)同,乃至AI給組織架構(gòu)帶來的深層顛覆等等……(算力鏈面臨挑戰(zhàn)的更多細(xì)節(jié),歡迎添加作者微信 Ericazhao23 交流)

作為這場變革的親歷者,CEO們親述的八個(gè)片段互為印證,共同拼湊出算力產(chǎn)業(yè)當(dāng)下最核心、真實(shí)的命題。

一、需求狂飆,基建托底

當(dāng)算力需求越來越大,IDC基建作為根基,會(huì)面臨什么新的挑戰(zhàn)?

秦淮數(shù)據(jù) CEO 吳華鵬:GW級(jí)智算不是蓋「完美大樓」,而是搭「可拆裝積木」

八位AI算力CEO:2026,算力舊規(guī)則正在作廢

我是一個(gè)有著強(qiáng)烈技術(shù)信仰的人。

親歷互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)風(fēng)起云涌的30年,在當(dāng)前,我強(qiáng)烈感受到數(shù)據(jù)中心行業(yè)正站在由AI重構(gòu)產(chǎn)業(yè)格局的新起點(diǎn)上。

過去一年,GW(吉瓦,10億瓦特)級(jí)智算園區(qū)這一“新物種”,已成為行業(yè)發(fā)展的重要方向,但超大規(guī)模算力如何與電力體系適配、協(xié)同,依然挑戰(zhàn)重重。

這一瓶頸的核心在于:算力需求和建設(shè)規(guī)模在爆發(fā)式增長,但新能源體系的支撐能力,尚未完全匹配發(fā)展需求。

具體來看,矛盾主要集中在三個(gè)層面:

一方面,GW級(jí)園區(qū)一年的耗電量堪比一座中等城市,傳統(tǒng)分步拓建的電力基建模式,面對(duì)“整體規(guī)劃預(yù)留、分階段規(guī)?;桓丁钡慕ㄔO(shè)需求,已經(jīng)很難滿足。

其二,GW級(jí)園區(qū)要求高比例綠電,但高比例新能源接入后,在負(fù)荷波動(dòng)、熱源管理、智能控制等方面,都還沒有足夠成熟的方案應(yīng)對(duì)。

而在如此龐大的用電基數(shù)下,效率每提升一個(gè)百分點(diǎn),都意味著巨大的商業(yè)價(jià)值——這也讓效率優(yōu)化擁有了前所未有的緊迫性。

而外部的技術(shù)供應(yīng)和市場競爭,仍在給行業(yè)帶來不確定性。

GPU 產(chǎn)能、進(jìn)口相關(guān)因素,會(huì)直接影響算力部署節(jié)奏。同時(shí),頭部企業(yè)扎堆涌入烏蘭察布、中衛(wèi)這類核心節(jié)點(diǎn),讓優(yōu)質(zhì)電力、土地資源的爭奪越來越激烈,企業(yè)拿資源的難度明顯加大。

整體看下來,行業(yè)競爭的核心,已經(jīng)從“拼規(guī)?!?,轉(zhuǎn)向“規(guī)?!迸c“質(zhì)量”并重。相對(duì)完善的能源解決方案,是當(dāng)下數(shù)據(jù)中心企業(yè)突破瓶頸的關(guān)鍵一環(huán)。

在這方面,我們通過與東陽光集團(tuán)的戰(zhàn)略整合,已經(jīng)取得實(shí)質(zhì)性進(jìn)展。去年9月,東陽光牽頭的銀團(tuán)以280億元現(xiàn)金收購秦淮數(shù)據(jù)中國區(qū)全部業(yè)務(wù),今年1月完成股權(quán)交割。

過去幾個(gè)月,我們已在韶關(guān)、烏蘭察布、宜昌簽約重點(diǎn)項(xiàng)目,“東數(shù)西算”十大集群,秦淮已落子過半。目前,我們投運(yùn)及在建IT容量近1GW,儲(chǔ)備與規(guī)劃容量達(dá)到4GW。接下來還將在烏蘭察布,和東陽光聯(lián)手打造國內(nèi)首個(gè)GW級(jí)超大規(guī)模綠電直供垂直一體化產(chǎn)業(yè)示范區(qū)。

此外,我們還聯(lián)合東陽光以及產(chǎn)業(yè)鏈伙伴,推出全球首個(gè)基于SST(固態(tài)變壓器)的算力中心智能直流供電商業(yè)化方案,將于今年4月在張家口懷來正式投運(yùn)。

這個(gè)方案能讓電力轉(zhuǎn)換效率達(dá)到98.5%,是業(yè)內(nèi)最高水平;單功率柜輸出功率達(dá)1MW,占地面積僅1㎡,相較傳統(tǒng)方案減少50%以上。與此同時(shí),面對(duì)AI GPU負(fù)載的劇烈波動(dòng),這個(gè)系統(tǒng)還能主動(dòng)調(diào)節(jié)供電策略,實(shí)時(shí)智能應(yīng)對(duì)。

這些業(yè)務(wù)進(jìn)展,為我們建設(shè)GW級(jí)園區(qū)奠定了堅(jiān)實(shí)基礎(chǔ)。但我也深知,打造GW級(jí)AI算力中心,不是蓋一棟一步到位、極致完美的樓,而是搭一套“可拆裝的積木”——

面對(duì)算力、電力、技術(shù)的多重不確定性,解決方法是采用模塊化、分期建設(shè)和能力解耦,達(dá)成彈性交付。

AI革命將掀起一場持續(xù)20年的技術(shù)浪潮,在這之中,焦慮和壓力都在所難免,堅(jiān)守初心就更為關(guān)鍵。結(jié)合我的體悟,我也想與管理者們共勉:

堅(jiān)持做行業(yè)中的“良幣”,錨定底層邏輯、持續(xù)創(chuàng)新、走長期主義,才能在這場AI革命里立得住、走得遠(yuǎn)。

作為基建中同樣重要的參與者,云廠商在AI時(shí)代的護(hù)城河會(huì)是什么?

UCloud CEO 季昕華:AI迭代進(jìn)入「月更」時(shí)代,云廠商面臨跨學(xué)科的認(rèn)知重塑

八位AI算力CEO:2026,算力舊規(guī)則正在作廢

當(dāng)下,AI技術(shù)迭代速度極快,幾乎每隔一個(gè)月就會(huì)出現(xiàn)一次行業(yè)級(jí)突破,行業(yè)模型與應(yīng)用的市場熱度呈指數(shù)級(jí)增長,這些都要求我們?cè)茝S商具備高頻、高強(qiáng)度持續(xù)學(xué)習(xí)的能力,深入理解跨學(xué)科、跨行業(yè)的產(chǎn)業(yè)鏈條,在理解AI技術(shù)本質(zhì)的基礎(chǔ)上,推動(dòng)業(yè)務(wù)聯(lián)動(dòng)與生態(tài)合作,才能實(shí)現(xiàn)商業(yè)價(jià)值的最大化。

我和團(tuán)隊(duì)觀察下來,目前限制行業(yè)突破的核心瓶頸,在于對(duì)AI的認(rèn)知水平:

對(duì)AI技術(shù)發(fā)展的認(rèn)知,決定我們跟進(jìn)的速度;對(duì)AI使用效果的認(rèn)知,決定我們使用的廣度;對(duì)AI商業(yè)發(fā)展的認(rèn)知,決定我們投入的力度;對(duì)AI影響能力的認(rèn)知,決定我們成長的高度。

去年,我們負(fù)責(zé)了一項(xiàng)海外千卡智算中心項(xiàng)目,這本身就是一個(gè)復(fù)雜度極高的綜合性工程。

我們不僅需要把控產(chǎn)品本身的能力,還必須統(tǒng)籌各類場外因素——從前期的工地勘察、架構(gòu)建設(shè),到中期的物流運(yùn)輸、測試模擬,再到后期的集群構(gòu)建和優(yōu)化保障,每個(gè)環(huán)節(jié)都要統(tǒng)籌到位,挑戰(zhàn)很大。

而在海外落地,難度還要再上一個(gè)量級(jí)。

我們面對(duì)的是多樣化的國家政策與市場環(huán)境,前期要投入大量精力調(diào)研和實(shí)地考察;到交付階段,還會(huì)遇到許多不可控因素——國際政治形勢、當(dāng)?shù)胤煞ㄒ?guī)、極端天氣、海關(guān)流程等,都可能成為棘手的挑戰(zhàn),導(dǎo)致項(xiàng)目延期。

好在,團(tuán)隊(duì)頂住了壓力,穩(wěn)步推進(jìn)著項(xiàng)目。當(dāng)客戶最終完成壓力測試,系統(tǒng)平穩(wěn)上線運(yùn)行的那一刻,我們連續(xù)數(shù)月緊繃的神經(jīng)終于得以放松。

在海外拓展布局的過程中,客戶一直很理解、支持我們。許多新節(jié)點(diǎn)資源一上線,就迅速被客戶采購一空。我們對(duì)此深懷感激,并對(duì)未來的合作與市場前景保持樂觀。

但與此同時(shí),業(yè)界也普遍感受到:由于內(nèi)存、存儲(chǔ)、CPU等核心硬件產(chǎn)能不足,供應(yīng)鏈正出現(xiàn)顯著波動(dòng)。這可能引發(fā)各行業(yè)在傳統(tǒng)IT支出上出現(xiàn)結(jié)構(gòu)性調(diào)整,后續(xù)走勢仍需持續(xù)觀察。

并且,每次具有突破性的新模型發(fā)布,都可能重塑競爭格局,使得資源有限的中小企業(yè)面臨更大壓力。正如當(dāng)年GPT系列的出現(xiàn),導(dǎo)致大量傳統(tǒng)NLP公司被洗牌出局,持續(xù)的迭代浪潮可能令類似的歷史再次上演。

做難而正確的事,有如推石上山。我們清醒地知曉其重量與反復(fù),而真正的選擇在于:手不松,步不止。價(jià)值,就在這持續(xù)的攀登之中。

在2026年,我們將堅(jiān)定AI和全球化兩大戰(zhàn)略。

AI層面,我們將圍繞六大方向繼續(xù)深入:基礎(chǔ)模型、行業(yè)模型、AI應(yīng)用、AI+硬件、機(jī)器人和無人駕駛,以及Agent拓展。例如,AI創(chuàng)新應(yīng)用層面,我們將繼續(xù)以UModelVerse模型服務(wù)平臺(tái)為載體,通過token計(jì)費(fèi)方式,讓初創(chuàng)企業(yè)在AI成本支出更為可控;同時(shí),我們推出的Agent Sandbox可以降低AI Agent的生產(chǎn)應(yīng)用門檻,為AI真正自主處理高復(fù)雜度、高風(fēng)險(xiǎn)任務(wù)提供基礎(chǔ)設(shè)施級(jí)保障。

全球化層面,我們將加速完善全球云計(jì)算服務(wù)網(wǎng)絡(luò),計(jì)劃在2026年新增更多海外服務(wù)節(jié)點(diǎn),重點(diǎn)助力中國企業(yè)、尤其是一帶一路沿線市場的出海業(yè)務(wù)發(fā)展。

二、算力決勝點(diǎn):場景與成本

算力資源完成初步沉淀后,如何將裸金屬高效轉(zhuǎn)化為開發(fā)者可用的“數(shù)字燃料”,成了算力運(yùn)營商必須回答的命題。

并行科技董事長、CEO 陳?。篈I Coding主導(dǎo)Token需求,「高效、穩(wěn)定、低成本」將成為算力服務(wù)競爭焦點(diǎn)

八位AI算力CEO:2026,算力舊規(guī)則正在作廢

2025年,人工智能領(lǐng)域經(jīng)歷了一場由規(guī)模化應(yīng)用驅(qū)動(dòng)的深刻變革,大模型Token調(diào)用量爆炸式增長,這一變化直接引發(fā)了算力供需關(guān)系、技術(shù)優(yōu)化焦點(diǎn)和產(chǎn)業(yè)競爭格局的連鎖反應(yīng)。

作為衡量大模型應(yīng)用規(guī)模的核心指標(biāo),日均Token調(diào)用量在2025年實(shí)現(xiàn)驚人突破,全市場Token使用量同比增長300倍,且全球Token技術(shù)標(biāo)準(zhǔn)統(tǒng)一,采用開源模型的企業(yè)呈現(xiàn)一致發(fā)展態(tài)勢。

一方面,Token需求暴漲的重要場景是AI Coding,業(yè)界預(yù)測到2030年,絕大多數(shù)代碼將由AI自動(dòng)生成,這既是IT行業(yè)的自我革新,也是AI成為通用技術(shù)的基礎(chǔ)。2025年全年,Token使用量的一半集中在AI Coding領(lǐng)域,也標(biāo)志著大模型正式進(jìn)入規(guī)?;a(chǎn)階段。

不過,在我看來,Token使用量激增的核心誘因是成本優(yōu)化。2025年初,DeepSeek憑借極高的性能與成本優(yōu)勢,實(shí)現(xiàn)了Token成本10倍的性價(jià)比提升,將大模型使用門檻降低一個(gè)數(shù)量級(jí)。

在這波浪潮中,并行科技也成功將在線服務(wù)的Token成本大幅降低,從一百多元降至幾元,離線模式更是可能降至1元以下,主力Token成本整體下降近30倍,TPS(每秒Token輸出量)也提升10倍,達(dá)到行業(yè)前沿水平。

回望2025年,市場呈現(xiàn)“一卡難求——供大于求——年底優(yōu)質(zhì)卡一卡難求”的快速輪回。需求端看,我和團(tuán)隊(duì)認(rèn)為,當(dāng)前主要分為三類:頭部大模型企業(yè)的超大規(guī)模訓(xùn)練需求(企業(yè)數(shù)量縮減至不足20家,但單家需求量翻倍)、推理服務(wù)需求(含Token生成,達(dá)萬卡級(jí)別且快速增長)、科研研發(fā)需求(穩(wěn)步增長)。但供給端一側(cè),則因2023-2024年小規(guī)模智算中心無序建設(shè)、供應(yīng)鏈不穩(wěn)定等影響,供給形勢多次反轉(zhuǎn)。

對(duì)此,并行科技采取“彈性供給”和高效資源調(diào)度策略,使自有GPU算力利用率在2025年上半年達(dá)到85%-90%的飽和狀態(tài),且在12月市場轉(zhuǎn)向供不應(yīng)求前,通過多次大規(guī)模采購提前鎖定優(yōu)質(zhì)算力資源,從容應(yīng)對(duì)2026年初優(yōu)質(zhì)算力“一卡難求”的格局。

但2025年算力市場帶來的挑戰(zhàn)仍在繼續(xù):受AI需求暴漲與產(chǎn)能不足的雙重影響,全球顯存、GPU顯存、內(nèi)存及閃存等存儲(chǔ)產(chǎn)品大幅漲價(jià),直接導(dǎo)致服務(wù)器成本翻倍,嚴(yán)重制約了算力資源的擴(kuò)建進(jìn)程。

不過,在這之中,也蘊(yùn)含著國產(chǎn)算力的重要發(fā)展機(jī)遇。從政策層面和資本市場資金流向來看,國產(chǎn)算力正在呈現(xiàn)出百花齊放的態(tài)勢,從小規(guī)模適配邁向大規(guī)模單集群生態(tài)建設(shè)的新階段,既強(qiáng)調(diào)“大規(guī)?!辈季郑沧⒅亍吧鷳B(tài)”適配,加速與國際市場接軌。

2026年,行業(yè)對(duì)未來已經(jīng)達(dá)成這些共識(shí):一是推理需求持續(xù)主導(dǎo),隨著模型大規(guī)模部署,推理所需的算力規(guī)模和復(fù)雜度將遠(yuǎn)超訓(xùn)練,成為算力消耗的絕對(duì)主體;二是Agent成為主流形態(tài),大模型應(yīng)用正從單一問答向能規(guī)劃、執(zhí)行、使用工具的智能體演進(jìn),要求底層服務(wù)架構(gòu)重構(gòu);三是價(jià)值重心上移,未來競爭焦點(diǎn)不在于單純擁有算力,而在于能否提供高效、穩(wěn)定、低成本的模型服務(wù)和AI應(yīng)用。

總結(jié)而言,2026年將是AI大規(guī)模商業(yè)化應(yīng)用的元年。

成本之外,門檻仍在。如何讓非技術(shù)背景的企業(yè)能在多樣化的算力架構(gòu)上,自由地生長出屬于自己的Agent生態(tài)?

九章云極 CEO 方磊:摒棄「規(guī)模噱頭」,場景適配才是智算產(chǎn)業(yè)的關(guān)鍵「勝負(fù)手」

八位AI算力CEO:2026,算力舊規(guī)則正在作廢

站在2026年的新起點(diǎn)回望,2025年算力市場最大的變化,就是徹底告別了“盲目堆硬件”的狂熱,從“CPU云主導(dǎo)”邁入“GPU云崛起”的關(guān)鍵轉(zhuǎn)型期。

我和團(tuán)隊(duì)最直觀的體會(huì)是,2025年行業(yè)核心瓶頸集中于“供需錯(cuò)配”與“效率不足”。

一方面,傳統(tǒng)CPU云適配通用計(jì)算,與AI高并行、密集型需求存在本質(zhì)矛盾,而“CPU+GPU混合數(shù)據(jù)中心” 既抬高了成本,又制約了GPU性能的釋放;

另一方面,算法從“深度學(xué)習(xí)”向“強(qiáng)化學(xué)習(xí)”躍遷,算力呈十倍、百倍級(jí)增長,但行業(yè)GPU平均利用率僅70%左右,且“裸金屬租賃”模式門檻高,導(dǎo)致中小企業(yè)與開發(fā)者難以高效使用算力,抑制產(chǎn)業(yè)創(chuàng)新活力。

同時(shí),算力需求已進(jìn)入集中爆發(fā)期:端到端模型訓(xùn)練、仿真測試、車路協(xié)同等場景,都需要10倍以上的算力支撐,對(duì)算力的穩(wěn)定性、泛在性提出了更高要求。從全球格局看,國外頭部企業(yè)聚焦超大規(guī)模算力集群與專用芯片研發(fā),核心服務(wù)于高端訓(xùn)練場景,但高昂的成本與封閉的生態(tài)體系,讓廣大中小企業(yè)難以觸及算力資源。

因此,算力的“普惠化”行動(dòng)勢在必行。

2025年,九章云極推出智算云平臺(tái),依托Serverless與強(qiáng)化學(xué)習(xí)相關(guān)技術(shù),實(shí)現(xiàn)了萬卡至十萬卡級(jí)異構(gòu)算力的統(tǒng)一調(diào)度,將AI智能體訓(xùn)推流程簡化至一行代碼即可啟動(dòng),讓更多主體能夠參與到AI創(chuàng)新中來。

與此同時(shí),行業(yè)正經(jīng)歷關(guān)鍵躍遷:競爭核心從預(yù)訓(xùn)練時(shí)期的“拼規(guī)模”到后訓(xùn)練時(shí)期的“拼效率”,強(qiáng)化學(xué)習(xí)作為驅(qū)動(dòng)模型進(jìn)化的核心引擎,已成為下一代智算基礎(chǔ)設(shè)施的剛性需求;智能體已從“純對(duì)話交互”,轉(zhuǎn)向“復(fù)雜任務(wù)執(zhí)行”,工業(yè)控制、流程自動(dòng)化、城市治理等實(shí)景場景,催生出海量碎片化、動(dòng)態(tài)化的算力訴求。

基于此,我們團(tuán)隊(duì)也在兩個(gè)方向上發(fā)力:

一方面,繼續(xù)推進(jìn)強(qiáng)化學(xué)習(xí)云的工業(yè)級(jí)落地,以全異步訓(xùn)練架構(gòu)、離線回放算法等核心技術(shù),讓中小企業(yè)無需承擔(dān)高昂投入即可完成專家模型訓(xùn)練;

另一方面,針對(duì)智能體“執(zhí)行化”轉(zhuǎn)型需求,打通強(qiáng)化學(xué)習(xí)云與工具調(diào)用、復(fù)雜工作流的適配,延續(xù)按度計(jì)費(fèi)的模式,支持一行代碼啟動(dòng)訓(xùn)練、推理、執(zhí)行,從而匹配從機(jī)器人調(diào)度到城市規(guī)劃的多元?jiǎng)討B(tài)算力需求。

雖然當(dāng)下行業(yè)里仍有“算力過?!薄捌髽I(yè)無真實(shí)算力需求”的聲音,市場也在糾結(jié)“是否要加速推進(jìn)大規(guī)模、大體量算力布局”。

但我們始終堅(jiān)持自己的判斷是,AI基礎(chǔ)設(shè)施仍處于發(fā)展上升期,長期潛力巨大。未來有能力開展模型訓(xùn)練的主體會(huì)持續(xù)增多,算力需求的增長空間遠(yuǎn)未觸頂,所謂“算力過?!敝皇嵌唐诠┬璨▌?dòng)的階段性現(xiàn)象,而非行業(yè)終局。

市場的反饋與實(shí)際體感也在印證我們的判斷:Forrester調(diào)研顯示,45%的中小企業(yè)選擇智算云服務(wù),12%的獨(dú)立開發(fā)者將其作為核心支撐,企業(yè)對(duì)AI算力的使用邏輯已轉(zhuǎn)向“經(jīng)濟(jì)、彈性”,依托我們的智算云,部分客戶成本直接降低了40%。

最后,我想說說我對(duì)這個(gè)行業(yè)的理解:行業(yè)的勝負(fù)手不是誰的GPU更多,而是誰能放下“規(guī)模噱頭”,深耕場景適配,把算力變成企業(yè)“算著清、用得好”的基礎(chǔ)設(shè)施。

三、軟硬件新戰(zhàn)場

Context Window帶來巨大內(nèi)存消耗、高帶寬DRAM走向供需失衡,需求端的反向施壓,為創(chuàng)新性技術(shù)方案的實(shí)現(xiàn)提供機(jī)遇。

昉擎科技 CEO 梁軍:Agent爆發(fā)與供應(yīng)趨緊,AI基礎(chǔ)設(shè)施迎來「創(chuàng)新發(fā)展」窗口期

八位AI算力CEO:2026,算力舊規(guī)則正在作廢

2025年年初,DeepSeek R1的發(fā)布引起巨大反響,Sparse MoE(稀疏混合專家模型)迅速成為主流。過去一年里,模型能力持續(xù)躍升、迭代速度顯著加快,各類應(yīng)用也隨之快速普及。

然而,上層應(yīng)用的繁榮與底層算力的就緒之間存在明顯的時(shí)間差。

針對(duì)Sparse MoE模型的計(jì)算特性,AI Infra在過去一年里實(shí)現(xiàn)了多層面的深度優(yōu)化,但由于芯片有固定的開發(fā)節(jié)奏,除了華為超節(jié)點(diǎn)方案外,國內(nèi)其他芯片廠商的對(duì)應(yīng)產(chǎn)品仍處于開發(fā)階段,這也制約了相關(guān)業(yè)務(wù)的增長。

瓶頸的出現(xiàn),讓行業(yè)在設(shè)計(jì)、部署Scale-Up集群上迅速達(dá)成共識(shí)。UALink、SUE及ESUN等Scale-Up通信協(xié)議標(biāo)準(zhǔn)進(jìn)展非常迅速,產(chǎn)業(yè)鏈配套的通信協(xié)議IP、Switch、支持Scale-Up接口的算力芯片,以及Scale-Up集群硬件等各種產(chǎn)品的開發(fā)進(jìn)展也全面提速。

另一方面,行業(yè)供應(yīng)形勢持續(xù)趨緊:除了眾所周知的高帶寬DRAM供需失衡,還有不少部件、材料都面臨供應(yīng)緊張的境況。

這一緊張態(tài)勢并非單純的周期性波動(dòng),而是應(yīng)用范式變革對(duì)資源需求的結(jié)構(gòu)性重塑。

Agent應(yīng)用的爆發(fā)式增長,既要滿足超長Context Window(上下文窗口)帶來的巨大內(nèi)存消耗,又需將Token成本壓縮至極致。

與此同時(shí),Agent普及帶來的low latency(低時(shí)延推理)需求,正從需求端反向施壓,對(duì)系統(tǒng)軟硬件設(shè)計(jì)產(chǎn)生深遠(yuǎn)影響。

這些變化讓行業(yè)面臨很大挑戰(zhàn),但也帶來發(fā)展機(jī)遇。

從模型、應(yīng)用、AI Infra到底層軟硬件,各層面均在高速迭代演進(jìn),客觀上催生了巨大的市場機(jī)會(huì),也為創(chuàng)新性技術(shù)方案的落地提供了寶貴的窗口期。

這一窗口屬于敢于冒險(xiǎn)、擅長系統(tǒng)性思維的團(tuán)隊(duì)。在諸多難題與挑戰(zhàn)之下,我們始終堅(jiān)持以高標(biāo)準(zhǔn)方案和更基礎(chǔ)性的方式求解,這也讓我們團(tuán)隊(duì)收獲超出預(yù)期的成果。

過去一年我們的多次實(shí)踐,都在不斷驗(yàn)證這一方法論的有效性,也讓我們面對(duì)未來的信心更加堅(jiān)定。

Token需求進(jìn)入爆發(fā)期后,底層硬件碎片化的“互聯(lián)墻”不容小覷,行業(yè)要如何避免讓算力集群淪為性能孤島?

奇異摩爾 CEO 田陌晨:「互聯(lián)碎片化」成超節(jié)點(diǎn)瓶頸,AI下一戰(zhàn)拼的是交付

八位AI算力CEO:2026,算力舊規(guī)則正在作廢

這波AI的發(fā)展,對(duì)硬件提出了雙重挑戰(zhàn):

一方面,市場上AI大模型數(shù)量快速增長,要求芯片廠商能廣泛且高效地適配;

另一方面,大模型領(lǐng)域技術(shù)迭代極快,多模態(tài)、世界模型等創(chuàng)新層出不窮,如今,市場重心也已經(jīng)明顯轉(zhuǎn)向:一是從追求規(guī)模擴(kuò)張,轉(zhuǎn)向深耕性能;二是從“生成式AI”,轉(zhuǎn)向“AI Agent”這一形態(tài)。

尤其在推理場景中,不同應(yīng)用場景對(duì)Prefill(預(yù)填充)與Decode(解碼)階段的需求不同,對(duì)時(shí)延、精度、功耗、可靠性等方面的側(cè)重點(diǎn)也不同,這些都會(huì)直接影響計(jì)算、互聯(lián)與存儲(chǔ)等各個(gè)模塊的設(shè)計(jì)。

這也直接拉高了對(duì)硬件團(tuán)隊(duì)的要求:

軟件技術(shù)演進(jìn)常以“季度”甚至“月”為單位,芯片等硬件的迭代周期卻通常長達(dá)數(shù)年,因此,硬件研發(fā)團(tuán)隊(duì)不僅要精通軟硬件深度技術(shù)、具備跨領(lǐng)域視野,還需具備前瞻性,能夠預(yù)判未來兩至三年的技術(shù)需求,以提前規(guī)劃硬件設(shè)計(jì)。

我們從2021年起,就預(yù)見到AI快速發(fā)展將面臨的網(wǎng)絡(luò)互聯(lián)瓶頸,在布局片內(nèi)互聯(lián)芯粒產(chǎn)品后,也逐步構(gòu)建起面向AI網(wǎng)絡(luò)互聯(lián)的全棧解決方案。

然而,這一路并非坦途:

2024年,我們已前瞻性地在超節(jié)點(diǎn)領(lǐng)域進(jìn)行了技術(shù)和資源布局,但那時(shí)候“超節(jié)點(diǎn)”概念還沒有火起來,我們的工作顯得有些“超前”,這使得公司當(dāng)時(shí)的資本化進(jìn)程一度有些阻力。好在,有中科創(chuàng)星等早期投資人始終如一的信任,以及客戶和合作伙伴的并肩同行,到2025年,超節(jié)點(diǎn)成為AI訓(xùn)推集群的關(guān)鍵技術(shù)焦點(diǎn)。

不過,制約超節(jié)點(diǎn)部署效率與可擴(kuò)展性的核心瓶頸,也隨之顯現(xiàn):

超節(jié)點(diǎn)內(nèi)部的各個(gè)計(jì)算單元,要依賴統(tǒng)一、高效的互聯(lián)協(xié)議,才能實(shí)現(xiàn)協(xié)同。然而,目前還沒有出現(xiàn)像以太網(wǎng)或移動(dòng)通信那樣成熟且被廣泛接納的標(biāo)準(zhǔn)體系,這就導(dǎo)致不同廠家的設(shè)備很難兼容、互通,交換機(jī)和計(jì)算節(jié)點(diǎn)之間的對(duì)接方式,都是各家自己定制,這讓系統(tǒng)集成和后期維護(hù)都變得更復(fù)雜且麻煩。

盡管最近兩年間,國內(nèi)外已涌現(xiàn)出多項(xiàng)致力于推進(jìn)標(biāo)準(zhǔn)化的倡議與規(guī)范,如SUE、OISA、ETH-X、UALink等。然而,“生態(tài)碎片化”的解決并非單純的技術(shù)競賽,而是要依賴于產(chǎn)業(yè)鏈上下游的緊密協(xié)作。在我看來,短期內(nèi),多元技術(shù)標(biāo)準(zhǔn)并存的格局還會(huì)持續(xù)。

針對(duì)這一情況,奇異摩爾推出超節(jié)點(diǎn)互聯(lián)芯粒Kiwi G2G IOD——基于我們獨(dú)創(chuàng)的HPDE可編程架構(gòu),能支持不同的協(xié)議類型及其升級(jí)。

并且,早在2023年,奇異摩爾便作為首批核心生態(tài)成員,深度參與由中國移動(dòng)牽頭的OISA 1.0協(xié)議制定工作。2025年,公司進(jìn)一步參與到OISA 2.0協(xié)議的制定中,負(fù)責(zé)制定了協(xié)議中互聯(lián)芯粒部分的標(biāo)準(zhǔn)設(shè)計(jì),還開發(fā)了業(yè)界首個(gè)OISA Scale up協(xié)議的驗(yàn)證平臺(tái)。

2026年,我相信超節(jié)點(diǎn)的熱度仍會(huì)繼續(xù),且會(huì)進(jìn)一步產(chǎn)業(yè)化。這背后也指向一個(gè)關(guān)鍵共識(shí):AI時(shí)代的競技場,勝負(fù)在于交付——無論是觸達(dá)用戶的最終應(yīng)用,還是支撐一切的底層硬件,真正拉開差距的,都是交付。

如今,硬件問題也不能僅靠硬件解決,如果無法在指令集與精度層面實(shí)現(xiàn)芯片與大模型的深度協(xié)同,算力天花板依然近在咫尺。

清程極智 CEO 湯雄超:「單向適配」不是終局,未來模型與芯片架構(gòu)設(shè)計(jì)要互相指導(dǎo)

八位AI算力CEO:2026,算力舊規(guī)則正在作廢

去年,我們比較關(guān)注大模型的推理部署場景。

印象里最焦慮的時(shí)候,可能是春節(jié)后在各種平臺(tái)上適配優(yōu)化DeepSeek模型:當(dāng)時(shí)我們發(fā)現(xiàn),DeepSeek在一些平臺(tái)上很容易能運(yùn)行起來,但在另一些平臺(tái)上卻會(huì)面臨很多挑戰(zhàn),算力平臺(tái)之間的差距非常大。

經(jīng)過團(tuán)隊(duì)的努力,我們?cè)趲讉€(gè)月后終于實(shí)現(xiàn)了計(jì)劃中的近10種算力平臺(tái)的推理部署方案。對(duì)比當(dāng)時(shí),其實(shí)可以明顯感受到,國產(chǎn)算力對(duì)新發(fā)布模型的支持速度已經(jīng)大幅提升——

從最初模型發(fā)布數(shù)月后才能完成適配,到后來往往新模型發(fā)布后幾天即可適配。去年WAIC大會(huì)期間,清程極智的“赤兔”推理引擎更是實(shí)現(xiàn)了國產(chǎn)算力對(duì)新模型的0 Day支持,讓GLM4.5模型發(fā)布當(dāng)天就能在華為昇騰算力上推理部署。

適配速度的加快,體現(xiàn)了國產(chǎn)算力上的軟件生態(tài)不斷成熟。今年初,我們和T-One孵化器聯(lián)合發(fā)布了一份大模型API服務(wù)行業(yè)報(bào)告,在和幾十家做大模型API服務(wù)的伙伴溝通后發(fā)現(xiàn),國產(chǎn)算力是真實(shí)可用的,但與此同時(shí),硬件架構(gòu)差異帶來的問題,無法通過軟件手段完全解決。

以往大家認(rèn)為,軟硬件分別面臨生態(tài)成熟度與絕對(duì)性能上的差異,但到了2025年,新興大模型算法架構(gòu)與國際先進(jìn)算力的硬件架構(gòu)綁定得更加緊密,其影響已經(jīng)超出通常意義上的“軟件生態(tài)”范疇。

例如,去年初開源的DeepSeek-V3/R1模型,是基于FP8數(shù)據(jù)精度原生訓(xùn)練與推理的,但當(dāng)時(shí)國產(chǎn)算力硬件架構(gòu)并不支持FP8。我們預(yù)感到后續(xù)會(huì)有更多模型采用FP8、FP4這類新興低精度數(shù)據(jù)類型,于是,清程極智就通過軟件的方式,在國產(chǎn)算力上實(shí)現(xiàn)了FP8精度的計(jì)算,后來又進(jìn)一步完成了FP4精度的軟件支持。

但這僅僅解決了易用性問題,讓用戶能在國產(chǎn)算力平臺(tái)上快速跟進(jìn)最新大模型與數(shù)據(jù)精度,卻無法從硬件底層真正提升模型的實(shí)際運(yùn)算速度。

而現(xiàn)在,低精度算力已逐漸成為智能算力的主流配置。在海外高端算力芯片中,F(xiàn)P4算力普遍能達(dá)到BF16算力的6-8倍。如果國產(chǎn)算力只是在BF16算力上追平海外產(chǎn)品,卻沒有在硬件層面補(bǔ)齊對(duì)FP4精度的支持,那么其真實(shí)有效算力依然只有海外芯片的零頭,很難形成性價(jià)比優(yōu)勢。

好在去年很多國產(chǎn)算力廠商在下一代芯片規(guī)劃中,都提出將支持低精度的算力類型,比如昇騰950就支持FP4。預(yù)計(jì)2026年,硬件架構(gòu)的差異有望進(jìn)一步縮小。

但在我看來,國產(chǎn)算力在硬件架構(gòu)上逐步對(duì)齊海外特性,還只是早期階段。根本的解決方案,應(yīng)該是國產(chǎn)算力和大模型研發(fā)機(jī)構(gòu)更緊密地合作:讓大模型算法的發(fā)展需求指導(dǎo)芯片架構(gòu)的設(shè)計(jì),芯片架構(gòu)也反過來指導(dǎo)大模型的算法設(shè)計(jì)。

放眼2026,大模型推理對(duì)算力的需求仍將保持高速增長,并且,無論是大模型算法架構(gòu)還是底層硬件設(shè)計(jì),都會(huì)更加多樣化——

模型方面,去年主流還是基于自回歸解碼的文本類模型,今年則會(huì)出現(xiàn)更多擴(kuò)散模型與多模態(tài)模型;算力方面,除了類GPU架構(gòu)和NPU架構(gòu),一些架構(gòu)更激進(jìn)的算力也將開始量產(chǎn)。在這樣百花齊放的格局下,可能會(huì)碰撞出新的“硬件-算法”協(xié)同的行業(yè)最優(yōu)解。

國產(chǎn)算力在功能上已經(jīng)能滿足大量實(shí)際場景的需求,但在絕對(duì)性能和性價(jià)比上,仍需進(jìn)一步提升,才能真正建立商業(yè)優(yōu)勢。這需要全行業(yè)共同努力,實(shí)現(xiàn)市場化的正向循環(huán)。

四、顛覆全棧

最后,當(dāng)?shù)讓蛹夹g(shù)棧逐步打通、Agent 真正成長為新一代操作系統(tǒng),一個(gè)更重磅、更根本的命題也隨之到來:

人類,是否已準(zhǔn)備好向 AI 移交決策權(quán)?

PPIO CEO 姚欣:敢不敢放權(quán)給AI,是屬于人類的「奇點(diǎn)時(shí)刻」

八位AI算力CEO:2026,算力舊規(guī)則正在作廢

過去業(yè)界將2045年視為“奇點(diǎn)臨近”,認(rèn)為跨過奇點(diǎn)后,智能將指數(shù)級(jí)迭代、機(jī)器進(jìn)化速度會(huì)遠(yuǎn)超人類。但在我看來,2025年已經(jīng)過了奇點(diǎn)的拐點(diǎn)。

回看去年,DeepSeek的爆發(fā)讓我們團(tuán)隊(duì)很興奮。一季度我們快速加碼算力、對(duì)接需求,全力沖刺MaaS業(yè)務(wù)增長。但到了五六月,市場風(fēng)向突然轉(zhuǎn)變——開發(fā)者更傾向選擇海外價(jià)格更高的閉源模型。

這一度讓我們陷入焦慮:PPIO核心業(yè)務(wù)MaaS,跟開源模型生態(tài)息息相關(guān),只有開源模型足夠強(qiáng),才能帶動(dòng)MaaS和算力需求增長。但我始終對(duì)開源非常堅(jiān)定——從PC互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng),歷次浪潮幾乎都遵循“閉源開辟、開源統(tǒng)治”的規(guī)律,這一輪AI浪潮也不會(huì)例外。

所以我們堅(jiān)持到九月十月,終于,國內(nèi)大模型迎來爆發(fā)。臨近春節(jié)這段時(shí)間,我們也幾乎每天都在對(duì)接新模型,春節(jié)大家可能也休息不了。這個(gè)過程對(duì)我們來說,痛并快樂著。

不過,模型能力只是單點(diǎn)突破,我們始終相信Agent層才是開發(fā)者真正的“操作系統(tǒng)”。去年Agent技術(shù)棧還不成熟,大多停留在概念與雛形階段;但春節(jié)前OpenClaw的誕生,已經(jīng)讓行業(yè)看到全新的機(jī)會(huì)和希望。

最近還讓我震撼的是,Cursor的CEO拿GPT 5.2寫了三百多萬行代碼,基本復(fù)現(xiàn)了chromium 瀏覽器,要知道寫瀏覽器的難度挑戰(zhàn)和操作系統(tǒng)是一個(gè)級(jí)別的,由此可以看出,AI已經(jīng)幾乎沒有寫不了的代碼。

在這背后,我也看到了技術(shù)方向上的“會(huì)師”:OpenClaw這類Agent的“權(quán)力”太大了,有很大的安全隱患??梢?,今天的AI基礎(chǔ)設(shè)施,已經(jīng)不再僅僅是為人設(shè)計(jì),同時(shí)也要為AI服務(wù)——高彈性、高并發(fā)、高任務(wù)響應(yīng)、甚至長時(shí)記憶能力,都是AI原生的核心需求。

作為經(jīng)歷過互聯(lián)網(wǎng),移動(dòng)互聯(lián)網(wǎng)多個(gè)時(shí)代的連續(xù)創(chuàng)業(yè)者,我認(rèn)為當(dāng)下又是一個(gè)重大的技術(shù)范式變遷,我們過去的各類軟硬件都是針對(duì)人的使用體驗(yàn)設(shè)計(jì)的,但是行業(yè)正從“以人使用為中心設(shè)計(jì)Infra”,轉(zhuǎn)向“以AI或機(jī)器為中心設(shè)計(jì)的Infra”。我們?nèi)ツ晖瞥龅腁gent沙箱系統(tǒng),恰好就可以成為Agent Infra的核心組件——在保障高效運(yùn)行的同時(shí),實(shí)現(xiàn)安全隔離與風(fēng)險(xiǎn)可控。

與此同時(shí),在需求爆發(fā)的背景下,算力的梯次利用與精細(xì)化調(diào)度也變得至關(guān)重要。未來算力需求的增長速度會(huì)大幅領(lǐng)先于今天算力供應(yīng)速度,行業(yè)會(huì)進(jìn)入一段長期供不應(yīng)求的時(shí)段。

而一個(gè)愈發(fā)清晰的趨勢是:越是傳統(tǒng)的組件,越容易成為新的瓶頸。

我在本屆CES觀察到,GPU行業(yè)已在為產(chǎn)能實(shí)現(xiàn)十倍、百倍增長做準(zhǔn)備,但其他組件完全沒跟上,比如硬盤,過去20年每年的產(chǎn)能只上漲平均3%-5%。這就意味著,我們已經(jīng)進(jìn)入到基礎(chǔ)設(shè)施的綜合博弈,木桶短板效應(yīng)會(huì)集中爆發(fā)。

因此,我們今年的目標(biāo)也很明確:全?;腿蚧?。前者是打通從IaaS、MaaS到Agent Infra的端到端技術(shù)能力;后者則是依托不同區(qū)域的資源優(yōu)勢,在日本、歐洲、東南亞等地進(jìn)一步布局,挖掘更多元的算力供給與市場機(jī)會(huì)。

我還有個(gè)觀察:未來制約AI普及與應(yīng)用深度的關(guān)鍵,不在于技術(shù)或算力,而在于企業(yè)組織能力能否跟上AI的迭代速度。

今年我會(huì)在公司內(nèi)部推進(jìn)全面向AI Native組織轉(zhuǎn)型。這背后是一個(gè)根本性命題:當(dāng)機(jī)器在效率與智能水平上全面超越人類時(shí),組織與管理者是否敢于放權(quán)?

如果我們的決策依然依賴冗長流程、追求100%絕對(duì)安全、所有事項(xiàng)最終都需要CEO簽字確認(rèn),決策效率必然被嚴(yán)重制約。這就是人類史上又一把 “達(dá)摩克利斯之劍”:在安全與效率、穩(wěn)定與進(jìn)化之間,如何做出抉擇?

這將是人類自身的奇點(diǎn)時(shí)刻。

作者長期關(guān)注AI算力鏈條,歡迎添加作者微信 Ericazhao23 交流。雷峰網(wǎng)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

作者

關(guān)注算力、AI及相關(guān)IR話題等。微信:Ericazhao23。
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說