久久精品无码视频|精产国品色情一二三区在线观看|国产性爱自拍视频|亚洲av韩国av|日韩美女一级AAA大片|少妇无码激情诱惑|日韩AV在线播放有码|一级黄片一级黄片|av上一页亲亲久草av|aaa在线观看国产做爱

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
芯片 正文
發(fā)私信給劉伊倫
發(fā)送

0

云天勵(lì)飛發(fā)布未來三年算力芯片戰(zhàn)略:聚焦推理效能升級(jí),全線對標(biāo)英偉達(dá)新一代產(chǎn)品

本文作者: 劉伊倫   2026-02-05 10:27
導(dǎo)語:云天勵(lì)飛是國內(nèi)屈指可數(shù)手握充足國產(chǎn)產(chǎn)能保障的企業(yè)之一。

雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))消息,2月3日,云天勵(lì)飛首次對外公布未來三年的大算力AI推理芯片戰(zhàn)略布局,將實(shí)現(xiàn)百萬Tokens推理成本降低100倍以上的目標(biāo)。

推理算力需求暴漲,是在行業(yè)中實(shí)際發(fā)生的結(jié)構(gòu)性變革。

德勤發(fā)布的報(bào)告指出2026年推理算力將占整體AI算力的66%,推理優(yōu)化芯片市場在2026年將增長至超500億美元。字節(jié)旗下豆包大模型Token使用量從2024年的單日0.12萬億,到2025年12月已突破50萬億。

多個(gè)行業(yè)信號(hào)共同指向一個(gè)趨勢:推理側(cè)競爭已不再單純是“把模型做得更強(qiáng)”的參數(shù)競賽,而是“讓應(yīng)用跑得更久、更穩(wěn)、更便宜”的效能競賽,單位推理成本與交付效率已成為規(guī)模化落地的最大門檻。

“在推理芯片領(lǐng)域,依托國內(nèi)豐富的應(yīng)用場景、穩(wěn)定可靠的電網(wǎng)和快速迭代的開源模型,我們具備彎道超車的能力,因此訓(xùn)練追趕、推理超車是未來5年我們的策略,而GPNPU則是AI推理芯片架構(gòu)的最優(yōu)解?!?/strong>云天勵(lì)飛董事長兼CEO表示。

云天勵(lì)飛發(fā)布未來三年算力芯片戰(zhàn)略:聚焦推理效能升級(jí),全線對標(biāo)英偉達(dá)新一代產(chǎn)品

面向AI推理需求的爆發(fā)式增長,云天勵(lì)飛如何規(guī)劃下一階段芯片研發(fā)路線圖?又將如何通過架構(gòu)創(chuàng)新與技術(shù)突破,真正實(shí)現(xiàn)算力效率提升與全生命周期成本下降,從而在推理芯片領(lǐng)域?qū)崿F(xiàn)彎道超車?

GPNPU架構(gòu)定義未來三年芯片路線:直指英偉達(dá)旗艦級(jí)算力產(chǎn)品

推理時(shí)代的勝負(fù)手不在單點(diǎn)指標(biāo),而在系統(tǒng)級(jí)協(xié)同:既要承接主流軟件生態(tài),又要在推理負(fù)載下實(shí)現(xiàn)更優(yōu)能效與更低時(shí)延。

云天勵(lì)飛確立了GPNPU技術(shù)路線,并提出了“GPNPU=GPGPU+NPU+3D堆疊存儲(chǔ)”的核心公式,兼顧通用計(jì)算的“通用性”與NPU的“高效性”。

云天勵(lì)飛發(fā)布未來三年算力芯片戰(zhàn)略:聚焦推理效能升級(jí),全線對標(biāo)英偉達(dá)新一代產(chǎn)品

在通用生態(tài)層面,鑒于CUDA仍是全球最成熟、覆蓋最廣的加速計(jì)算平臺(tái)之一,云天勵(lì)飛的GPNPU架構(gòu)致力于正視主流生態(tài)的遷移成本問題,能夠?qū)崿F(xiàn)一行代碼完成CUDA程序兼容,極大降低了進(jìn)入生產(chǎn)系統(tǒng)的門檻。

在推理能效層面,NPU能夠?qū)崿F(xiàn)更高的計(jì)算效率和能效比,面對大模型推理這種高度結(jié)構(gòu)化、可被體系化優(yōu)化的負(fù)載,專用化設(shè)計(jì)帶來的能效優(yōu)勢更容易轉(zhuǎn)化為真實(shí)成本優(yōu)勢,這也是國際廠商持續(xù)加碼專用路線的重要原因。

同時(shí),針對行業(yè)公認(rèn)的“內(nèi)存墻”瓶頸,云天勵(lì)飛正深度研發(fā) 3D 堆疊存儲(chǔ)及更前沿的互連技術(shù),以提升帶寬與能效,降低推理時(shí)延。

“通過引入3D memory架構(gòu),我們可以實(shí)現(xiàn)10倍于當(dāng)前訓(xùn)練芯片HBM帶寬的性能,其訪問時(shí)延將達(dá)到10納秒級(jí)別,以實(shí)現(xiàn)極致的推理能效。”云天勵(lì)飛CTO李愛軍表示。

在架構(gòu)工程與產(chǎn)品化路徑上,云天勵(lì)飛提出“算力積木”架構(gòu),通過Chiplet擴(kuò)展與互連思路,將標(biāo)準(zhǔn)計(jì)算單元進(jìn)行模塊化封裝與組合,讓算力像搭積木一樣按需擴(kuò)展,形成從邊緣到更大規(guī)模推理的彈性產(chǎn)品形態(tài)。

其次是面向推理的系統(tǒng)級(jí)優(yōu)化能力,公司拒絕單純的“芯片參數(shù)競賽”,而是主張把“模型怎么跑得更省”沉淀到架構(gòu)里,圍繞真實(shí)業(yè)務(wù)負(fù)載持續(xù)迭代,逐項(xiàng)擊穿推理鏈路中的成本與時(shí)延瓶頸,最終形成可復(fù)制交付的解決方案。

“基于對大模型推理的理解,我們構(gòu)造了PD分離系統(tǒng)架構(gòu),針對大模型prefill和decode階段不同的計(jì)算特點(diǎn)進(jìn)行優(yōu)化設(shè)計(jì),在芯片的微架構(gòu)層面上,我們同時(shí)對于Attention及FFN的計(jì)算的特點(diǎn)進(jìn)行細(xì)粒度的分析,從而進(jìn)一步的去提升我們的推理效率?!?/strong>李愛軍說到。

云天勵(lì)飛發(fā)布未來三年算力芯片戰(zhàn)略:聚焦推理效能升級(jí),全線對標(biāo)英偉達(dá)新一代產(chǎn)品

會(huì)議上,云天勵(lì)飛以推進(jìn)百萬Token推理成本每年兩位數(shù)的降低為目標(biāo),正式發(fā)布了未來三年的大算力芯片規(guī)劃。

2026至2028年,云天勵(lì)飛規(guī)劃推出三代迭代芯片,節(jié)奏清晰對標(biāo)國際主流廠商。

第一代超節(jié)點(diǎn)P芯片將于今年推出,其將面向百萬長上下文的場景進(jìn)行極致的prefill推理優(yōu)化,在算力上緊跟H100。

2027年,云天勵(lì)飛將研發(fā)第一代超節(jié)點(diǎn)D芯片,以此在decode推理方面實(shí)現(xiàn)超低延時(shí),而其算力性能將達(dá)到B200 相當(dāng)?shù)乃健?/p>

2028年,云天勵(lì)飛將研發(fā)第二代超節(jié)點(diǎn)D芯片,致力于實(shí)現(xiàn)毫秒級(jí)的推理時(shí)延,從而使得prefill和decode的性能大幅提升,在算力層面,將對標(biāo)英偉達(dá)的下一代Rubin芯片。

云天勵(lì)飛發(fā)布未來三年算力芯片戰(zhàn)略:聚焦推理效能升級(jí),全線對標(biāo)英偉達(dá)新一代產(chǎn)品

手握「充足」國產(chǎn)產(chǎn)能,云天勵(lì)飛打通研發(fā)、量產(chǎn)與規(guī)模化交付閉環(huán)

算力芯片的競爭已步入新周期,多家公司登陸資本市場之外,還有大量創(chuàng)業(yè)公司逐漸嶄露頭角。

競爭白熱化的行業(yè)境況下,陳寧指出,支撐公司跨越周期的,是長期積累構(gòu)筑的商業(yè)護(hù)城河。云天勵(lì)飛的核心競爭力,已形成技術(shù)、產(chǎn)能、生態(tài)、市場、資本五大維度的協(xié)同。

GPNPU的架構(gòu)創(chuàng)新,以及三年大算力芯片規(guī)劃的發(fā)布,實(shí)現(xiàn)了技術(shù)與產(chǎn)品的閉環(huán)。

在此之下,產(chǎn)能成為落地的關(guān)鍵。

針對行業(yè)普遍關(guān)注的供應(yīng)鏈安全問題,云天勵(lì)飛高級(jí)副總裁、CFO兼董秘鄧浩然特別強(qiáng)調(diào),公司目前是國內(nèi)屈指可數(shù)手握充足國產(chǎn)產(chǎn)能保障的企業(yè)之一,這一戰(zhàn)略儲(chǔ)備為后續(xù)芯片的大規(guī)模量產(chǎn)與交付提供了極高的確定性。

此外,云天勵(lì)飛受到資本市場的高度關(guān)注,具備足夠的資金實(shí)力以支撐芯片研發(fā)的長期消耗,同時(shí)在頂級(jí)芯片人才的招攬上,也能夠走在前列。

云天勵(lì)飛發(fā)布未來三年算力芯片戰(zhàn)略:聚焦推理效能升級(jí),全線對標(biāo)英偉達(dá)新一代產(chǎn)品

而為了應(yīng)對市場競爭以及不確定性,云天勵(lì)飛更將組織調(diào)整為更具韌性的“1+4”架構(gòu)。

“1”指聚焦于AI大算力推理芯片,“4”則是四大事業(yè)部。作為生態(tài)構(gòu)建者,四大事業(yè)部旨在解決芯片從“研發(fā)生產(chǎn)、優(yōu)化打磨到市場推廣”的核心難題。其中,政企事業(yè)部作為基石,將憑借深厚的行業(yè)經(jīng)驗(yàn),將戰(zhàn)略重點(diǎn)轉(zhuǎn)向推理設(shè)備和智算中心的建設(shè),以實(shí)現(xiàn)業(yè)務(wù)運(yùn)轉(zhuǎn)的協(xié)同閉環(huán)。

據(jù)悉,云天勵(lì)飛正規(guī)劃打造區(qū)域級(jí)“千卡集群”。

云天勵(lì)飛發(fā)布未來三年算力芯片戰(zhàn)略:聚焦推理效能升級(jí),全線對標(biāo)英偉達(dá)新一代產(chǎn)品

推理時(shí)代的競爭,本質(zhì)是“單位推理成本”的競爭。只有把推理做得足夠便宜、足夠穩(wěn)定、足夠易用,AI才能從“看得見的能力”走向“用得起的生產(chǎn)力”。

未來,云天勵(lì)飛將以GPNPU架構(gòu)為核心,大力推進(jìn)云端大算力強(qiáng)化軟硬協(xié)同與存儲(chǔ)體系攻堅(jiān),實(shí)現(xiàn)百萬Tokens推理成本降低超100倍的目標(biāo)。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄