久久精品无码视频|精产国品色情一二三区在线观看|国产性爱自拍视频|亚洲av韩国av|日韩美女一级AAA大片|少妇无码激情诱惑|日韩AV在线播放有码|一级黄片一级黄片|av上一页亲亲久草av|aaa在线观看国产做爱

<center id="ypgca"><optgroup id="ypgca"></optgroup></center>

<li id="ypgca"><tbody id="ypgca"></tbody></li>

<span id="ypgca"></span>

<li id="ypgca"><tbody id="ypgca"></tbody></li><span id="ypgca"></span>

<bdo id="ypgca"></bdo>

<span id="ypgca"></span>

<span id="ypgca"></span>

<span id="ypgca"></span>

<bdo id="ypgca"></bdo>

<li id="ypgca"></li>

<center id="gsimk"><th id="gsimk"></th></center>

<noframes id="gsimk"><dl id="gsimk"></dl></noframes>

<dl id="gsimk"><delect id="gsimk"></delect></dl>

您正在使用IE低版瀏覽器，為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗，強烈建議使用更快更安全的瀏覽器

此為臨時鏈接，僅用于文章預覽，將在時失效

芯片正文

發(fā)私信給劉伊倫

發(fā)送

0

推理算力占AI應用70%成本權重，需求爆發(fā)下國產(chǎn)芯片如何定義性價比新基準？

本文作者：劉伊倫

2026-01-29 13:14

導語：誰能持續(xù)降低推理成本，誰就掌握了AI產(chǎn)業(yè)的成本曲線。

雷峰網(wǎng)(公眾號：雷峰網(wǎng))消息，1月27日，國產(chǎn)GPU廠商曦望（Sunrise）正式發(fā)布新一代推理芯片“啟望S3”，并同步推出面向大模型推理的“寰望 SC3”超節(jié)點方案及推理云計劃。

推理算力占AI應用70%成本權重，需求爆發(fā)下國產(chǎn)芯片如何定義性價比新基準？

這一系列動作直指行業(yè)痛點。

此前AI芯片廠商普遍陷入“拼峰值性能”的競爭怪圈，但不少行業(yè)人士指出，以超節(jié)點為例，產(chǎn)品存在明顯“規(guī)模甜點”效應：一旦超過性能閾值，提升幅度便會邊際遞減，盲目追求超大算力規(guī)模反而會造成GPU閑置率攀升、單位Token成本高企的問題。

推理場景下，用戶需要的是“成本可控、性能適配、穩(wěn)定可靠” 的算力。如何走出差異化的路線？

“我們拋棄了傳統(tǒng)的訓推一體GPU為訓練準備的冗余設計，不追求峰值TFLOPS性能，而是把真實業(yè)務場景中的單個Token成本、能耗，以及SLA的穩(wěn)定性，作為所有設計決策的根本出發(fā)點?！?/strong>曦望董事長徐冰在發(fā)布會現(xiàn)場闡述到。

為了達到這個標準，啟望S3作為面向大模型推理深度定制的GPGPU芯片，如何圍繞真實推理負載完成對算力結構、存儲體系與互聯(lián)方式的系統(tǒng)級重構？

從“性能峰值”到“單位成本”，推理正在重新定義GPU設計目標

推理算力的爆發(fā)式增長，已成為行業(yè)當下最核心的關注焦點。對此，曦望在發(fā)布會上，給出兩組數(shù)據(jù)：

到2026年，推理算力在整體AI算力中的占比將達到66%，這并非遙遠的趨勢預判，而是正在發(fā)生的行業(yè)結構性變化，推理已從AI產(chǎn)業(yè)鏈的“配角”躍升為“主力”；

當前推理成本在AI應用總支出中的占比已高達70%，直接決定著AI企業(yè)的盈利空間與商業(yè)化成敗。只有將推理成本從現(xiàn)有量級大幅壓低，實現(xiàn)階梯式下降，AI才能真正擺脫高成本束縛。

“當推理成為主要算力消耗場景后，GPU的商業(yè)價值不再取決于參數(shù)指標，而是單位Token的真實成本。”曦望聯(lián)席CEO王勇表示。

這一判斷，決定了啟望S3的設計方向。

在算力層面，S3支持從FP16到FP4的多精度靈活切換，使模型在保證效果的前提下，最大化提升低精度推理效率。這種設計更貼合當前MoE和長上下文模型在推理階段的實際需求。

在存儲層面，S3采用LPDDR6顯存方案，成為國內首款采用該方案的芯片。相比HBM路線，LPDDR6更強調容量與能效比。官方數(shù)據(jù)顯示，S3的顯存容量較上一代產(chǎn)品提升4倍，有效緩解了大模型推理中普遍存在的顯存駐留與訪存瓶頸。

在DeepSeek V3 / R1滿血版等主流大模型推理場景中，S3單位Token推理成本較上一代產(chǎn)品下降約90%。曦望方面稱，這一指標已具備工程可復現(xiàn)性，而非單點實驗室數(shù)據(jù)。

此外，曦望同步發(fā)布了面向大模型推理的寰望SC3超節(jié)點解決方案，該方案支持單域256卡一級互聯(lián)，可高效支撐PD分離架構與大EP規(guī)?；渴穑@著提升推理階段的系統(tǒng)利用率與穩(wěn)定性，適配長上下文、多并發(fā)、多專家并行等復雜推理場景。

在交付形態(tài)上，寰望SC3采用全液冷設計，具備極致PUE表現(xiàn)，并支持模塊化交付與快速部署。在同等推理能力量級下，該方案可將整體系統(tǒng)交付成本從行業(yè)常見的億元級，降低至千萬元級，實現(xiàn)一個數(shù)量級的下降。

在軟件層面，曦望構建了與CUDA兼容的基礎軟件體系，覆蓋驅動、運行時API、開發(fā)工具鏈、算子庫和通信庫，降低推理應用的遷移門檻。目前，該體系已適配ModelScope平臺 90% 以上主流大模型形態(tài)，包括DeepSeek、通義千問等。

推理算力如何更好用？云平臺打通落地的“最后一公里”

S3回答了推理性價比的命題，但對于大部分用戶而言，其對算力需求的產(chǎn)品形態(tài)應為云上算力資源，而非裸金屬資源。

讓推理算力更好用，不應止步于造出芯片。為此，曦望與商湯科技、第四范式等生態(tài)伙伴探索的推理云平臺。

通過GPU池化與彈性調度，曦望將底層算力整合為統(tǒng)一的推理算力池，并以MaaS作為核心入口，使企業(yè)無需關注底層硬件配置與集群運維，即可按需調用大模型推理能力。

這一體系也成為“百萬Token 一分錢”推理成本的重要技術基礎。

“推理時代的核心不是把芯片賣出去，而是能否持續(xù)、穩(wěn)定地把算力轉化為可交付的生產(chǎn)力。誰能持續(xù)降低推理成本，誰就掌握了AI產(chǎn)業(yè)的成本曲線?！?/strong>曦望董事長徐冰表示。

據(jù)披露，曦望2025年推理GPU芯片交付量已突破1萬片，標志著其推理GPU路線完成從工程驗證到規(guī)?；桓兜年P鍵跨越。

中國工程院院士、浙江大學信息學部主任吳漢明也指出，推理算力價值的實現(xiàn)離不開協(xié)同，需要芯片設計、系統(tǒng)集成、軟件開發(fā)到產(chǎn)業(yè)應用的全鏈條協(xié)作。

在國產(chǎn)GPU行業(yè)從“拼參數(shù)”走向“拼單位經(jīng)濟成本”的拐點上，曦望選擇以推理為切口，嘗試重構 GPU 的產(chǎn)品形態(tài)與算力交付方式。All-in推理的實踐，正在成為觀察中國推理算力商業(yè)化進程的重要樣本。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權禁止轉載。詳情見轉載須知。

0人收藏

分享：

相關文章

曦望推理算力 AI芯片超節(jié)點

煒燁智算VP孟健雄：推理算力需求12個月內或反超訓練 ...

華為云進入智能計算“芯”時代詮釋算力升級新內涵 ...

CNCC 最后一天，呂建院士精彩報告 + 3 場大會論壇讓 ...

小米車主遭特斯拉車主惡意別車、持續(xù)辱罵，「母親嚇 ...

劉伊倫

編輯

微信YONGGANLL6662，歡迎交流

發(fā)私信

當月熱門文章

真武810E亮相，阿里如何「重構」估值？

云天勵飛發(fā)布未來三年算力芯片戰(zhàn)略：聚焦推理效能升級，全線對標英偉達新一代產(chǎn)品

華東大廠大規(guī)?！附型！笲200租賃訂單；上市AI芯片公司曾「險」被收購；國資智算平臺組建高管天團或求技術自主

推理算力占AI應用70%成本權重，需求爆發(fā)下國產(chǎn)芯片如何定義性價比新基準？

2025中國算力產(chǎn)業(yè)實錄：狂熱、陣痛與價值回歸丨年度盤點

最新文章

2025中國算力產(chǎn)業(yè)實錄：狂熱、陣痛與價值回歸丨年度盤點

存儲成本逼近整機一半，中小手機廠商還有生路嗎？

云天勵飛發(fā)布未來三年算力芯片戰(zhàn)略：聚焦推理效能升級，全線對標英偉達新一代產(chǎn)品

真武810E亮相，阿里如何「重構」估值？

華東大廠大規(guī)?！附型！笲200租賃訂單；上市AI芯片公司曾「險」被收購；國資智算平臺組建高管天團或求技術自主

對話 Mobileye CEO Amnon Shashua：物理AI，Mobileye兩手抓

熱門搜索

vivo 中國移動社交網(wǎng)絡臺積電傳感器 Groupon 工信部蘋果發(fā)布會 Galaxy S4 陌陌創(chuàng)客馬拉松

聯(lián)系我們關于我們意見反饋

下載雷峰網(wǎng)客戶端
iPhone Android

Copyright ? 2011-2026 雷峰網(wǎng) 深圳英鵬信息技術股份有限公司版權所有粵ICP備11095991號辦公電話 0755-26581864

請?zhí)顚懮暾埲速Y料

姓名

電話

郵箱

微信號

作品鏈接

個人簡介

為了您的賬戶安全，請驗證郵箱

您的郵箱還未驗證,完成可獲20積分喲！
重發(fā)郵箱修改郵箱

請驗證您的郵箱

立即驗證

完善賬號信息

您的賬號已經(jīng)綁定，現(xiàn)在您可以設置密碼以方便用郵箱登錄

立即設置 以后再說

感谢您访问我们的网站，您可能还对以下资源感兴趣：
久久精品无码视频|精产国品色情一二三区在线观看|国产性爱自拍视频|亚洲av韩国av|日韩美女一级AAA大片|少妇无码激情诱惑|日韩AV在线播放有码|一级黄片一级黄片|av上一页亲亲久草av|aaa在线观看国产做爱