久久精品无码视频|精产国品色情一二三区在线观看|国产性爱自拍视频|亚洲av韩国av|日韩美女一级AAA大片|少妇无码激情诱惑|日韩AV在线播放有码|一级黄片一级黄片|av上一页亲亲久草av|aaa在线观看国产做爱

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
芯片 正文
發(fā)私信給劉伊倫
發(fā)送

0

DeepSeek出圈,AI模型開啟終端側「范式轉移」

本文作者: 劉伊倫   2025-03-07 17:04
導語:未來,AI智能體就是唯一與終端用戶交互的UI。

“在資源受限的端側,有了DeepSeek的蒸餾模型之后,比如原來只能部署7B模型的場景,現在能達到14B模型的效果,讓端側AI的能力上一個臺階?!毙酒こ處熣苡钫J為DeepSeek的出現對生成式AI的普及意義重大。

DeepSeek的出現讓終端側AI的表現超越了一年前僅能在云端運行的模型,端側AI蓄勢待發(fā),高通作為連接和計算領域的領導者,也正在加速終端側AI時代的到來。

去年,高通公司總裁兼CEO安蒙(Cristiano Amon)就表示,“AI推理正在向數據所產生的邊緣側轉移。邊緣側和終端側AI實現了AI功能的擴展,提升了AI的性能和效率。它兼具即時性、可靠性和極低時延。數據保留在終端,有助于保障隱私性和個性化?!?/strong>

最近高通發(fā)布《AI變革正在推動終端側推理創(chuàng)新》白皮書后,高通公司高級副總裁兼技術規(guī)劃和邊緣解決方案業(yè)務總經理馬德嘉(Durga Malladi)表示,AI推理和處理正在全面向終端側轉移。而從硬件、軟件到生態(tài)的全面適配,高通將加速終端側AI時代的到來。

高通也正在引領端側AI多模態(tài)的發(fā)展。2025年世界移動通信大會(MWC 2025)上,搭載驍龍8至尊版的智能手機演示了采用AI智能體作為用戶界面,對音樂、導航、天氣和信息等任務的處理。搭載驍龍X系列的商用PC,也具備多模態(tài)AI的能力。

DeepSeek「降本增效」,AI正在成為終端側新的UI

終端側AI是將AI直接部署在終端設備上,對本地數據進行處理、分析以及決策。在過去一段時間里,終端側AI的發(fā)展受制于模型部署需要消耗大算力、占用存儲空間以及高昂的開發(fā)成本。

DeepSeek出現后,高效“小”模型開始涌現,新的蒸餾模型,保持準確性的同時遷移知識,實現更快的推理速度、更少的內存占用和更低的算力需求,讓端側AI也能有媲美云端AI的效果。

LiveBench.ai數據顯示,對比同為700億參數的Llama 3.3和DeepSeek R1蒸餾模型各項性能表現,結果顯示蒸餾能夠在推理、編程、數學和數據分析任務中顯著提高性能。

DeepSeek出圈,AI模型開啟終端側「范式轉移」

蒸餾小模型與前沿大模型的性能差距正在縮小,量化、壓縮和剪枝等進一步優(yōu)化技術,推動了較小的高質量生成式AI模型的激增,在2024年發(fā)布的大規(guī)模AI模型中,超過75%的模型參數在千億規(guī)模以下。

豐富的小模型為邊緣AI開發(fā)者提供了多樣化的選擇,以用于開發(fā)應用和AI智能體。

“這意味著我們關注的焦點已不再是模型本身,而是演進到終端上的應用發(fā)展。”馬德嘉說,“隨著終端側可以運行越來越多高質量的AI模型,越來越多的AI應用和用例開始涌現。AI正在重新定義所有終端的用戶界面,這也意味著,AI正在成為終端側新的UI?!?/strong>

DeepSeek出圈,AI模型開啟終端側「范式轉移」

未來,不同的信息輸入類型將不直接應用于某個具體的App,而是先傳輸到AI智能體,AI智能體接收后再將工作負載分配給后臺的不同應用,所有的處理任務都將由AI智能體直接完成。

對于終端用戶來講,AI智能體就是唯一在前端與他們交互的UI,而所有實際應用的處理都是在后臺完成的,用戶全程“無感”。

除了簡化原有的APP交互之外,AI智能體對復雜任務的推理同樣讓用戶體驗“絲滑”。馬德嘉在驍龍8至尊版剛發(fā)布時表示:“智能體能夠執(zhí)行更加復雜的任務,尤其是那些指令不明確的任務?!?/strong>

引領AI推理——軟硬件「協(xié)同」以及AI Hub「加持」

如何突破算力以及應用生態(tài)的限制助力終端側AI的發(fā)展?構建硬件、軟件及生態(tài)協(xié)同的全面解決方案是高通給出的答案。

追求高效處理、保持電池續(xù)航對終端側AI的用例至關重要,高通通過提供集成定制CPU、NPU、GPU和低功耗子系統(tǒng)的SoC芯片,在硬件層面實現能效與功耗的雙重性能優(yōu)勢。

馬德嘉表示,有些友商可能在他們所屬的領域里比較出色,但是鮮有廠商能像我們一樣,同時具有行業(yè)一流的CPU、GPU和NPU,這是我們獨特的優(yōu)勢。

以最新發(fā)布的驍龍8至尊版移動平臺為例,其自研的第二代高通Oryon CPU性能較上一代提升45%、Hexagon NPU AI性能和能效均提升45%,而最新的Adreno GPU性能提升40%,且功耗降低40%。

在搭載驍龍8至尊版的最新智能手機上,我們已經看到了諸多創(chuàng)新的AI智能體應用涌現,以小米15系列為例,其AI智能體“超級小愛”推出兩項AI功能,“AI記憶能力”可以協(xié)助用戶管理個人信息、日程及收藏等,“多模態(tài)交互能力”則讓超級小愛能理解屏幕中的信息并進行交互反饋。

而為了在平臺上充分釋放AI潛能,高通構建了強大的AI軟件棧與之協(xié)同。軟硬件協(xié)同讓高通構建出更強的競爭力,資深AI從業(yè)者對雷峰網(公眾號:雷峰網)表示,同樣實現一個功能,代碼寫得好,效率就會高很多。

高通構建的AI軟件棧包括庫、SDK和優(yōu)化工具,能夠簡化模型部署流程并提高性能。以圖像生成為例,圖像擴散模型Stable Diffusion通過高通AI Stack進行全棧式AI優(yōu)化,結合驍龍平臺上的NPU等領先AI處理器組件,兩年前就能在終端側于15秒內完成20步推理生成AI圖像,無需訪問云端,為用戶提供高效且可靠的交互式體驗。如今,驍龍平臺已經支持在終端側運行高達100億參數的模型和70億參數的多模態(tài)大模型。

“開發(fā)者不需要知道硬件端的具體設計細節(jié)?!?/strong>馬德嘉說,“他們需要的是軟件工具庫支持、讓他們能夠按照自己所需,非常自由、靈活地選擇他們所需的框架、runtime和工具,面向任何操作系統(tǒng)設計AI應用和智能體?!?/strong>

通過遵循開發(fā)者為中心的策略,高通為開發(fā)者簡化了在消費和商用產品中集成先進AI特性的過程,幫助開發(fā)者加速創(chuàng)新。

而為了向各行各業(yè)實現規(guī)?;疉I擴展,則需要推動開發(fā)者創(chuàng)新走向生態(tài)式創(chuàng)新,高通與全球AI模型廠商積極合作,并推出高通AI Hub。

馬德嘉表示:“目前已有超過1500家企業(yè)在使用高通AI Hub,比如Meta、Allam、OpenAI等。此外,還有許多服務和軟件提供商合作,如AWS、dataloop、IBM Watsonx、Nota AI等。豐富多元的合作伙伴,讓高通AI Hub在能夠運行的模型數量、支持的模型廠商數量和整個生態(tài)系統(tǒng)的合作方面取得了長足的進步?!?/p>

DeepSeek出圈,AI模型開啟終端側「范式轉移」

高通AI Hub支持主流大語言模型和多模態(tài)大模型,讓開發(fā)者可在搭載高通平臺的終端上部署、優(yōu)化和管理推理任務。

馬德嘉表示,高通AI Hub讓應用開發(fā)變得非常簡單,高通提供大量的軟件工具、模型庫、編譯器,開發(fā)者可以編寫生成應用并在高通提供的免費云端設備場上進行測試,最終完成部署。高通要做的就是極大簡化邊緣側AI開發(fā)者的整個開發(fā)流程。

借助預優(yōu)化模型庫和支持定制模型優(yōu)化與集成等特性,不僅縮短開發(fā)周期,同時增強了與廣泛AI生態(tài)的兼容性。

“我們和全球各個地區(qū)的眾多開源和閉源模型廠商展開了廣泛的合作?!瘪R德嘉說,“這讓我們能夠和生態(tài)系統(tǒng)實現非常緊密的結合,并且在實施我們的AI發(fā)展戰(zhàn)略和推動生成式AI創(chuàng)新方面擁有獨特優(yōu)勢?!?/strong>

多終端覆蓋,高通讓智能計算「無處不在」

智能手機被認為是最普適的終端設備,驍龍8至尊版讓AI智能體變成手機上的“原生應用”,在通信優(yōu)化、圖像生成以及其他個性化功能上進行助力。

在MWC 2025上,榮耀發(fā)布全球首款圖形界面移動AI助手“榮耀AI agent”,這款AI助手通過深度學習用戶習慣,能智能識別用戶的需求和意圖,自動化地進行任務安排。比如,榮耀AI Agent可以在用戶和朋友的聊天中讀取上下文,根據用戶的地點和偏好來選擇餐廳,并為用戶實時預定。這種便捷的交互體驗,讓用戶真正感受到AI技術如何在日常生活中發(fā)揮作用。這也正是高通在驍龍8至尊版發(fā)布時,對接下來終端側智能體體驗發(fā)展的預測。

需求的演進讓終端形態(tài)走向多元,智能手機之外,PC、平板電腦及汽車同樣覆蓋大量消費者,AI眼鏡、XR以及IoT設備則方興未艾。

驍龍X系列平臺搭載的領先NPU,擁有45TOPS的行業(yè)領先AI算力,能夠為Windows應用帶來推理加速,并率先支持諸多Windows 11 AI+PC先進特性,帶來性能、續(xù)航及隱私保護上的全面優(yōu)化。

驍龍數字底盤解決方案則利用先進攝像頭、生物識別、環(huán)境傳感器以及先進的多模態(tài)AI網絡,提供根據駕駛員狀態(tài)和環(huán)境條件而調整的實時反饋和功能,從而增強汽車安全和駕駛體驗。

面對工業(yè)互聯(lián)網的隱私性和數據安全問題,高通推出的Qualcomm AI本地設備解決方案和Qualcomm AI推理套件讓敏感客戶數據、調優(yōu)模型和推理負載能夠保留在本地,增強隱私性、可控性、能效和低時延。

“從移動到汽車、PC、XR以及IoT終端,我們都有一系列出色的產品?!瘪R德嘉說,“對于開發(fā)者來說,使用搭載驍龍平臺的終端進行開發(fā)的優(yōu)勢在于能夠獲得更廣闊的應用開發(fā)和規(guī)?;瘮U展空間,并且擁有非常全面的產品線選擇。”

然而,面對多個不同的終端,開發(fā)者擔心“多端部署”所帶來的兼容性挑戰(zhàn)。

對此,馬德嘉表示:“開發(fā)者不用面向不同平臺進行重復開發(fā),只需一次開發(fā),即可輕松實現跨多平臺部署。進入高通AI Hub后,開發(fā)者首先可以看到高通AI Hub所支持的所有不同細分領域的芯片平臺,如果對PC感興趣,就選擇需要的PC芯片平臺,并選擇想要運行的模型,你會看到你在PC平臺上所選擇的模型能夠支持的其他的芯片平臺?!?/strong>

在DeepSeek帶來的發(fā)展浪潮之下,智能手機、PC、汽車、AI眼鏡以及IoT等各類終端的AI功能將被重新定義,一個以終端側AI為主導的AI行業(yè)新格局正在形成。 

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
完善賬號信息
您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄