
發(fā)布
注冊
/
登錄端側(cè)大模型
關(guān)注創(chuàng)建者:匿名 創(chuàng)建時間:2026-01-04

端側(cè)大模型的實例教程
為此,Gen-AI Model Hub全面擴(kuò)容,模型數(shù)量在原有基礎(chǔ)上激增了3.3倍,并支持DeepSeek-R1蒸餾模型、通義千問、混元等多種先進(jìn)端側(cè)大模型,還包含視覺、語言、多模態(tài)等多種多樣的大模型,開發(fā)者可以通過Gen-AI Model Hub一鍵調(diào)用模型能力,讓AI應(yīng)用開發(fā)選擇更豐富。
為了讓開發(fā)者免受即有模型庫的限制,聯(lián)發(fā)科還首發(fā)了開源彈性架構(gòu)。區(qū)別于過往的開放接口,只能部署特定架構(gòu)模型,開放彈性架構(gòu)允許開發(fā)者直接調(diào)整平臺源代碼,無需等待芯片廠商的支持,即可完成目標(biāo)或其他自研大模型輕松部署。讓AI應(yīng)用開發(fā)不用“等平臺”,徹底釋放開發(fā)效率和模型接入自由度。
自DeepSeek橫空出世以來,這種更適合端側(cè)部署,回答效率更高效的訓(xùn)練模式快速引爆了AI行業(yè),主流大模型紛紛加強(qiáng)了推理能力。天璣AI開發(fā)套件2.0全面支持 DeepSeek四大關(guān)鍵技術(shù):混合專家模型(MoE)、多Token預(yù)測(MTP)多頭潛在注意力(MLA)、FP8推理(FP8 Inferencing),實現(xiàn)Token產(chǎn)生速度提升2倍以上、內(nèi)存帶寬占用量大幅度降低50%,讓端側(cè)AI推理更聰明、響應(yīng)更迅速。
天璣AI開發(fā)套件2.0還首次引入基于NPU的端側(cè)LoRA訓(xùn)練,開發(fā)者在天璣NPU上進(jìn)行運(yùn)算訓(xùn)練,相比基于CPU的訓(xùn)練方案,訓(xùn)練速度猛增50倍,將訓(xùn)練時間從一整天縮短至半小時。更快的端側(cè)LoRA訓(xùn)練,讓端側(cè)AI基于用戶端側(cè)數(shù)據(jù)提升個性化體驗,讓終端成為更懂用戶的個性化智慧伙伴。
智能體用戶體驗的進(jìn)化,從生態(tài)整合與攜手躍遷開始
本次MDDC 2025,聯(lián)發(fā)科不僅帶來了更加強(qiáng)大、全面的開發(fā)者解決方案,更展示了不斷拓展的天璣AI生態(tài)。
展開 區(qū)別于傳統(tǒng)展會的技術(shù)堆砌,本次展會以“智融共生,賦能千行”為核心定位,聚焦人工智能與機(jī)器人技術(shù)的融合創(chuàng)新成果,設(shè)置六大特色展區(qū),全方位呈現(xiàn)行業(yè)前沿動態(tài)與落地實踐。在核心技術(shù)展區(qū),觀眾將近距離接觸具身智能大模型、高端AI芯片、機(jī)器人核心零部件等“硬核科技”,其中采用高通躍龍QCS8550芯片平臺的人形機(jī)器人原型機(jī)將驚艷亮相,其“大小腦”一芯解決方案,實現(xiàn)端側(cè)大模型與運(yùn)動控制等多任務(wù)的單芯片集成,破解行業(yè)核心發(fā)展瓶頸,展現(xiàn)“AI+芯片+生態(tài)”的創(chuàng)新模式魅力。
應(yīng)用場景展區(qū)則打破“技術(shù)與現(xiàn)實脫節(jié)”的壁壘,打造沉浸式體驗空間,全面展示人工智能與機(jī)器人在工業(yè)制造、民生服務(wù)、政務(wù)管理、智慧農(nóng)業(yè)等多領(lǐng)域的規(guī)模化應(yīng)用成果。在這里,可看到交通勸導(dǎo)機(jī)器人在街頭精準(zhǔn)引導(dǎo)通行、輔助民警執(zhí)勤的真實模擬場景,感受其多模態(tài)感知與智能交互能力;可近距離觀察六軸機(jī)械臂與自主移動機(jī)器人協(xié)同作業(yè),見證物流分揀效率較傳統(tǒng)模式提升4倍以上的產(chǎn)業(yè)變革;還能體驗幼教機(jī)器人、醫(yī)療輔助機(jī)器人等民生產(chǎn)品,直觀感受科技為生活帶來的便捷與溫度。
作為展會的核心亮點(diǎn)之一,同期舉辦的系列論壇活動將匯聚院士專家、行業(yè)領(lǐng)袖、企業(yè)高管及科研學(xué)者,圍繞具身智能發(fā)展、AI與機(jī)器人融合路徑、產(chǎn)業(yè)倫理治理、核心技術(shù)突破等行業(yè)熱點(diǎn)議題展開深度研討。其中,全球人工智能領(lǐng)袖峰會將聚焦全球產(chǎn)業(yè)發(fā)展格局,解讀政策導(dǎo)向與市場趨勢;人形機(jī)器人產(chǎn)業(yè)鏈協(xié)同峰會將搭建上下游對接平臺,推動核心技術(shù)協(xié)同攻關(guān)與供應(yīng)鏈完善;創(chuàng)新成果轉(zhuǎn)化專區(qū)則為科創(chuàng)團(tuán)隊、中小企業(yè)提供項目路演、投融資對接服務(wù),助力技術(shù)成果快速落地,培育產(chǎn)業(yè)新勢力。
展開 今年,聯(lián)發(fā)科更帶來了橫跨AI應(yīng)用和游戲開發(fā)的全家桶套裝——一站式可視化智能開發(fā)工具:天璣開發(fā)工具集(Dimensity Development Studio),包含針對AI開發(fā)與模型調(diào)優(yōu)的 Neuron Studio 和針對游戲性能分析的Dimensity Profiler。
其中,Neuron Studio是一款A(yù)I應(yīng)用全流程開發(fā)工具,可針對模型到應(yīng)用,為開發(fā)者提供一站式、全鏈路、自動化的開發(fā)協(xié)助。Neuron Studio整合了多個MLKit具,將關(guān)鍵模塊融合成一站式、可視化的完整開發(fā)鏈路,讓開發(fā)者用一套工具就能完成模型開發(fā),大幅提升開發(fā)效率。神經(jīng)網(wǎng)絡(luò)自動化調(diào)優(yōu)則可將性能和內(nèi)存占用自動優(yōu)化到最佳配置,開發(fā)者可全程監(jiān)控大模型演化過程,讓模型和端側(cè)平臺適配省心、省力、省時間。開發(fā)者可以通過跨模型全鏈路分析功能,獲得全局視角和執(zhí)行流程,大幅節(jié)省模型分析時間。
為加速實現(xiàn)智能體化用戶體驗愿景,聯(lián)發(fā)科還在會上為開發(fā)者帶來了全新升級后的AI應(yīng)用開發(fā)武器庫——天璣AI開發(fā)套件2.0,以更大的模型庫規(guī)模、更開放的架構(gòu)、更前沿的端側(cè)AI技術(shù)和端側(cè)LoRA訓(xùn)練落地等四個維度,為開發(fā)者提供更全面、更開放、更強(qiáng)大的端側(cè)AI開發(fā)解決方案。
其中,全新升級的Gen-AI Model Hub模型庫模型數(shù)量激增3.3倍,并且支持最新的Deepseek-R1蒸餾模型、通義千問、混元等先進(jìn)端側(cè)大模型;突破性的開源彈性架構(gòu),讓開發(fā)者可以通過開放架構(gòu),直接調(diào)整平臺源代碼,無需等待芯片的支持,就可以完成大模型的輕松部署。
而且,天璣AI開發(fā)套件2.0全面支持DeepSeek四大關(guān)鍵技術(shù),為端側(cè)推理提升2倍token生成速度,同時可節(jié)省50%內(nèi)存帶寬占用。
展開 大模型進(jìn)入游戲世界的呼聲越來越高,但要真正把AI從“輔助能力”升級為“核心玩法”,仍是一道系統(tǒng)級難題——高資源占用、高推理功耗、高算力門檻,每一項都讓移動平臺倍感壓力。
要想讓“AI游戲”不只是概念,底層就必須先打牢。聯(lián)發(fā)科圍繞天璣平臺,構(gòu)建了一套面向AI融合的落地路徑:以旗艦芯片硬件為底座,通過星速引擎與 Dimensity Profiler 的組合,實現(xiàn)高效的算力調(diào)度與性能釋放;再疊加天璣AI開發(fā)套件2.0與 Neuron Studio 工具鏈,對大模型進(jìn)行結(jié)構(gòu)壓縮與推理優(yōu)化,把推理、部署效率提上去,讓AI真正“住得進(jìn)”手機(jī)。
更重要的是,這些技術(shù)正在逐步變成真實可玩的體驗。在《王者榮耀》中,聯(lián)發(fā)科技攜手王者榮耀、騰訊游戲語音團(tuán)隊,首發(fā)端側(cè)AI實時語音轉(zhuǎn)文字功能,使端側(cè)語音轉(zhuǎn)換速度較云端提升45%,做到“語歇字到,指令即發(fā)”;而在《永劫無間手游》中,聯(lián)發(fā)科攜手網(wǎng)易伏羲實驗室,將大模型端側(cè)落地,玩家一句語音就能讓NPC即時響應(yīng)、戰(zhàn)斗配合、陪伴動作,一個真正“能交流、會協(xié)作”的AI搭子誕生了。
隨著AI在玩法設(shè)計中扮演的角色日益重要,聯(lián)發(fā)科正用軟硬協(xié)同的全鏈路開發(fā)體系,把“AI+游戲”的想象一步步變成現(xiàn)實,為移動游戲行業(yè)打開一個通往AI時代的新入口。
技術(shù)之上,是生態(tài)的躍遷
當(dāng)AI正式走進(jìn)游戲玩法、體驗,技術(shù)閉環(huán)之外,更大的進(jìn)化也隨之開啟——那就是生態(tài)的躍遷。從芯片性能突破,開發(fā)、分析、調(diào)優(yōu)工具革新,到AI深度融合與光追等先進(jìn)技術(shù)落地,聯(lián)發(fā)科正用一整套系統(tǒng)化能力,推動移動游戲體驗跨入次時代。
在 MDDC 2025 上,游戲無疑是天璣AI能力最具張力的落地場景。技術(shù)的每一次突破,都在這里成為“真體驗”。
展開 
端側(cè)大模型的相關(guān)專題、標(biāo)簽、搜索
端側(cè)大模型的最新內(nèi)容
在核心技術(shù)展區(qū),觀眾將近距離接觸具身智能大模型、高端AI芯片、機(jī)器人核心零部件等“硬核科技”,其中采用高通躍龍QCS8550芯片平臺的人形機(jī)器人原型機(jī)將驚艷亮相,其“大小腦”一芯解決方案,實現(xiàn)端側(cè)大模型與運(yùn)動控制等多任務(wù)的單芯片集成,破解行業(yè)核心發(fā)展瓶頸,展現(xiàn)“AI+芯片+生態(tài)”的創(chuàng)新模式魅力。
而其中,天璣9400+等旗艦芯片無疑是整個體系的核心算力引擎:AI性能較前代提升25%、推理解碼能力增強(qiáng)20%,輕松托起通用AI運(yùn)算和端側(cè)大模型的需求;這顆天璣旗艦芯片的圖形方面繼續(xù)扛起安卓GPU之王的大旗,在天璣星速引擎游戲技術(shù)的加持下,帶給玩家“滿幀一條線、功耗一路降”的超爽體驗。
其中,全新升級的Gen-AI Model Hub模型庫模型數(shù)量激增3.3倍,并且支持最新的Deepseek-R1蒸餾模型、通義千問、混元等先進(jìn)端側(cè)大模型;突破性的開源彈性架構(gòu),讓開發(fā)者可以通過開放架構(gòu),直接調(diào)整平臺源代碼,無需等待芯片的支持,就可以完成大模型的輕松部署。
聯(lián)發(fā)科與OPPO深度合作,共同研發(fā),借助天璣AI開發(fā)套件中支持DeepSeek的四大關(guān)鍵技術(shù),快速實現(xiàn)MoE技術(shù)的端側(cè)部署,Token產(chǎn)生速度提升了40%,讓端側(cè)大模型擁有更高的計算效率和推理性能,使端側(cè)AI交互響應(yīng)更及時,用戶體驗更貼心。