
發布
注冊
/
登錄端側
關注創建者:越狗牛逼 創建時間:2021-03-10

端側的實例教程
天璣AI開發套件 2.0,全面釋放天璣端側AI能力
去年,天璣AI開發套件一經發布就廣受開發者好評和推薦。在MDDC 2025上,聯發科帶來了全面升級的天璣AI開發套件2.0,在模型庫規模、架構開放程度、前沿端側AI技術支持和端側LoRA訓練落地等方面均迎來全面躍遷,為開發者提供了更全面、更開放、更強大的端側AI開發解決方案。
端側AI應用開發往往需要調用各種各樣的大模型能力,需要更豐富、類型更多的模型適配。為此,Gen-AI Model Hub全面擴容,模型數量在原有基礎上激增了3.3倍,并支持DeepSeek-R1蒸餾模型、通義千問、混元等多種先進端側大模型,還包含視覺、語言、多模態等多種多樣的大模型,開發者可以通過Gen-AI Model Hub一鍵調用模型能力,讓AI應用開發選擇更豐富。
為了讓開發者免受即有模型庫的限制,聯發科還首發了開源彈性架構。區別于過往的開放接口,只能部署特定架構模型,開放彈性架構允許開發者直接調整平臺源代碼,無需等待芯片廠商的支持,即可完成目標或其他自研大模型輕松部署。讓AI應用開發不用“等平臺”,徹底釋放開發效率和模型接入自由度。
自DeepSeek橫空出世以來,這種更適合端側部署,回答效率更高效的訓練模式快速引爆了AI行業,主流大模型紛紛加強了推理能力。天璣AI開發套件2.0全面支持 DeepSeek四大關鍵技術:混合專家模型(MoE)、多Token預測(MTP)多頭潛在注意力(MLA)、FP8推理(FP8 Inferencing),實現Token產生速度提升2倍以上、內存帶寬占用量大幅度降低50%,讓端側AI推理更聰明、響應更迅速。
展開 神經網絡自動化調優則可將性能和內存占用自動優化到最佳配置,開發者可全程監控大模型演化過程,讓模型和端側平臺適配省心、省力、省時間。開發者可以通過跨模型全鏈路分析功能,獲得全局視角和執行流程,大幅節省模型分析時間。
為加速實現智能體化用戶體驗愿景,聯發科還在會上為開發者帶來了全新升級后的AI應用開發武器庫——天璣AI開發套件2.0,以更大的模型庫規模、更開放的架構、更前沿的端側AI技術和端側LoRA訓練落地等四個維度,為開發者提供更全面、更開放、更強大的端側AI開發解決方案。
其中,全新升級的Gen-AI Model Hub模型庫模型數量激增3.3倍,并且支持最新的Deepseek-R1蒸餾模型、通義千問、混元等先進端側大模型;突破性的開源彈性架構,讓開發者可以通過開放架構,直接調整平臺源代碼,無需等待芯片的支持,就可以完成大模型的輕松部署。
而且,天璣AI開發套件2.0全面支持DeepSeek四大關鍵技術,為端側推理提升2倍token生成速度,同時可節省50%內存帶寬占用。天璣AI開發套件2.0還首次引入端側LoRA訓練,讓AI模型在端側即可完成遷移學習,相比利用CPU進行訓練的方案,在天璣NPU上訓練速度狂暴提升50倍,端側LoRA訓練從此告別漫長等待。
更震撼的是,天璣AI開發套件已經接入NVIDIA TAO生態圈,實現TAO生態和天璣AI生態的全面打通,開發者有機會輕松獲取更多NVIDIA TAO生態的AI開發資源,實現一次開發,全域應用的生態破圈,雙方未來共同賦能端側AI生態。
展開 行業首個端側應用70億參數大模型,大模型手機進入快車道
面向快速發展的大模型技術,OPPO繼在ODC正式推出自主訓練的大模型——AndesGPT之后,此次也宣布將在 Find X7 系列上實現行業首個端側應用的70億參數的模型,通過高精度 4bit 量化等模型壓縮,推理引擎的加速,以及與芯片平臺深度合作的硬件加速方式,第一次為手機端側帶來完全體的70億參數大模型,徹底變革手機端側 AI 的使用方式。
OPPO軟件創新中心總經理張峻表示:“OPPO 自主訓練的、個性專屬大模型——AndesGPT 包含了從十億到千億級參數的多種版本,知識儲備豐富、擁有無限記憶、也善用工具;端云協同的技術架構,可以支撐多元化的應用場景。在多種技術的配合下,我們也將會在Find X7系列首次實現端側應用70億參數的大語言模型,以及生成式的視覺模型,在保障用戶隱私安全的情況下,帶來響應更快、處理能力更強、生成質量更高的本地AI體驗。”
得益于完整的端側應用的 AndesGPT 70億參數大語言模型,Find X7 系列將帶來自然語言理解、文本內容摘要、通話語音摘要等下一代的AI體驗。相比于同平臺其他模型,OPPO AndesGPT 70億參數大語言模型可以在200字首字生成帶來20倍的更快響應,面向2000字首字生成也可以實現2.5倍的更快速度。
同時,OPPO 的AndesGPT 可以實現最高14,000的摘要字數上限,達到了同平臺其他模型的3.5倍。在生成質量方面,相比于10億參數模型,AndesGPT 70億參數大語言模型以更高“智商”的理解能力,為通話摘要能力上帶來更完整、更準確的記錄。
展開 自2022年首發移動端硬件光追方案以來,聯發科一路從支持60幀,到如今率先突破90幀光追,持續拓寬手機光影表現的邊界。在與《暗區突圍》的合作中,仿生細節再次突破,達到了PC級的骨骼模型效果,將動態光影延伸至人物和環境之間的每一個細節,為玩家帶來“如影隨形”的真實沉浸感。
游戲 × AI:構建“更互動”的次世代玩法
當畫質、幀率、能效都拉滿之后,玩家還想要什么?答案必然藏在AI身上。大模型進入游戲世界的呼聲越來越高,但要真正把AI從“輔助能力”升級為“核心玩法”,仍是一道系統級難題——高資源占用、高推理功耗、高算力門檻,每一項都讓移動平臺倍感壓力。
要想讓“AI游戲”不只是概念,底層就必須先打牢。聯發科圍繞天璣平臺,構建了一套面向AI融合的落地路徑:以旗艦芯片硬件為底座,通過星速引擎與 Dimensity Profiler 的組合,實現高效的算力調度與性能釋放;再疊加天璣AI開發套件2.0與 Neuron Studio 工具鏈,對大模型進行結構壓縮與推理優化,把推理、部署效率提上去,讓AI真正“住得進”手機。
更重要的是,這些技術正在逐步變成真實可玩的體驗。在《王者榮耀》中,聯發科技攜手王者榮耀、騰訊游戲語音團隊,首發端側AI實時語音轉文字功能,使端側語音轉換速度較云端提升45%,做到“語歇字到,指令即發”;而在《永劫無間手游》中,聯發科攜手網易伏羲實驗室,將大模型端側落地,玩家一句語音就能讓NPC即時響應、戰斗配合、陪伴動作,一個真正“能交流、會協作”的AI搭子誕生了。
隨著AI在玩法設計中扮演的角色日益重要,聯發科正用軟硬協同的全鏈路開發體系,把“AI+游戲”的想象一步步變成現實,為移動游戲行業打開一個通往AI時代的新入口。
展開 從深鑒科技的技術路線——基于Xilinx的FPGA硬件進行開發,實現端側智能。圖一為深鑒科技開發的智能IPC
深度學習加速模塊,可以把深度學習網絡部署在里面并嵌入在攝像頭實現人臉識別。
圖一智能IPC深度學習加速模塊
Source:深鑒科技官網2018.7
無論深鑒科技實際上是否直接參與了FPGA的電路設計,還是直接委托Xilinx直接幫其設計出需要的FPGA。深鑒科技可以說在硬件方面方面,站在了Xilinx這個巨人的肩膀之上,再進行FPGA的嵌入式開發,實現深度學習網絡的部署,實現AI的功能。
目前“云+端”的模式,成為眾AI公司發展的趨勢。過去的方案實施中,AI處理工作在云端完成。把其中某一部分任務(例如推斷部分)放在智能邊緣端(讓設備擁有芯片,進行AI推斷部分),就變得更加高效,尤其像安防領域,自動駕駛領域,實時性要求極高的應用中。則端側智能的部署是市場的趨勢。圖二為“云+端”示意圖解:
圖二AI應用落地的“云+端”模式
Source:集邦咨詢2018.7
想實現端側AI的部署,從定制芯片硬件來看,有兩個路線:1.如上述所說,用FPGA開發(半定制)2.設計ASIC定制集成電路芯片。我們可以拉入另外兩家中國的AI明星公司:寒武紀和地平線進行簡單討論。
根據深鑒科技聯合創始人姚頌所述,寒武紀選取了機器學習這根軸上最通用的方向,就是所有機器學習的訓練和應用都要做;地平線有很強的算法團隊,于是選擇了軸上截然相反的另一端,也就是最專用的方向,去做算法固化的ASIC芯片;而深鑒科技則是在中間取了一個點,做深度學習的應用處理器。
寒武紀擁有中科院計算所背景,以diannao系列架構獲多個頂級會議的最佳論文。
展開 
端側的最新內容
在核心技術展區,觀眾將近距離接觸具身智能大模型、高端AI芯片、機器人核心零部件等“硬核科技”,其中采用高通躍龍QCS8550芯片平臺的人形機器人原型機將驚艷亮相,其“大小腦”一芯解決方案,實現端側大模型與運動控制等多任務的單芯片集成,破解行業核心發展瓶頸,展現“AI+芯片+生態”的創新模式魅力。
端云協同的技術架構在此全景呈現,多款終端設備可實現離線復雜推理,兼顧實時響應、能效優化與隱私防護,構建起“云端訓練、端側響應”的高效AI生態體系。
展會不止于靜態展品陳列,沉浸式互動體驗讓每一位參觀者都能化身科技參與者。
接觸靜力分析收斂的解決方案《案例》10個月前
2、本示例卡扣公母配合進行卡扣力分析,左端面一側綁定rp參考點,并向右20mm推進距離,右端一側固定。
3、使用abaqus靜力分析工況,計算時間1s,初始增量步0.05s,最小增量步1e-10s,最大增量步0.1s。
4、計算容易出現不收斂現象,通常計算到關鍵時候,由于無法繼續迭代,導致分析沒能繼續進行出現發散。
在《王者榮耀》中,聯發科技攜手王者榮耀、騰訊游戲語音團隊,首發端側AI實時語音轉文字功能,使端側語音轉換速度較云端提升45%,做到“語歇字到,指令即發”;而在《永劫無間手游》中,聯發科攜手網易伏羲實驗室,將大模型端側落地,玩家一句語音就能讓NPC即時響應、戰斗配合、陪伴動作,一個真正“能交流、會協作”的AI搭子誕生了。
從率先落地端側AI大模型,到打造天璣AI智能體化引擎,聯發科一直跑在行業最前沿。去年發布的天璣9400不僅端側AI算力行業領先,還首發了端側視頻生成、端側LoRA訓練、端側魔法動圖等多項先進的AI技術。在今年的MWC大會期間,天璣9400斬獲了GTI的國際大獎,可謂實至名歸。
天璣AI開發套件2.0還首次引入基于NPU的端側LoRA訓練,開發者在天璣NPU上進行運算訓練,相比基于CPU的訓練方案,訓練速度猛增50倍,將訓練時間從一整天縮短至半小時。更快的端側LoRA訓練,讓端側AI基于用戶端側數據提升個性化體驗,讓終端成為更懂用戶的個性化智慧伙伴。
在螺栓側端面施加2000N載荷(無螺栓預緊力)。需要提取螺栓在連接面處所受到的載荷包括:力和力矩。
載荷提取結果:
1.螺栓連接面位置作用力
2.螺栓連接面位置因載荷分布不均產生的彎矩
詳細步驟:
1.螺栓連接面位置的載荷提取,需要在結果輸出中打開節點力輸出項“Nodal Forces-Yes”
2.需要在螺栓連接面位置創建局部坐標系和虛擬結構面
它這側的端面是Z軸方向固定的,不能移動;軸上這4個弧面是X軸和Y軸方向固定的;
圖10 導葉幾何模型
b. 點擊邊界條件后的加號,位移/旋轉,對象選擇這個端面,點擊位移的Z方向,保持默認的0,確定;
圖11 邊界條件設置
c. 選擇軸上這四個曲面,點擊位移的X和Y方向,保持默認的0,確定。邊界就加好了;
圖12 邊界條件設置
d.
圖3 產品裂解圖
(3) 應力評價
采用鹽酸對樣品進行應力評價,如圖3所示,酸蝕后的OK件底端、側端均出現橫向裂紋;OK件側端、OK件頂端出現由內向外的應力開裂。表明制件在這些位置存在較大的內應力,容易產生應力集中。
行業首個端側應用70億參數大模型,大模型手機進入快車道
面向快速發展的大模型技術,OPPO繼在ODC正式推出自主訓練的大模型——AndesGPT之后,此次也宣布將在 Find X7 系列上實現行業首個端側應用的70億參數的模型,通過高精度 4bit 量化等模型壓縮,推理引擎的加速,以及與芯片平臺深度合作的硬件加速方式,第一次為手機端側帶來完全體的70億參數大模型,徹底變革手機端側 AI 的使用方式