<ol id="6u1f0"></ol>

_{<tbody id="6u1f0"></tbody>}

英偉達發布Llama-3.1-Nemotron-Ultra-253B-v1模型，推動AI高效部署

業界

2025

04/12

18:19

IT之家

評論

4月12日消息，科技媒體 marktechpost 昨日（4月11日）發布博文，報道稱英偉達發布Llama-3.1-Nemotron-Ultra-253B-v1，這款2530億參數的大型語言模型在推理能力、架構效率和生產準備度上實現重大突破。

隨著AI在數字基礎設施中的普及，企業與開發者需在計算成本、性能與擴展性間尋找平衡。大型語言模型（LLM）的快速發展提升了自然語言理解和對話能力，但其龐大規模常導致效率低下，限制大規模部署。

英偉達最新發布的Llama-3.1-Nemotron-Ultra-253B-v1（簡稱Nemotron Ultra）直面這一挑戰，該模型基于Meta的Llama-3.1-405B-Instruct架構，專為商業和企業需求設計，支持從工具使用到多輪復雜指令執行等任務。

IT之家援引博文介紹，Nemotron Ultra采用僅解碼器的密集Transformer結構，通過神經架構搜索（NAS）算法優化，其創新之處在于采用跳躍注意力機制，在部分層中省略注意力模塊或替換為簡單線性層。

此外，前饋網絡（FFN）融合技術將多層FFN合并為更寬但更少的層，大幅縮短推理時間，同時保持性能。模型支持128K token的上下文窗口，可處理長篇文本，適合高級RAG系統和多文檔分析。

在部署效率上，Nemotron Ultra 也實現突破。它能在單8xH100節點上運行推理，顯著降低數據中心成本，提升企業開發者的可及性。

英偉達通過多階段后訓練進一步優化模型，包括在代碼生成、數學、對話和工具調用等任務上的監督微調，以及使用群體相對策略優化（GRPO）算法進行強化學習（RL）。這些步驟確保模型在基準測試中表現出色，并與人類交互偏好高度契合。

【來源：IT之家】

THE END

廣告、內容合作請點擊這里尋求合作

英偉達

免責聲明：本文系轉載，版權歸原作者所有；旨在傳遞信息，不代表砍柴網的觀點和立場。

相關熱點

美國放棄英偉達H20芯片出口限制：黃仁勛沒辦法高興

隨著中國人工智能的快速發展，美國單純想要靠禁售一些芯片就來阻止無異于癡人說夢。

業界

一夜蒸發1.2萬億：消息稱英偉達H20芯片遭中國限購

3月27日消息，英偉達股價又迎來了大跌，市值一夜蒸發1691億美元（約合人民幣12291億元）。

業界

美媒：DeepSeek激活中國科技業 OpenAI、英偉達或付

北京時間3月26日，彭博社發文稱，DeepSeek的崛起不僅向AI行業展示了無需花費巨資就能構建AI大模型，它還激活了沉寂已久的中國科技行業。

業界

津巴布韋電信大亨與英偉達聯手，將建非洲首個AI工廠

北京時間3月25日，據彭博社報道，津巴布韋電信大亨斯特拉夫·馬希依瓦(Strive Masiyiwa)創建的科技公司Cassava Technologies周一宣布，已與英偉達公司達成合作，計劃在非洲建立首家AI工廠。

業界

英偉達大客戶面臨數百億損失，而黃仁勛拿這件事開了

3月24日，商業內幕發文，英偉達首席執行官黃仁勛上周開了一個玩笑，但他的大客戶們可能不會覺得好笑。

業界

国产乱了高清露脸对白-日韩高清在线一区-激情三级hd中文字幕,亚洲一区二区视频免费观看,亚洲精品色综合av网站,女性私密紧致按摩电影

英偉達發布Llama-3.1-Nemotron-Ultra-253B-v1模型，推動AI高效部署

相關熱點

最新文章

相關推薦

“特斯拉又割了我 7 萬塊”

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！

iPhone 13機模曝光：值得等！

蘋果計劃在美國生產 Apple Car 汽車電池

關注我們

国产乱了高清露脸对白-日韩高清在线一区-激情三级hd中文字幕,亚洲一区二区视频免费观看,亚洲精品色综合av网站,女性私密紧致按摩电影

英偉達發布Llama-3.1-Nemotron-Ultra-253B-v1模型，推動AI高效部署

相關熱點

最新文章

相關推薦

“特斯拉又割了我 7 萬塊”

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！

iPhone 13機模曝光：值得等！

蘋果計劃在美國生產 Apple Car 汽車電池

關注我們

英偉達發布Llama-3.1-Nemotron-Ultra-253B-v1模型，推動AI高效部署

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！

iPhone 13機模曝光：值得等！