国产乱了高清露脸对白-日韩高清在线一区-激情三级hd中文字幕,亚洲一区二区视频免费观看,亚洲精品色综合av网站,女性私密紧致按摩电影

英偉達(dá)發(fā)布Llama-3.1-Nemotron-Ultra-253B-v1模型,推動AI高效部署

業(yè)界
2025
04/12
18:19
IT之家
分享
評論

4月12日消息,科技媒體 marktechpost 昨日(4月11日)發(fā)布博文,報(bào)道稱英偉達(dá)發(fā)布Llama-3.1-Nemotron-Ultra-253B-v1,這款2530億參數(shù)的大型語言模型在推理能力、架構(gòu)效率和生產(chǎn)準(zhǔn)備度上實(shí)現(xiàn)重大突破。

隨著AI在數(shù)字基礎(chǔ)設(shè)施中的普及,企業(yè)與開發(fā)者需在計(jì)算成本、性能與擴(kuò)展性間尋找平衡。大型語言模型(LLM)的快速發(fā)展提升了自然語言理解和對話能力,但其龐大規(guī)模常導(dǎo)致效率低下,限制大規(guī)模部署。

英偉達(dá)最新發(fā)布的Llama-3.1-Nemotron-Ultra-253B-v1(簡稱Nemotron Ultra)直面這一挑戰(zhàn),該模型基于Meta的Llama-3.1-405B-Instruct架構(gòu),專為商業(yè)和企業(yè)需求設(shè)計(jì),支持從工具使用到多輪復(fù)雜指令執(zhí)行等任務(wù)。

IT之家援引博文介紹,Nemotron Ultra采用僅解碼器的密集Transformer結(jié)構(gòu),通過神經(jīng)架構(gòu)搜索(NAS)算法優(yōu)化,其創(chuàng)新之處在于采用跳躍注意力機(jī)制,在部分層中省略注意力模塊或替換為簡單線性層。

此外,前饋網(wǎng)絡(luò)(FFN)融合技術(shù)將多層FFN合并為更寬但更少的層,大幅縮短推理時(shí)間,同時(shí)保持性能。模型支持128K token的上下文窗口,可處理長篇文本,適合高級RAG系統(tǒng)和多文檔分析。

在部署效率上,Nemotron Ultra 也實(shí)現(xiàn)突破。它能在單8xH100節(jié)點(diǎn)上運(yùn)行推理,顯著降低數(shù)據(jù)中心成本,提升企業(yè)開發(fā)者的可及性。

英偉達(dá)通過多階段后訓(xùn)練進(jìn)一步優(yōu)化模型,包括在代碼生成、數(shù)學(xué)、對話和工具調(diào)用等任務(wù)上的監(jiān)督微調(diào),以及使用群體相對策略優(yōu)化(GRPO)算法進(jìn)行強(qiáng)化學(xué)習(xí)(RL)。這些步驟確保模型在基準(zhǔn)測試中表現(xiàn)出色,并與人類交互偏好高度契合。

【來源:IT之家】

THE END
廣告、內(nèi)容合作請點(diǎn)擊這里 尋求合作
英偉達(dá)
免責(zé)聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表砍柴網(wǎng)的觀點(diǎn)和立場。

相關(guān)熱點(diǎn)

隨著中國人工智能的快速發(fā)展,美國單純想要靠禁售一些芯片就來阻止無異于癡人說夢。
業(yè)界
3月27日消息,英偉達(dá)股價(jià)又迎來了大跌,市值一夜蒸發(fā)1691億美元(約合人民幣12291億元)。
業(yè)界
北京時(shí)間3月26日,彭博社發(fā)文稱,DeepSeek的崛起不僅向AI行業(yè)展示了無需花費(fèi)巨資就能構(gòu)建AI大模型,它還激活了沉寂已久的中國科技行業(yè)。
業(yè)界
北京時(shí)間3月25日,據(jù)彭博社報(bào)道,津巴布韋電信大亨斯特拉夫·馬希依瓦(Strive Masiyiwa)創(chuàng)建的科技公司Cassava Technologies周一宣布,已與英偉達(dá)公司達(dá)成合作,計(jì)劃在非洲建立首家AI工廠。
業(yè)界
3月24日,商業(yè)內(nèi)幕發(fā)文,英偉達(dá)首席執(zhí)行官黃仁勛上周開了一個(gè)玩笑,但他的大客戶們可能不會覺得好笑。
業(yè)界

相關(guān)推薦

1
3