6月17日,月之暗面(Moonshot AI)發(fā)布全新開源代碼大模型Kimi-Dev-72B,在AI軟件工程基準測試SWE-bench Verified上取得60.4%的成績,刷新了全球開源模型的最好成績(SOTA)。
據(jù)悉,Kimi-Dev-72B專為軟件工程任務(wù)設(shè)計,參數(shù)量為72B,在SWE-bench Verified測試中超越了剛剛發(fā)布不久的DeepSeek-R1-0528(57.6%),后者參數(shù)量高達671B。
據(jù)介紹,Kimi-Dev-72B采用大規(guī)模強化學(xué)習(xí)訓(xùn)練,能夠在現(xiàn)實代碼環(huán)境中自動修復(fù)Docker存儲庫,確保在完整測試套件通過后才給予獎勵,以提升模型輸出的正確性和魯棒性,貼合真實軟件開發(fā)標準。
目前,Kimi-Dev-72B模型權(quán)重、源代碼已在Hugging Face與GitHub平臺開源,并面向開發(fā)者社區(qū)開放下載部署。
【來源:網(wǎng)易科技】