2025年8月11日,昆侖萬維宣布啟動一場覆蓋五大技術領域的SkyWork AI技術發布周,8月11日至8月15日,每天將發布一款新模型,從視頻生成模型(Skyreels)、世界模型,到生圖一體化模型、智能體(Agent)模型,再到AI音樂創作模型(Mureka),連續五天發布覆蓋多模態AI核心場景的前沿模型,集中展示技術突破的最新成果。
這標志著昆侖萬維AI技術全面邁入商業化應用階段。前期重投入的研發成果加速轉化為產品矩陣,技術變現飛輪高效運轉。
技術周首日,全球首個支持分鐘級長視頻生成的音頻驅動模型Skyreels-A3正式亮相。該模型通過四大技術創新錨定直播電商萬億市場痛點,可實現長視頻連貫生成、影視級運鏡控制與自然動作交互,為全球內容創作產業提供新一代技術基石。
技術突破:構建多模態協同的生成范式
傳統視頻生成技術受限于誤差累積效應,面臨長視頻畫面崩壞與動作僵硬的行業瓶頸。模型Skyreels-A3的創新在于構建了多模態協同的生成范式,保證了畫面的一致性,基于DiT視頻擴散模型框架構建,通過三路輸入處理系統實現文本、圖像與音頻的深度融合,突破了誤差控制機制,創新采用分段插幀策略,通過確定起始幀和終止幀生成視頻片段,并取用尾幀作為插幀監督信號,成功將180秒長視頻的畫面穩定度控制在較高值,徹底解決行業頑疾。
在藝術創作的高階美感表達維度,模型首創基于ControlNet的鏡頭控制模塊,支持固定鏡頭、推鏡、拉鏡、左搖、右搖、抬升、下降、手持鏡頭等8種運鏡參數,且強度可自由連續調節。該技術使非專業用戶也能精準控制鏡頭語言,這種能力源自對影視鏡頭物理軌跡的數學建模,顯著提升直播帶貨場景的真實性,同時也可以提升音樂MV、電影片段的藝術表現力。
針對直播帶貨等交互場景中,效果不夠逼真的痛點,模型通過DPO算法優化手部動作自然度,驅動生成效果逼近真人表現,該技術通過分析大量真實交互數據,建立動作-商品-語音的跨模態關聯。
效率突破同樣令人矚目。模型Skyreels通過Step蒸餾技術,將推理步數從40步壓縮至4步,畫面質量保持率超98%,使視頻生成時間縮短至80秒,大幅降低創作者硬件門檻。人工盲測進一步驗證其優勢:在帶貨場景中,在觀眾盲測中,89%的人認為模型Skyreels呈現的動作效果比競品更真實自然,動作自然性和面部穩定性評分這兩項關鍵指標均居行業首位。
商業化潛力:撬動萬億市場的創作革命
2023年以來,昆侖萬維“All in AGI與AIGC”戰略全面落地,實現了從技術研發到產品商業化的轉變,并獲得了用戶廣泛的認可。
據悉,昆侖萬維推出的短劇平臺DramaWave年化流水達1.2億美元,AI音樂產品模型Mureka年化流水1200萬美元,AI社交產品Linky單月收入突破100萬美元。與此同時,Linky社交平臺300萬月活用戶形成創作者孵化池,Opera廣告系統實現精準投放,這種“創作-分發-變現”閉環推動毛利率維持在73.6%高位,為昆侖萬維AI技術持續創新提供動能。
昆侖萬維2025年Q1財報數據顯示,經營性現金流凈額增長58.3%,顯然,2024年15.4億元的研發投入正持續轉化為營收增長動能。這驗證了AI技術商業化的可持續性,使昆侖萬維成為國內首個跑通“研發投入——產品變現——現金流反哺”閉環的AI企業。
當模型SkyReels賦能錨定直播電商領域電影制作、虛擬直播、游戲開發與教育內容創作,顯著降低多角色視頻制作門檻,讓個性化、交互式內容的創作前所未有的高效與便捷。,昆侖萬維技術周未來幾日發布的其他模型也將各自開辟多元戰場,五大模型正編織一張覆蓋全球市場的商業化網絡。
從單點突破到生態賦能,昆侖萬維以可驗證的商業化效率與全球化布局能力,宣告中國AI企業首次跑通規模化盈利路徑。技術周的五大模型,恰是這場變革的序章——當技術飛輪與商業飛輪同頻轉動,昆侖萬維的營收增長故事,才剛剛開始。