青云科技旗下AI算力云——基石智算CoresHub 率先上線 20B 參數的 MMDiT 模型 Qwen-Image,該模型由阿里通義千問團隊開源。
作為 Qwen 系列的首個文生圖基礎模型,它在復雜文本渲染、精確圖像編輯、多行布局、段落級生成以及細節刻畫方面表現亮眼;不論是通用圖像生成還是多種藝術風格、高級編輯操作,它都能輕松駕馭,在海報設計場景中尤其出色。現在,借助基石智算強大的算力支持與便捷的平臺服務,用戶能夠快速體驗到 Qwen-Image 的魅力,將創意高效轉化為現實。
模型亮點
超強文本渲染能力:Qwen-Image 在復雜文本生成與渲染方面表現出眾,支持多行排版、段落級布局及細粒度細節呈現,無論是英文還是中文,都能實現高度保真的視覺輸出。
圖像編輯一致性:依托強化的多任務訓練范式,Qwen-Image 在圖像編輯過程中能夠精準修改目標區域,同時保持整體畫面的視覺一致性與語義連貫性。
行業 SOTA 性能:多項公開基準測試結果顯示,Qwen-Image 在多種圖像生成與編輯任務中均取得了業內頂尖(SOTA)的成績,充分驗證了其卓越的綜合實力。
使用步驟
1.登錄 coreshub,進入模型廣場,選擇 Qwen-Image 模型,點擊模型部署。
2.開始部署模型,資源類型選擇單卡 4090D 即可,立即部署模型,待模型部署成功后,復制外網鏈接到瀏覽器打開。
3.等待 Comfy UI 頁面加載成功后,選擇 Qwen-Image 模板,在框中輸入你的提示詞,點擊運行,即可開始生成圖片。
效果展示
一起來感受下 Qwen-Image 的魅力吧。
提示詞:一只戴著牛仔帽的柴犬站在西部酒吧門口,嘴里叼著的木牌上用歪歪扭扭的手寫體寫著 “今天不營業,去追羊啦”,背景的酒桶上還有褪色的英文標語 “Best Whiskey”。
提示詞:漂浮在云端的棉花糖城堡,城堡大門是用曲奇餅干做的,上面用融化的巧克力寫著 “甜夢入口處”,城門兩側的棒棒糖立柱上纏著彩色糖紙,上面印著迷你英文字母 “Welcome”。
提示詞:復古街機廳里,一臺像素風格的游戲機屏幕亮著,游戲畫面里的主角舉著一塊霓虹燈牌,牌上是閃著藍光的中文 “通關秘籍:點贊收藏”,機器側面的貼紙還有模糊的日文 “最高のゲーム”。
提示詞:海底圖書館里,章魚管理員用觸手拿著一本貝殼封面的書,書頁上用發光的海藻拼出 “禁止大聲吐泡泡”,旁邊的珊瑚書架上還插著寫有 “人魚傳說第 3 卷” 的羊皮卷軸。
提示詞:太空飛船的駕駛艙內,機器人宇航員正在操控面板,面板上的全息投影顯示著混合文字提示 “燃料:99% | 目的地:快樂星球 | 警告:別碰紅色按鈕!”,按鈕上還有個小圖標和俄文 “опасно”。
欣賞了 Qwen-Image 驚艷的文生圖效果,你是不是也想試一試?那就快來基石智算(coreshub),開始你的 AI 創作吧。