青云科技旗下AI算力云——基石智算Coreshub 上線全新大模型 Qwen3-30B-A3B-Instruct-2507。該模型基于 Qwen3-30B 模型微調,采用 A3B 分離推理優化機制(Attention-Acting-As-Batch),在推理性能與響應時延上大幅提升。目前,用戶可通過基石智算大模型服務,通過 API 快速調用該模型,滿足不同場景下的業務需求。
新模型主要提升指令跟隨、邏輯推理、文本理解,以及數學、科學、編程和工具使用等通用能力,官方表示在激活 3B 參數的情況下,性能接近 GPT-4o 和 Qwen3-235B-A22B Non-Thinking。
新版模型特點包括:
l 性能升級:相比傳統 Qwen3-30B-Instruct,A3B 版本在 H100 GPU 上推理速度提升最高可達 2 倍,延遲下降約 30%。
l 更強泛化能力:優化后的指令微調流程覆蓋通用問答、工具調用、邏輯推理等能力,在多個基準評測中表現優異。
基石智算對 Qwen3-30B-A3B-Instruct-2507 完成底層容器化部署與多機并行優化,支持彈性伸縮、Token 計費與 API 調用方式。快來基石智算體驗吧!