北京時間8月19日,聲網母公司Agora, Inc. 公布了2025年第二季度財報。財報顯示,第二季度Agora, Inc. 總營收3426萬美元,同比增長11.0%(不含去年三季度起已終止的低毛利業務)。公司指引三季度收入區間為3400-3600萬美元,同比去年三季度增長7.6%-13.9%。
在美國通用會計準則(GAAP)下,Agora, Inc. 第二季度凈利潤為146萬美元(合人民幣1050萬元),繼2024年Q4同比扭虧為盈后,已連續三個季度實現GAAP盈利,且利潤額超過一季度3倍以上。
對此,Agora, Inc. 創始人兼CEO趙斌表示,“我們欣然宣布,公司連續三個季度實現美國通用會計準則(GAAP)下的盈利。利潤率的持續提升得益于穩健的收入增長與運營效率的不斷優化。
自今年三月推出對話式AI引擎產品以來,我們已攜手客戶在多個場景下開發語音對話智能體。目前,部分客戶的智能體方案已在呼叫中心和AI陪伴硬件等場景落地應用。
基于這一良好發展勢頭,我們將繼續深度融合垂直場景專業知識與特點,并進一步提升產品性能與體驗。 我們日益堅定地相信,我們的技術將驅動客服、教育和智能硬件等廣泛行業的智能化轉型。”
在現金儲備方面,截至2025年6月30日,Agora, Inc. 現金、現金等價物、銀行存款及銀行理財產品為3.77億美元。
對話式 AI 引擎全新升級,支持聲紋識別、數字人、視覺理解
7月26-29日,聲網亮相2025世界人工智能大會(WAIC),正式發布新版對話式AI引擎,該版本新增聲紋識別、數字人與視覺理解三項功能,實現對話式AI音視頻交互體驗的全新升級。
· 聲紋識別:選擇性注意力鎖定新增聲紋識別功能,該功能賦予AI精準識別用戶聲紋特征的能力,有效區分不同說話者。用戶只需在對話初期大聲、清晰地說話,即可提升AI對聲音的鎖定效果。聲紋識別不僅可以智能屏蔽95%的環境人聲、噪聲,讓AI對話更準確、高效,同時也適用于多人與AI對話的場景,實現更加多元化的對話式AI響應與服務。
· 數字人交互:支持商湯等市場主流的數字人方案,通過集成高度擬真、表情動作自然的數字人,用戶可與屏幕中的高度擬人化的數字形象進行實時、生動的對話互動,增強交互的臨場感與情感連接,且有多個數字人形象供選擇,適用于虛擬客服、教育陪伴、娛樂社交等多種場景。
· 視覺理解:新增的視覺理解能力為AI加上“眼睛”,一方面支持實時視頻,能夠解析攝像頭捕捉的畫面信息,結合語音指令,AI能“看懂”用戶手勢、環境物體或特定視覺線索,實現“所見即所言”的智能反饋;另一方面,支持拍照與圖片上傳識別,AI會解答圖片中的關鍵信息,可適用于教育場景的拍照識題與作業批改,智能助手場景的識物、翻譯、分析等。在對話式AI中加入視覺理解,將為人機對話協作開辟更廣闊的空間。
對話式AI正從基礎的互動問答向深度理解、情感共鳴和情境感知演進。聲網對話式 AI引擎具備的聲紋識別、數字人和視覺理解等能力,成為構建下一代自然、沉浸式人機交互基礎設施的重要一步。
此外,本季度聲網還發布了全球首個AI模型評測平臺(對話式)。該平臺針對對話式 AI 場景下,級聯大模型中的ASR+LLM+TTS 延遲數據提供主流供應商的橫向測評,更直觀的展示聲網對話式AI引擎適配各主流模型的實時性能數據。同時,平臺還提供了“競技場”功能,開發者可自由選擇ASR、LLM、TTS的主流供應商進行對比,根據性能延遲的數據表現,選擇更適配自身業務的模型供應商。
助力AI智能助手、AI陪伴機器人等多元場景落地
隨著不斷地技術創新和體驗升級,聲網進一步加速了對話式AI能力在各行業場景的落地。本季度,聲網在AI智能助手、AI陪伴機器人、多模態AI智能體創作等多個場景中,都實現了客戶應用案例落地。
星野是依托MiniMax先進的多模態AIGC技術,構建的自由創造與分享AI智能體的創作平臺。基于MiniMax在文本、聲音、視覺模型下的先進能力,以及聲網對話式 AI 技術,星野平臺中的用戶與AI智能體可實現秒回、清晰、流暢的實時語音對話,再搭配超擬人的AI音色,讓AI交互更接近人類的真實對話,成為用戶娛樂、工作、學習中的AI伙伴。
MiniMax Chat是基于MiniMax最新自研多模態大語言模型打造的AI助手,在聲網助力下,語音對話體驗成為MiniMax Chat亮點功能之一,響應速度快、AI秒回,即使在弱網、嘈雜環境下,也能清晰、流暢對話。基于MiniMax出色的新一代語音大模型,AI的聲音逼真、語氣自然,能流暢處理多語種混合輸出,并提供調節語速和更換聲音等功能。
智譜清言是基于智譜GLM系列模型開發的AI助手,結合智譜出色的音視頻理解模型和情感語音模型,清言能夠看到和理解用戶所處環境,更好地提供問答、翻譯、導游、作業輔導等功能。在聲網對話式AI技術的助力下,智譜清言的視頻通話延遲更低,對話更流暢。
賦之科技推出的EBO Air 2 Plus探索了全新AI玩法,通過聲網對話式AI引擎,讓用戶可與多個大模型助手展開對話,支持6大角色,20+音色,無論知識問答、互動聊天、還是情感陪伴都能一鍵與 AI 實現自然、流暢的真實互動體驗。
Miko3是一款STEAM智能教育機器人,通過聲網提供的對話式AI技術,Miko3機器人不僅可以與孩子進行自然、流暢的對話,還能準確識別兒童的情緒并快速給予相應的反饋,成為貼心的情感陪伴者。
從高效生產力工具到暖心情感陪伴,聲網對話式AI能力正深度滲透智能硬件、教育、社交等多元領域,持續釋放行業價值與增長潛力。未來,聲網將深耕場景創新與技術迭代,不斷打磨人與智能體的實時互動體驗,以更自然、沉浸的交互能力,助力AI真正融入千行百業的實踐場景。