国产乱了高清露脸对白-日韩高清在线一区-激情三级hd中文字幕,亚洲一区二区视频免费观看,亚洲精品色综合av网站,女性私密紧致按摩电影

蘋果攜手復旦大學推 StreamBridge 端側視頻大語言模型框架

業界
2025
05/13
14:32
IT之家
分享
評論

5 月 13 日消息,科技媒體 marktechpost 今天(5 月 13 日)發布博文,報道稱蘋果公司聯合復旦大學,推出 StreamBridge 端側視頻大語言模型(Video-LLMs)框架,助力 AI 理解直播流視頻。

直播流視頻理解的挑戰與需求

傳統視頻大語言模型擅長處理靜態視頻,但無法適應機器人技術和自動駕駛等需要實時感知的場景,在這些場景下,要求模型能快速理解直播視頻流內容,并做出反應。

現有的模型面臨兩大難題:一是多輪實時理解,即在處理最新視頻片段時需保留歷史視覺和對話上下文;二是主動響應,要求模型像人類一樣主動監控視頻流,并在無明確指令的情況下及時輸出反饋。

StreamBridge 框架與創新技術

為解決上述問題,蘋果公司與復旦大學的研究者開發了 StreamBridge 框架。該框架通過內存緩沖區和輪次衰減壓縮策略,支持長上下文交互。

該框架還引入了一個輕量化的獨立激活模型,無縫集成現有視頻大語言模型,實現主動響應功能。研究團隊還推出了 Stream-IT 數據集,包含約 60 萬個樣本,融合了視頻與文本序列,支持多樣化的指令格式,旨在提升流式視頻理解能力。

StreamBridge 在主流離線模型如 LLaVA-OV-7B、Qwen2-VL-7B 和 Oryx-1.5-7B 上進行了測試。結果顯示,Qwen2-VL 在 OVO-Bench 和 Streaming-Bench 上的平均分分別提升至 71.30 和 77.04,超越了 GPT-4o 和 Gemini 1.5 Pro 等專有模型。

Oryx-1.5 也取得了顯著進步,而 LLaVA-OV 性能略有下降。Stream-IT 數據集的微調進一步提升了所有模型的表現,證明了 StreamBridge 在流式視頻理解領域的強大潛力。

【來源:IT之家

THE END
廣告、內容合作請點擊這里 尋求合作
蘋果公司
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

5月12日消息,加拿大研究機構Visual Capitalist根據2025年5月5日的市值數據,公布了全球最有價值的50家公司。
業界
北京時間4月28日,對于蘋果公司要將所有美國iPhone機型改由印度生產的傳聞,彭博社知名記者馬克·古爾曼(Mark Gurman)在當地時間周日發文稱,“幾乎可以肯定的是”,蘋果在2027年前無法在印度生產所有面向...
業界
4 月 26 日消息,科技媒體 Deadline 昨日(4 月 25 日)發布博文,報道稱湯姆?漢克斯(Tom Hanks)再次攜手 Apple Original Films,打造《灰獵犬號》(Greyhound)電影續集。
業界
4月24日,京東App目前登上了蘋果App Store免費App排行榜榜首。
業界
北京時間4月16日,據彭博社報道,蘋果公司負責全球企業銷售和西歐市場的副總裁馬克·羅杰斯(Mark Rogers)計劃在今年晚些時候離職,成為最新一位離職的資深高管。
業界

相關推薦

1
3