国产乱了高清露脸对白-日韩高清在线一区-激情三级hd中文字幕,亚洲一区二区视频免费观看,亚洲精品色综合av网站,女性私密紧致按摩电影

DeepSeek等秒變操控電腦AI智能體,微軟開源工具OmniParser V2.0發布

業界
2025
02/17
10:27
IT之家
分享
評論

2 月 17 日消息,微軟 OmniParser 是一款基于純視覺的 GUI 智能體解析和識別屏幕上可交互圖標的 AI 工具,此前搭配 GPT-4V 可顯著增強識別能力。

2 月 12 日,微軟在官網發布了 OmniParser 最新版本 V2.0,可將 OpenAI(4o / o1 / o3-mini)、DeepSeek(R1)、Qwen(2.5VL)和 Anthropic(Sonnet)等模型,變成可以操控計算機的 AI 智能體。

與 V1 版本相比,OmniParser V2 使用了更大規模的交互元素檢測數據和圖標功能標題數據進行了訓練,在檢測較小的可交互 UI 元素時準確率更高、推理速度更快,延遲降低了 60%。

在高分辨率 Agent 基準測試 ScreenSpot Pro 中,V2+GPT-4o 的準確率達到了 39.6%,而 GPT-4o 原始準確率只有 0.8%。

為了能夠更快地實驗不同的智能體設置,微軟還開源了 OmniTool,這是一個集成了智能體所需一系列基本工具的 Docker 化 Windows 系統,涵蓋屏幕理解、定位、動作規劃和執行等功能,也是將大模型變成智能體的關鍵工具。

IT之家附開源地址:

https://github.com/microsoft/OmniParser

【來源:IT之家

THE END
廣告、內容合作請點擊這里 尋求合作
DeepSeek 微軟
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

相關推薦

1
3