7 月 26 日消息,谷歌 DeepMind 團隊昨日(7 月 25 日)發布博文,表示其研發的 AlphaProof 和 AlphaGeometry 2 模型可以解決數學中的高級推理問題,在解答國際數學奧林匹克競賽難題方面達到銀牌標準。
AI 模型簡介
AlphaProof:基于強化學習的全新數學形式推理系統。
AlphaGeometry 2:幾何解題系統的改進版。
DeepMind 團隊結合兩個 AI 模型,協作解決了今年國際數學奧林匹克(IMO)6 道題目中的 4 道,首次在競賽中取得與銀牌得主同等的成績。
評分團隊
DeepMind 團隊兩位專家,根據 IMO 的評分規則進行評分,這兩位專家分別為:
蒂莫西?高爾斯教授(Prof Sir Timothy Gowers):著名數學家、IMO 金牌得主和菲爾茲獎得主。
約瑟夫-邁爾斯博士(Dr Joseph Myers):兩屆 IMO 金牌得主、IMO 2024 年問題遴選委員會主席
AI 模型推理
AI 會將 IMO 的 6 道題目翻譯成為模型可以理解的數學語言。
AlphaProof 通過確定答案并證明其正確性,解決了兩個代數問題和一個數論問題,而其中解決的 1 個問題是比賽中最難的,在今年的 IMO 中只有 5 位選手解決了這一問題。
AlphaGeometry 2 證明了幾何問題,沒有解決 2 個組合問題。
AI 模型結果
按照 IMO 規則,6 道題目每道題可獲得 7 分,總分最高為 42 分。
DeepMind 系統最終獲得了 28 分,每個問題都得到了滿分,相當于銀牌組的最高分。
2024 年的金獎門檻從 29 分開始,在正式比賽中,609 名參賽者中有 58 人獲得了金獎。
【來源:IT 之家】