Google 推出Gemini Deep Think AI:多代理模型並行測試多種思路

Google 推出Gemini Deep Think AI:多代理模型並行測試多種思路

Table Of Contents
Google AI團隊展示Gemini Deep Think模型的藝術創作
Google AI團隊展示Gemini Deep Think模型的藝術創作

今年國際數學奧林匹克競賽(IMO)奪金的背後,藏著Google DeepMind的最新突破。IMO是全球最具影響力的數學競賽之一,此次奪金再次證明了Google DeepMind在人工智能領域的領導地位。這家全球頂尖的人工智能實驗室近日正式推出Gemini Deep Think模型,這款被譽為「先進推理引擎」的AI系統,能同時探索數種思路並最終篩選出最佳答案,其性能在多項國際標準測試中超越OpenAI及xAI等競爭對手。

此模型作為Google首個公開的多代理系統,採用了獨創的強化學習技術,並透過並行運算大幅提升複雜問題的處理效率。例如,在Humanity’s Last Exam(HLE)測試中,Gemini Deep Think未使用工具即取得34.8%的成績,遠超xAI的Grok 4(25.4%)及OpenAI的o3(20.3%)。而在程式設計競技場LiveCodeBench 6的測試中,該模型更以87.6%的表現優於其他對手。

此外,除了技術性能,Google亦指出,該模型能夠自動整合程式碼執行及網頁開發等功能,生成比傳統AI更詳細的回答。在測試中,Gemini Deep Think生成的網站開發方案內容更豐富,視覺效果也更精緻,有望加速學術研究進程。

值得注意的是,多代理系統的高昂運算成本可能促使科技巨頭將其限制在高階訂閱服務內。Google表示,目前僅向月費1950港元(約250美元)的Ultra訂閱用戶開放測試,而xAI及Anthropic等競爭對手亦採取類似策略。

目前,Google正透過Gemini API向學術界及企業開發者擴展測試範圍,並希望收集反饋以優化此系統在學術場景的應用。正如Google在部落格中所言:「Deep Think能協助人們解決需要創造力、策略規劃及逐步優化的問題。」

頂尖AI實驗室的技術趨勢

近年來,多代理系統逐漸成為AI研究的熱門方向。xAI早前推出的Grok 4 Heavy、Anthropic的Research agent等項目,均採用類似的架構。OpenAI研究員Noam Brown更在播客中透露,今年IMO奪金的未公開模型亦屬多代理系統。這一趨勢表明,各大科技公司都在積極開發和應用多代理系統,以提升AI的解決複雜問題的能力。

香港創科界關注技術應用

香港科技園公司(HKSTP)指出,這類AI技術的發展將為本地人工智慧產業注入新動力,特別是多代理系統在學術研究及企業開發中的潛力。然而,專家亦提醒,技術門檻與成本控制仍是推廣的關鍵挑戰。目前,許多本地機構正在積極探索如何應用這些技術,以提升競爭力。

產業觀點:技術與商業的平衡

香港生產力局(HKPC)科技顧問李偉強指出:「多代理AI的突破令人鼓舞,但如何降低使用成本、提升普及性,才是技術落地的關鍵。」他預計未來將有更多本地機構與Google合作探索應用場景。根據最近的一項調查,超過70%的本地企業表示有意引入多代理AI技術,但成本是主要障礙。

工業物聯網攻擊日增 網絡冬天即將來臨

工業物聯網攻擊日增 網絡冬天即將來臨

** [智慧城市] [Microsoft][IoT物聯網][CyberX]** 以色列國家網絡管理局局長Yigal Unna:網絡攻擊企圖控制供水系統,改變水中氯含量,以色列網絡防衛系統迅速發現攻 …

了解更多
網絡攻防搶旗賽 加入無線射頻項目

網絡攻防搶旗賽 加入無線射頻項目

CTF分兩階段,包括線上預賽及線上決賽。線上預賽將於日本標準時間 9 月 26 至 27 日舉行,採用「解題」(Jeopardy)形式,考驗參賽者解決問題的能力。 **新科技速遞** 趨勢科技公佈第 …

了解更多
新科技速遞|   固態電池研發短兵相接   理大夥蔚來助研發落地

新科技速遞| 固態電池研發短兵相接 理大夥蔚來助研發落地

理大校長滕錦光教授(後排右四)及蔚來創始人李斌(後排左四)見證下,理大鄭子劍教授(前排左)及蔚來副總裁曾士哲(前排右)簽署戰略合作備忘錄。 [**新科技速遞]** 根據研究機 …

了解更多