Google 推出Gemini Deep Think AI:多代理模型並行測試多種思路

Google 推出Gemini Deep Think AI:多代理模型並行測試多種思路

Table Of Contents
Google AI團隊展示Gemini Deep Think模型的藝術創作
Google AI團隊展示Gemini Deep Think模型的藝術創作

今年國際數學奧林匹克競賽(IMO)奪金的背後,藏著Google DeepMind的最新突破。IMO是全球最具影響力的數學競賽之一,此次奪金再次證明了Google DeepMind在人工智能領域的領導地位。這家全球頂尖的人工智能實驗室近日正式推出Gemini Deep Think模型,這款被譽為「先進推理引擎」的AI系統,能同時探索數種思路並最終篩選出最佳答案,其性能在多項國際標準測試中超越OpenAI及xAI等競爭對手。

此模型作為Google首個公開的多代理系統,採用了獨創的強化學習技術,並透過並行運算大幅提升複雜問題的處理效率。例如,在Humanity’s Last Exam(HLE)測試中,Gemini Deep Think未使用工具即取得34.8%的成績,遠超xAI的Grok 4(25.4%)及OpenAI的o3(20.3%)。而在程式設計競技場LiveCodeBench 6的測試中,該模型更以87.6%的表現優於其他對手。

此外,除了技術性能,Google亦指出,該模型能夠自動整合程式碼執行及網頁開發等功能,生成比傳統AI更詳細的回答。在測試中,Gemini Deep Think生成的網站開發方案內容更豐富,視覺效果也更精緻,有望加速學術研究進程。

值得注意的是,多代理系統的高昂運算成本可能促使科技巨頭將其限制在高階訂閱服務內。Google表示,目前僅向月費1950港元(約250美元)的Ultra訂閱用戶開放測試,而xAI及Anthropic等競爭對手亦採取類似策略。

目前,Google正透過Gemini API向學術界及企業開發者擴展測試範圍,並希望收集反饋以優化此系統在學術場景的應用。正如Google在部落格中所言:「Deep Think能協助人們解決需要創造力、策略規劃及逐步優化的問題。」

頂尖AI實驗室的技術趨勢

近年來,多代理系統逐漸成為AI研究的熱門方向。xAI早前推出的Grok 4 Heavy、Anthropic的Research agent等項目,均採用類似的架構。OpenAI研究員Noam Brown更在播客中透露,今年IMO奪金的未公開模型亦屬多代理系統。這一趨勢表明,各大科技公司都在積極開發和應用多代理系統,以提升AI的解決複雜問題的能力。

香港創科界關注技術應用

香港科技園公司(HKSTP)指出,這類AI技術的發展將為本地人工智慧產業注入新動力,特別是多代理系統在學術研究及企業開發中的潛力。然而,專家亦提醒,技術門檻與成本控制仍是推廣的關鍵挑戰。目前,許多本地機構正在積極探索如何應用這些技術,以提升競爭力。

產業觀點:技術與商業的平衡

香港生產力局(HKPC)科技顧問李偉強指出:「多代理AI的突破令人鼓舞,但如何降低使用成本、提升普及性,才是技術落地的關鍵。」他預計未來將有更多本地機構與Google合作探索應用場景。根據最近的一項調查,超過70%的本地企業表示有意引入多代理AI技術,但成本是主要障礙。

生產力局推動低空經濟發展

生產力局推動低空經濟發展

全球對低空經濟的關注近年來持續升溫,預計到2035年,其市場規模將達3.5萬億元人民幣[1]。在這一背景下,香港生產力促進局今日正式啟用全港首個專注於低空經濟的科技館,標誌著香港在智慧城市發展上邁出了 …

了解更多
華為投資分散供應鍵  異質架構建立ICT

華為投資分散供應鍵 異質架構建立ICT

**[自主科技][華為 Huawei][ICT]** 華為輪值董事長郭平說,進入美國實體清單一年內,一直與夥伴和客戶溝通,尋求理解和支持。 **自主科技** 華為再受美國政府制裁,限制半導體技術出口 …

了解更多
港人數碼耐性低 速度成致勝關鍵

港人數碼耐性低 速度成致勝關鍵

隨著數碼化時代的來臨,消費者對數碼互動的速度與服務品質均有更高期待。數碼轉型的普及令消費者行為發生顯著變化,品牌需更加靈活地適應這些需求。[Twilio] (Ticker: TWLO, …

了解更多