Google 推出Gemini Deep Think AI:多代理模型並行測試多種思路

Google 推出Gemini Deep Think AI:多代理模型並行測試多種思路

Table Of Contents
Google AI團隊展示Gemini Deep Think模型的藝術創作
Google AI團隊展示Gemini Deep Think模型的藝術創作

今年國際數學奧林匹克競賽(IMO)奪金的背後,藏著Google DeepMind的最新突破。IMO是全球最具影響力的數學競賽之一,此次奪金再次證明了Google DeepMind在人工智能領域的領導地位。這家全球頂尖的人工智能實驗室近日正式推出Gemini Deep Think模型,這款被譽為「先進推理引擎」的AI系統,能同時探索數種思路並最終篩選出最佳答案,其性能在多項國際標準測試中超越OpenAI及xAI等競爭對手。

此模型作為Google首個公開的多代理系統,採用了獨創的強化學習技術,並透過並行運算大幅提升複雜問題的處理效率。例如,在Humanity’s Last Exam(HLE)測試中,Gemini Deep Think未使用工具即取得34.8%的成績,遠超xAI的Grok 4(25.4%)及OpenAI的o3(20.3%)。而在程式設計競技場LiveCodeBench 6的測試中,該模型更以87.6%的表現優於其他對手。

此外,除了技術性能,Google亦指出,該模型能夠自動整合程式碼執行及網頁開發等功能,生成比傳統AI更詳細的回答。在測試中,Gemini Deep Think生成的網站開發方案內容更豐富,視覺效果也更精緻,有望加速學術研究進程。

值得注意的是,多代理系統的高昂運算成本可能促使科技巨頭將其限制在高階訂閱服務內。Google表示,目前僅向月費1950港元(約250美元)的Ultra訂閱用戶開放測試,而xAI及Anthropic等競爭對手亦採取類似策略。

目前,Google正透過Gemini API向學術界及企業開發者擴展測試範圍,並希望收集反饋以優化此系統在學術場景的應用。正如Google在部落格中所言:「Deep Think能協助人們解決需要創造力、策略規劃及逐步優化的問題。」

頂尖AI實驗室的技術趨勢

近年來,多代理系統逐漸成為AI研究的熱門方向。xAI早前推出的Grok 4 Heavy、Anthropic的Research agent等項目,均採用類似的架構。OpenAI研究員Noam Brown更在播客中透露,今年IMO奪金的未公開模型亦屬多代理系統。這一趨勢表明,各大科技公司都在積極開發和應用多代理系統,以提升AI的解決複雜問題的能力。

香港創科界關注技術應用

香港科技園公司(HKSTP)指出,這類AI技術的發展將為本地人工智慧產業注入新動力,特別是多代理系統在學術研究及企業開發中的潛力。然而,專家亦提醒,技術門檻與成本控制仍是推廣的關鍵挑戰。目前,許多本地機構正在積極探索如何應用這些技術,以提升競爭力。

產業觀點:技術與商業的平衡

香港生產力局(HKPC)科技顧問李偉強指出:「多代理AI的突破令人鼓舞,但如何降低使用成本、提升普及性,才是技術落地的關鍵。」他預計未來將有更多本地機構與Google合作探索應用場景。根據最近的一項調查,超過70%的本地企業表示有意引入多代理AI技術,但成本是主要障礙。

HGC積極發展海底電纜基建      物色更多東南亞市場機遇

HGC積極發展海底電纜基建   物色更多東南亞市場機遇

HGC環電集團行政總裁郭詠邦在HGC Partner Day表示,協助中小企客戶抵禦網絡攻擊,亦將會將AI加入其整合平台。 [眾創時代] 寬頻網絡在近年發展一日千里,人工智能及新興科技應用紛至沓來, …

了解更多
法國銀髮經濟崛起:人口老化孕育新機遇

法國銀髮經濟崛起:人口老化孕育新機遇

在全球人口老化趨勢下,法國正成為銀髮經濟的領跑者。根據最新數據,法國65歲及以上人口已從2000年的950萬激增至2023年的1440萬,增幅高達52%,佔總人口的21.7%。這一結構性轉變不僅帶來社 …

了解更多
平安好醫生攜手三甲醫院    廣州市民網上問診配藥

平安好醫生攜手三甲醫院  廣州市民網上問診配藥

[**醫療創新**BiologicalTechnology] [GoodDoctor] [1833][pagd.net] [caption id="attachment_14147" …

了解更多