OpenAI的12天“聖誕大禮包”還沒熄火,谷歌便用一次發布,幹了比OpenAI 五天都多的事兒。

12月12日凌晨,就在OpenAI轟轟烈烈的“12天連續發布”進行到第五天時,谷歌發布了他們的重磅更新—— Gemini 2.0 Flash。

同時,谷歌今天官宣了三個通用助手Project Astra瀏覽器助手Project Mariner,以及代碼助手Jules,旨在引領AI模型進入“Agentic 時代”。


Gemini 2.0


Gemini 2.0 Flash是該系列的首款模型,它在性能上實現了顯著提升。與前代1.5 Flash相比,2.0 Flash在保持快速響應的同時,性能進一步增強。

谷歌表示,2.0 Flash在關鍵基准測試中超越了1.5 Pro,速度是1.5 Pro的兩倍。新模型不僅支持圖像、視頻和音頻等多模態輸入,還支持多模態輸出,包括原生生成的圖像與文本混合內容,以及可控的多語言文本轉語音(TTS)音頻。

此外,2.0 Flash能夠原生調用Google Search、代碼執行以及第三方用戶定義的函數等工具。

在這個榜單中我們可以看到,它超越了ChatGPT-4o和o1 Preview,登上了第一。這足見其模型的實力。

從命名來看,Gemini 2.0 Flash很可能是新系列的最小杯,最小贏過了競爭對手最大、最先進的模型,這讓人甚至都很難想象 Gemini 2.0 Ultra 會強到什么地步。

正如谷歌DeepMind的CTO科雷·卡武克奧盧所說:

“如果把我們一年前的位置和現在相比,今天發布的Flash模型比我們一年前的任何模型都要強大得多,而且成本只是其一小部分。”

Gemini 2.0 Flash的多模態能力使其在信息理解和表達上更加接近人類,爲用戶提供了更加豐富和直觀的交互方式。這種能力的提升,不僅增強了模型的實用性,也爲AI智能體的應用提供了更多可能性。

谷歌還推出了新的多模態實時API,支持實時音頻、視頻流輸入,並能夠集成調用多種工具組合。這一API的推出,爲开發者構建動態交互式應用提供了更多支持,這在教育、娛樂和輔助閱讀等領域具有廣泛的應用前景。

谷歌計劃在明年初將Gemini 2.0擴展到更多產品中,這將進一步推動AI技術在各個領域的應用。

在AI智能體的應用方面,谷歌展示了多個研究原型,包括Project Astra、Project Mariner和Jules。

來源:AI信息Gap

Project Astra是一個通用AI助手,它利用Gemini 2.0的多模態功能,通過手機或谷歌眼鏡進行跨文本、音頻、視頻的多模態實時推理。

Astra的新功能包括支持多語言混合對話、直接調用Google Lens和地圖功能、記憶能力提升至10分鐘會話內記憶,以及接近人類對話的延遲來理解語言。谷歌正在將Project Astra移植到眼鏡等更多移動終端中,以拓展其應用範圍。

Project Mariner是一個基於Gemini 2.0構建的早期研究原型,它能夠理解和推理瀏覽器頁面中的信息,包括像素和網頁元素,然後通過Chrome擴展程序使用這些信息爲用戶完成任務。在WebVoyager基准測試中,Project Mariner作爲單個智能體設置實現了83.5%的工作效率。

Jules是谷歌專爲开發者打造的AI編程智能體,它支持直接集成到GitHub工作流中,使用自然語言描述問題,就能直接生成可以合並到GitHub項目中的代碼。


遊戲智能體的新突破


谷歌還在遊戲領域進行了有趣的嘗試,使用Gemini 2.0構建了能夠實時解讀屏幕畫面的遊戲智能體,通過用戶遊戲屏幕上的動作給出下一步操作建議,或直接在打遊戲時通過語音交流。

谷歌稱,這些遊戲智能體可以根據屏幕上的實時畫面,分析遊戲情況,並爲用戶提供下一步的行動建議。

目前,研究人員在與Supercell等遊戲开發商合作,探索這些Agent從《部落衝突》等策略遊戲到《Hay Day》等農業模擬器,在各種遊戲中解釋規則和挑战的能力。

未來,谷歌還在試驗可以通過將Gemini 2.0的空間推理功能應用於機器人技術來在物理世界中提供幫助的Agent。

此外,谷歌正在探索將Gemini 2.0的空間推理能力應用到機器人領域,雖然還處於早期階段,但這預示着AI代理在物理環境中提供幫助的潛力。

谷歌CEO桑達爾·皮查伊(Sundar Pichai)表示,公司一直在投資开發更具“代理性”的模型,這些模型能更深入地理解周圍的世界,提前多步思考,並在用戶的監督下執行任務。Gemini 2.0的推出,使得谷歌在AI智能體時代的競爭中佔據了有利地位。



標題:全力狙擊OpenAI,谷歌最強大模型Gemini 2.0登場,AI Agent成主打!

地址:https://www.iknowplus.com/post/175701.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。