又到谷歌 I/O 的“大秀”時間。毫無疑問,AI是備受矚目的焦點。

美東時間周二,谷歌年度 I/O 开發者大會拉开帷幕。

繼OpenAI搶先一步“上新”後,谷歌开啓正面回擊。從新的搜索和聊天功能到面向雲客戶的AI硬件,谷歌一口氣推出了多款AI新品。

對此,谷歌CEO皮查伊表示,谷歌所有的工作都圍繞生成式AI模型Gemini來做。


每分鐘都在講 AI


去年,谷歌的I/O大會帶來了Gemini;今年的I/O大會幾乎每一分鐘都在講 AI。

這是Gemini 統計出來的數字——長達 110 分鐘的主題演講中,總共提了121 次 AI 。

會上,谷歌Gemini 家族大上新。

其中,包括了AI搜索引擎、Gemini 1.5 Pro 更新版、Gemini 1.5 Flash、Gemma 2以及全新的Project Astra、Google Veo、magen 3等模型。

AI搜索引擎“AI Overviews”

谷歌正式推出“AI Overviews”搜索體驗。

據介紹,AI Overviews搜素引擎具備多步驟推理能力以及計劃能力。此外,靠Gemini的多模態功能,谷歌可以做到利用聲音搜歌曲,利用圖片搜產品。

Gemini 1.5 Pro 更新

Gemini 1.5 Pro上下文窗口擴展支持200萬token號稱“迄今爲止所有基礎模型中最長的上下文窗口”。

谷歌還通過數據和算法的改進增強了其代碼生成、邏輯推理和規劃、多輪對話以及音頻和圖像理解能力

對於復雜指令,可遵循更復雜的指令,控制回復風格,設置系統指令。

谷歌稱,今年夏季將擴展 Gemini 的多模態功能,包括增加用語音進行深入雙向對話的能力,這一功能被稱之爲 Gemini Live

目前,有超過 150 萬的开發人員在使用 Gemini 模型,超過 20 億的產品用戶都用到了 Gemini。

新成員:Gemini 1.5 Flash 模型

Gemini 1.5 Flash,是谷歌追求速度和效率的輕量級模型,也是 Gemini 模型系列的最新成員。

它針對大規模、大批量、高頻任務進行了優化,服務更具成本效益,並具有突破性的長上下文窗口(100 萬 token )。

在應用場景上,它擅長總結、聊天、圖像視頻字幕、長文檔數據提取等任務。Gemini 1.5 Flash通過從1.5 Pro模型中學習,繼承了其核心能力。

AI助手:Project Astra 

新的多模態AI項目Project Astra, 是谷歌人工智能助手的最新進展。

在演示中,AI助手可以通過視頻和音頻識別。例如,幫助用戶記住他們把眼鏡放在哪裏、檢查代碼並回答有關某個部分的問題。

谷歌表示,一個真正有用的聊天機器人需要讓用戶“自然地與它交談,沒有滯後或延遲”。

皮查伊預計 Project Astra 將於今年晚些時候在 Gemini 啓動。

新一代开源大模型 Gemma 2

谷歌开源大模型——Gemma 2 也來了。 

據介紹,Gemma 2 採用全新架構,旨在實現突破性的性能和效率,新开源的模型參數爲 27B。

視頻大模型Google Veo、文生圖像模型 Imagen 3

谷歌還發布了用於生成高清視頻的最新模型“Veo”,以及最高質量的文本到圖像模型 Imagen 3。

據悉,Veo 能夠生成各種風格的高質量 1080p 分辨率視頻,時長可以超過一分鐘。它可以憑借對自然語言和視覺語義的深入理解,並在理解視頻內容、渲染高清圖像、模擬物理原理等方面都有所突破。

 Imagen 3則在生成細節、光照、幹擾等方面進行了優化升級,並且理解 prompt 的能力顯著增強。

AI手機系統:Android 15操作系統

在 I/O 大會上,谷歌提到了即將推出的安卓新版本,即以 AI 爲核心的 Android 15。

谷歌還宣布對其適用於 Android 設備的 Gemini AI 聊天機器人進行一些改進:Gemini 正在“成爲 Android 上新的人工智能助手”。

這也意味着大模型現已成爲 Android 操作系統的一部分,使其能夠以更全面的方式集成。

AI芯片:第六代TPU芯片Trillium

谷歌第六代TPU芯片Trillium,是迄今爲止性能最強大、能效最高的 TPU,將於 2024 年底正式上线。

與 TPU v5e 相比,Trillium TPU 的每芯片峰值計算性能提高了 4.7 倍,同時它還把高帶寬內存(HBM)以及芯片間互連(ICI)帶寬加倍。

皮查伊表示,將於 2024 年底正式上线。

“25 年來,我們投資建設了世界一流的技術基礎設施。從支持搜索的尖端硬件,到支持人工智能進步的定制張量處理單元。我們將於 2024 年末向我們的雲客戶提供 Trillium。”


最後


從模型到應用,再到芯片……此次谷歌年度 I/O 开發者大會讓人應接不暇。

頂着Open AI壓力的谷歌,這一次正面硬剛的表現還是非常出色的。

此前一天,似乎是有意狙擊谷歌一般。

GPT-4o不僅在聽、說、看 方面更“絲滑”,並且將向所有用戶免費开放。

這也讓市場爲谷歌的“大上新”捏了一把汗。

但從現在來看,隨着全家桶AI能力升級,谷歌靠着多維度反擊,這一战雙方勢均力敵。

因爲從創新方向來看,OpenAI注重AI技術的突破和飛躍,谷歌則注重生態系統的深化與整合,二者均各有所長。

當下,人工智能战場上的“廝殺”激烈。

在這場科技巨頭的較量中,谷歌與OpenAI的再次交鋒,也勢必將人工智能的創新推向高潮。

各方科技巨頭不停革新着自家的“大殺器”,也預示着AI的新一輪變革。而谷歌和Open AI的對決,遠未止步於此。



標題:句句不離AI ,谷歌自我革命!Gemini 家族大上新,AI 超級全家桶“殺瘋了”

地址:https://www.iknowplus.com/post/107594.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。