遊戲AI“精靈”!谷歌又出新王炸,新模型Genie重磅登場
當紅炸子雞Sora 熱尚未褪去,谷歌的Genie又來了。
一張圖,便可召喚一個交互式世界,谷歌這次出手又是一個王炸,直槓Open AI。
日前,谷歌發布了110億參數的全新AI基礎世界模型——Genie (生成式交互環境,Genie 中文意爲“精靈”)。
與之前僅關注世界生成的模型不同是:Genie 允許用戶與創建的環境進行交互。它可以通過文本、合成圖像、照片甚至草圖生成可玩的交互式環境和可控虛擬世界。
谷歌表示,Genie开啓了“圖/文生成交互世界”的時代,還將成爲實現通用AI Agent的催化劑。
值得一提的是,Genie的問世代表了生成式人工智能的一個重大進步,也讓人工智能在虛擬世界的散發出無限可能性。
據谷歌介紹,Genie AI 是一個相對較小的模型,擁有 110 億個參數。
它由時空視頻分詞器、自回歸動力學模型和簡單且可擴展的潛在動作模型組成。
Genie 在大量公开的互聯網視頻數據集上進行了沒有任何動作標籤的訓練,可以將任何圖像(無論是現實世界的照片、草圖、人工智能生成的圖像還是繪畫)轉換爲簡單的 2D 平台遊戲。
最大的獨特之處是,它可以通過無監督學習來理解遊戲世界中角色的移動、控制和行動,並根據用戶操作預測未來幀,從而創建功能性和可玩性的體驗。
簡而言之,Genie 能“自學成才”。
谷歌DeepMind團隊指出,它的用途廣泛,適用於各個領域,且可以擴展到更大的互聯網數據集。
此外谷歌還強調,這種新模型爲未來的人工智能打开了大門,讓他們可以“在新的、生成的世界的永無止境的課程中”接受培訓。
與Sora相比,Genie進步在哪?Sora 作爲圖像/視頻生成,Genie 多了交互性,也就是在文/圖基礎上生成了可交互的世界。
不久前,OpenAI發布了首個文生視頻模型,Sora一出,即震驚四座。
它不僅能生成逼真的人工智能視頻,還能夠創建持久的角色、風格和環境。Open AI更是將稱其爲“世界模擬器”。
於是,也有網友稱,Genie是谷歌對Sora不痛不癢的回擊罷了。
不過,谷歌Genie團隊負責人Tim Rocktäschel則稱,不可否認,OpenAI的 Sora 確實令人印象深刻,視覺上令人驚嘆,但世界模型需要“行動”。
Genie 是一個動作可控的世界模型,但完全不受視頻監督的訓練,這是邁向AGI通用世界模型的充滿希望的一步。
英偉達科學家Jim Fan也表示,與Sora不同的是,Genie實際上是一個由行動驅動的世界模型,具有推斷行動的能力。2024年也將是基礎世界模型之年。
“Sora很好,但是Genie將會是具身智能體的主幹之作”。
作爲一個基礎世界模型,可以說,Genie 處於可以生成和管理虛擬環境的人工智能系統的最前沿。
它的發展標志着基礎世界模型向前邁出了重要一步,這不僅僅是遊戲技術的進步,也標志着人工智能系統能力的更廣泛轉變。
眼下,AI大模型战場正“烽煙四起”,硅谷巨頭們的廝殺甚是激烈。前幾天,谷歌才剛剛推出了开源大模型——Gemma,
但硅谷大廠們,在這輪AI浪潮上已經卷出了新高度,大有“你強,我要更強”的架勢一較高低。眼下,除了谷歌一連串“輸出”之外,微軟也在加大“火力”。
繼OpenAI之後,微軟剛剛又將法國初創公司Mistral AI納入麾下。
作爲一家成立僅10個月的初創公司,Mistral AI發布的Mistral Large模型性能已經直逼GPT-4。
據悉,在常用基准測試中,Mistral Large的表現僅次於GPT-4,超過了GPT-3.5、谷歌的Gemini Pro和Meta的LLaMA 2 70 B。
這一次,誰會成爲“下一個OpenAI”呢?
標題:遊戲AI“精靈”!谷歌又出新王炸,新模型Genie重磅登場
地址:https://www.iknowplus.com/post/84671.html