遊戲AI“精靈”！谷歌又出新王炸，新模型Gen...

當紅炸子雞Sora 熱尚未褪去，谷歌的Genie又來了。

一張圖，便可召喚一個交互式世界，谷歌這次出手又是一個王炸，直槓Open AI。

日前，谷歌發布了110億參數的全新AI基礎世界模型——Genie (生成式交互環境，Genie 中文意爲“精靈”)。

與之前僅關注世界生成的模型不同是：Genie 允許用戶與創建的環境進行交互。它可以通過文本、合成圖像、照片甚至草圖生成可玩的交互式環境和可控虛擬世界。

谷歌表示，Genie开啓了“圖/文生成交互世界”的時代，還將成爲實現通用AI Agent的催化劑。

值得一提的是，Genie的問世代表了生成式人工智能的一個重大進步，也讓人工智能在虛擬世界的散發出無限可能性。

據谷歌介紹，Genie AI 是一個相對較小的模型，擁有 110 億個參數。

它由時空視頻分詞器、自回歸動力學模型和簡單且可擴展的潛在動作模型組成。

Genie 在大量公开的互聯網視頻數據集上進行了沒有任何動作標籤的訓練，可以將任何圖像（無論是現實世界的照片、草圖、人工智能生成的圖像還是繪畫）轉換爲簡單的 2D 平台遊戲。

最大的獨特之處是，它可以通過無監督學習來理解遊戲世界中角色的移動、控制和行動，並根據用戶操作預測未來幀，從而創建功能性和可玩性的體驗。

簡而言之，Genie 能“自學成才”。

谷歌DeepMind團隊指出，它的用途廣泛，適用於各個領域，且可以擴展到更大的互聯網數據集。

此外谷歌還強調，這種新模型爲未來的人工智能打开了大門，讓他們可以“在新的、生成的世界的永無止境的課程中”接受培訓。

與Sora相比，Genie進步在哪？Sora 作爲圖像/視頻生成，Genie 多了交互性，也就是在文/圖基礎上生成了可交互的世界。

不久前，OpenAI發布了首個文生視頻模型，Sora一出，即震驚四座。

它不僅能生成逼真的人工智能視頻，還能夠創建持久的角色、風格和環境。Open AI更是將稱其爲“世界模擬器”。

於是，也有網友稱，Genie是谷歌對Sora不痛不癢的回擊罷了。

不過，谷歌Genie團隊負責人Tim Rocktäschel則稱，不可否認，OpenAI的 Sora 確實令人印象深刻，視覺上令人驚嘆，但世界模型需要“行動”。

Genie 是一個動作可控的世界模型，但完全不受視頻監督的訓練，這是邁向AGI通用世界模型的充滿希望的一步。

英偉達科學家Jim Fan也表示，與Sora不同的是，Genie實際上是一個由行動驅動的世界模型，具有推斷行動的能力。2024年也將是基礎世界模型之年。

“Sora很好，但是Genie將會是具身智能體的主幹之作”。

作爲一個基礎世界模型，可以說，Genie 處於可以生成和管理虛擬環境的人工智能系統的最前沿。

它的發展標志着基礎世界模型向前邁出了重要一步，這不僅僅是遊戲技術的進步，也標志着人工智能系統能力的更廣泛轉變。

眼下，AI大模型战場正“烽煙四起”，硅谷巨頭們的廝殺甚是激烈。前幾天，谷歌才剛剛推出了开源大模型——Gemma，

但硅谷大廠們，在這輪AI浪潮上已經卷出了新高度，大有“你強，我要更強”的架勢一較高低。眼下，除了谷歌一連串“輸出”之外，微軟也在加大“火力”。

繼OpenAI之後，微軟剛剛又將法國初創公司Mistral AI納入麾下。

作爲一家成立僅10個月的初創公司，Mistral AI發布的Mistral Large模型性能已經直逼GPT-4。

據悉，在常用基准測試中，Mistral Large的表現僅次於GPT-4，超過了GPT-3.5、谷歌的Gemini Pro和Meta的LLaMA 2 70 B。

這一次，誰會成爲“下一個OpenAI”呢？

標題：遊戲AI“精靈”！谷歌又出新王炸，新模型Genie重磅登場

地址：https://www.iknowplus.com/post/84671.html

轉載僅爲傳播優質文章，如有侵權請聯系我們刪除

遊戲AI“精靈”！谷歌又出新王炸，新模型Genie重磅登場