OpenAI 急了！擬搶先推出“多模態”模型，...

AI賽道上，谷歌和OpenAI的廝殺甚是激烈。

這不，谷歌前腳剛傳出要推出Gemini多模態大型語言模型，後腳OpenAI就勢要迎頭趕上，擬推出多模態模型GPT-vision，以及代號爲Gobi的新模型。

你追我趕之際，兩者都想在下一代“多模態”大型語言模型搶先一步。

據 The Information 爆料，OpenAI 即將推出多模態模型GPT-vision，這或可能成爲繼GPT-4之後的最大更新。另外，OpenAI 還在开發一款名爲 Gobi 的多模態大模型。

據悉，OpenAI 的這款GPT-vision是計劃將大型語言模型GPT-4與多模態功能相結合。

功能優勢上，它可以處理圖像和文本，比如用戶只需要給該模型發送一張網頁草圖，該模型就可以爲網站生成代碼，或者向用戶提供可視圖表的文本分析；此外還可以圖像生成，通過簡單的文本生成繪畫、logo或表情包。

不過目前關於這款大模型產品的具體信息尚不確認，OpenAI也尚未對此做出回應。

值得關注的是，OpenAI 的多模態模型並非首次被大家關注。此前3月份，在其發布GPT-4時就曾預展示了多模態功能。

不過當時除了一家爲盲人或視力低下的人提供技術的公司“Be My Eyes”外，OpenAI並沒有向其他公司开放。

並且在此後較長的一段時間裏，關於OpenAI多模態模型的進展消息便沉寂了。

直至當下，OpenAI又傳出了准備在更大範圍內推出被稱爲GPT-Vision的功能。此外，OpenAI還可能會在GPT-Vision之後再推出Gobi，不過其訓練尚未开始。

OpenAI急吼吼的要推出多模態模型的主要壓力來自谷歌。

此前，Gemini 是谷歌开發者大會上公布的多模態大模型產品，預計在不久後進行測試發布。據The Information 報道，谷歌已开始向外部开發者授予其 Gemini AI 系統的訪問權限。

去年來，微軟支持的 OpenAI 推出的 ChatGPT 席卷了全球科技界，看着這勢頭，今年谷歌加大了對AI的投資以迎頭趕上。

在5月的谷歌开發者I/O大會上，谷歌就曾提到，Gemini的目標就是多模態、高效集成工具、API。要知道，此次谷歌這款Gemini 的推出就是旨在與 OpenAI 的 GPT-4 模型抗衡的。

據悉，Gemini 是一個大型語言模型的集合，它可以從聊天機器人到總結文本或根據用戶想要閱讀的內容（如電子郵件草稿、音樂歌詞或新聞報道）生成原始文本的功能提供支持。它還有望幫助軟件工程師根據用戶要求查看的內容編寫代碼並生成原始圖像。

報道稱，Gemini會將AlphaGo與GPT-4等大模型的語言功能合並，系統解決問題和規劃的能力將大大增強。目前谷歌正在向开發人員提供相對較大的 Gemini 版本，但不是其正在开發的最大版本，該版本將更接近 GPT-4。

此外，谷歌計劃Gemini提供方式是通過其Google Cloud Vertex AI雲服務平台進行，預期價格爲每個用戶每月30美元。這也預計將成爲谷歌新的收入來源，尤其是針對企業客戶。

這樣來看，在同一賽道上，谷歌和OpenAI這番“秀肌肉”的較量是遲早的事，此前OpenAI的ChatGPT遙遙領先同行們，這一回谷歌祭出了“大殺器”可能讓OpenAI真的急了。

標題：OpenAI 急了！擬搶先推出“多模態”模型，力爭擊敗谷歌“大殺器”Gemini？

地址：https://www.iknowplus.com/post/34208.html

轉載僅爲傳播優質文章，如有侵權請聯系我們刪除

OpenAI 急了！擬搶先推出“多模態”模型，力爭擊敗谷歌“大殺器”Gemini？