OpenAI推出GPT-4.5,高情商加持,“活人感”更強!
2月27日,OpenAI重磅推出最新人工智能模型,該公司稱,這是其迄今爲止最大、最棒的聊天模型。
其最引人注目的亮點,當屬 “活人感強” 這一特性。OpenAI表示,用戶與GPT-4.5交互時感覺更爲自然,模型展現出更高的“情商”。
目前GPT-4.5僅面向每月200美元的ChatGPT Pro計劃用戶开放,公司計劃下周开始向Plus和Team用戶推出。
核心亮點:活人感更強!
OpenAI僅用一場持續了不到14分鐘的發布會介紹了GPT-4.5模型。
GPT-4.5作爲去年5月發布的GPT-4o模型的下一代產品,是OpenAI最後一款非推理模型。從GPT-5起,OpenAI的推理和通用模型將實現融合。
OpenAI稱,GPT-4.5將是其聊天機器人系統中最後一個不進行“思維鏈推理”的版本。
此次發布之後,OpenAI後續模型可能會像人類一樣,在回答問題前花費更多時間思考,而非即刻回應。
值得注意的是,“活人感更強”是GPT-4.5的一大顯著亮點。
OpenAI指出,用戶與GPT-4.5交互時感覺更爲自然,模型展現出更高的“情商”,這讓它在提高寫作、編程和解決實際問題等任務中非常有用。
當用戶表示,因考試失敗而感到沮喪時,GPT-4.5會像朋友一樣給予安慰並傾聽,展現出極高的情感理解與回應能力。反觀GPT-4o,面對相同情境,其反饋則顯得較爲機械。
OpenAI研究副總裁MiaGlaese表示,該模型獨特之處在於能進行熱情、直觀且自然流暢的對話,對用戶需求的理解能力更強。
此外,OpenAI在周四的博客文章中提到,GPT-4.5“擁有更廣泛的知識和對世界更深入的理解,減少了幻覺現象,在衆多主題上的可靠性得以提高”。
在與GPT-4o以及近期發布的推理模型o3-mini的性能對比中,GPT-4.5優勢明顯。在簡單問題回答准確率上,GPT-4.5達到62.5%,遠超GPT-4o的38.2%和o3-mini的15.0%;幻覺率方面,GPT-4.5爲37.1%,低於GPT-4o的61.8%和o3-mini的80.3%。
在人工智能模型基准測試中,GPT-4.5在數學、科學等領域的表現優於GPT-4o,在語言和多模態領域勝過o3-mini,不過在科學和數學方面略遜一籌。
此外,GPT-4.5具備通過搜索獲取最新信息的能力,支持文件和圖片上傳,還可利用畫布進行寫作和編碼。但目前不支持ChatGPT中的語音模式、視頻和屏幕共享等多模式功能。
面臨GPU荒
目前GPT-4.5僅面向每月200美元的ChatGPT Pro計劃用戶开放。OpenAI表示,將努力在未來讓更多用戶能夠使用該模型,公司計劃下周开始向Plus和Team用戶推出,再下周向Enterprise和Edu用戶推出。
OpenAI的首席執行官Sam Altman在X平台還發文指出,GPT-4.5模型太大了,以至於公司正面臨GPU(運行和訓練AI系統所需芯片)短缺問題。
他表示:“這並非我們期望的運作方式,然而,導致GPU短缺的增長激增情況實在難以精准預測。”不過,他也補充道,預計未來幾周會補充上萬塊GPU,以緩解當前的困境。
待下周GPU到位後,OpenAI便會开始向每月支付20美元訂閱費用的Plus用戶推送GPT-4.5。
值得關注的是,OpenAI在全球範圍內都面臨着來自競爭者的壓力。
在國內,人工智能初創公司DeepSeek推出的最新模型DeepSeek-V3,在自然語言處理、代碼生成、復雜推理等任務中表現優異,且訓練成本僅爲同類模型的十分之一。在國外,谷歌的Gemini、Anthropic的Claude、微軟的CoPilot以及埃隆・馬斯克創建的Grok3等,也都在不同程度上對OpenAI構成挑战。
此前,OpenAI宣布了GPT-5的相關計劃。OpenAI表示,不會將推理/編碼模型作爲獨立產品發布,而是把相關功能整合進統一的GPT-5系統。GPT-5的發布將實現o(Omni)系列模型(如GPT-4o)的“推理”能力與GPT模型語言能力的融合。
不過當被問到發布時間時,Altman則表示,還要幾個月。
標題:OpenAI推出GPT-4.5,高情商加持,“活人感”更強!
地址:https://www.iknowplus.com/post/197611.html