美東時間周四,OpenAI 宣布推出其迄今爲止最強大的迷你版模型——GPT-4o mini。

OpenAI稱,GPT-4o mini 具備文本、圖像、音頻、視頻的多模態推理能力是目前最強的多模態小模型之一。

性能比GPT-4更好。GPT-4o mini 在 MMLU 上的得分爲 82%,目前在LMSYS 排行榜上的聊天偏好方面優於 GPT-4 。

API降價60%。GPT-4o mini 的商用價格是每百萬輸入 token 15 美分,每百萬輸出 token 60 美分比之前的 Frontier 型號便宜一個數量級,比 GPT-3.5 Turbo 便宜 60% 以上。

對此,OpenAI CEO 山姆・奧特曼表示,通往智能的成本已經too cheap to meter

網友也戲稱,GPT-4o mini妥妥的大模型“價格屠夫”。


最能打的多模態小模型?


據OpenAI稱,GPT-4o mini的數學、編碼、視覺等推理能力非常好,是目前最強、最具成本效益的多模態小模型。

目前,GPT-4o mini 在 API 中支持文本和視覺,未來還將支持文本、圖像、視頻和音頻的輸入和輸出。

該模型具有 128K 個 token 的上下文窗口,每個請求最多支持 16K 個輸出 token,並且擁有截至 2023 年 10 月的知識。

OpenAI還表示,GPT-4o mini 在文本智能和多模態推理方面的學術基准測試中超越了 GPT-3.5 Turbo 和其他小型模型,並且支持的語言範圍與 GPT-4o 相同。

它還在函數調用方面表現出色,這可以使开發人員構建獲取數據或使用外部系統採取行動的應用程序,並且與 GPT-3.5 Turbo 相比,它的長上下文性能有所提高。

測試數據顯示,推理任務上,GPT-4o mini在涉及文本和視覺的推理任務上優於其他小型機型。在MMLU上得分爲82.0%,而谷歌的Gemini Flash爲77.9%,Anthropic的Claude Haiku爲73.8%。

在數學和編碼方面,在MGSM測試中GPT-4o mini得分爲87.0%,而Gemini Flash爲75.5%,Claude Haiku爲71.7%。

GPT-4o mini在衡量編碼性能的Human Eval上得分爲87.2%,而Gemini Flash的得分爲71.5%,Claude Haiku的得分爲75.9%。

在多模態MMMU上,GPT-4o mini得分爲59.4%,而Gemini Flash爲56.1%,Claude Haiku爲50.2%。

在安全方面,GPT-4o mini內置了多層過濾模式,可有效減少色情、種族歧視、不當言論等非法內容的輸出,也首次使用了指令層級結構來全面提升模型的安全性能。

在定價上,GPT-4o mini 的商用價格是每百萬輸入 token 15 美分,每百萬輸出 token 60 美分。

也就是說,GPT-4o mini 生成一本 2500 頁的書,價格只需要 60 美分。

OpenAI 也計劃在未來幾天推出 GPT-4o mini 微調版本。

目前,GPT-4o mini 已作爲文本和視覺模型在 Assistants API、Chat Completions API 和 Batch API 中提供。

在 ChatGPT 中,免費版、Plus 版和團隊版用戶從今天开始將能夠使用 GPT-4o mini,以替代 GPT-3.5。企業用戶也將從下周开始使用。


大模型成本2年驟降99%


OpenAI稱,很高興能夠繼續引領潮流。

其設想的未來是模型可以無縫集成到每個應用程序和每個網站上。GPT-4o mini 爲开發人員鋪平了道路,使他們能夠更高效、更經濟地構建和擴展強大的 AI 應用程序。

AI 的未來將變得更加易於訪問、可靠,並嵌入到我們的日常數字體驗中。

近幾年,人工智能飛速進步,成本也在大幅降低。

OpenAI舉例稱,自 2022 年推出功能較弱的模型 text-davinci-003 以來,到如今的 GPT-4o mini ,每個 token 成本已下降了 99%。

OpenAI致力於繼續沿着這條降低成本、同時增強模型能力的軌跡前進。



標題:OpenAI又开卷!GPT-4o mini免費上线,更快、更便宜,大模型的“價格屠夫”?

地址:https://www.iknowplus.com/post/128526.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。