“閃電”奇襲!零一萬物新旗艦模型超越GPT-4o,進擊全球模型企業前三
在人工智能的快速發展中,大模型技術已成爲全球科技競爭的焦點。
10月16日,繼上半年千億參數模型 Yi-Large 之後,時隔五個月,零一萬物發布了最新的旗艦模型Yi-Lightning(閃電),中國大模型中首度超越 GPT-4o。
Lighting直譯爲閃電,從命名可以看出,本來應該是說新模型的推理速度進一步提升。但零一萬物這次,也確實做了個“閃電奇襲”!
國產大模型首超GPT-4o
在國際權威盲測榜單 LMSYS 上,Yi-Lightning 超越了超越了OpenAI的GPT-4o和 Anthropic 的 Claude 3.5 Sonnet,排名世界第六,中國第一,實現了歷史性的突破。
圖注:國際權威盲測榜單LMSYS 中,大語言模型綜合能力排名
值得關注的是,“Yi-Lightning”的評分幾乎與馬斯克最新推出的 xAI 模型 Grok-2-08-13持平,並大幅領先於 GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18以及 Claude3.5Sonnet 等其他競爭對手。
這也意味着零一萬物緊隨 OpenAI、Google 之後,與xAI 打平,進擊全球前三大模型企業。
值得一提是,這次Yi-Lightning大舉殺出重圍,Lmsys團隊更是特意發帖子,稱這是競技場上的大新聞:
這一成就不僅展示了零一萬物在AI大模型領域的技術實力,也爲中國AI的發展注入了強心劑。Yi-Lightning模型的推理速度和生成質量都有了顯著提升,首包時間減少了一半,最高生成速度提升了近四成,展現了“極速”特點。
零一萬物的這一成就,是在公司堅持“模基共建”战略,即模型訓練、AI基礎設施和AI應用三大團隊的協同合作下取得的。
這種模式使得零一萬物能夠在保持模型性能的同時,大幅降低推理成本,使得Yi-Lightning模型的API價格降至每百萬token僅需0.14美元(0.99元人民幣),直逼行業最低價,相比之下GPT-4o的成本爲4.40美元,爲开發者和企業客戶提供了極具性價比的選擇。
中美大模型差距縮短至五個月
在商業化方面,零一萬物也展示了其清晰的战略布局。
公司不僅在ToC端有所布局,還在ToB端推出了AI 2.0數字人解決方案,聚焦零售和電商等場景,通過Yi-Lightning模型的加持,提升了數字人的實時互動效果和話術生成的准確性。
此外,零一萬物還計劃在近期發布更多的ToB解決方案,包括AI Infra解決方案和私有化定制模型等,進一步拓展其在企業級市場的服務能力。
他分析,中國大模型與美國頂級大模型之間的差距已經從之前的7至10年迅速縮短至僅有六個月。
更令人振奮的是,通過技術創新和優化,零一萬物最新旗艦模型Yi-Lightning已將這一差距進一步縮減至五個月。李开復強調,這一成就標志着中國在AI領域的巨大潛力和快速進步,展現了中國科研團隊的才能和決心。
他堅信,盡管未來可能會有新的挑战,例如OpenAI等公司推出新模型版本可能會再次影響競爭格局,但零一萬物將繼續堅持預訓練模型的工作,不斷推動中國AI技術向前發展,縮小與國際領先水平的差距。
在AI大模型的競賽中,零一萬物的Yi-Lightning模型不僅在性能上取得了突破,還在成本控制上展現了優勢。
這得益於公司在模型架構上的創新,如採用MoE混合專家模型架構,以及在訓練過程中採用的多階段訓練方法和混合注意力機制。這些技術的應用,使得Yi-Lightning在處理長序列數據時能夠保持高性能,同時降低計算成本。
闢謠“掉隊”傳聞
近來,有市場消息稱,被稱爲“AI六小虎”的6家中國大模型初創企業月之暗面、百川智能、智譜AI、Minimax、零一萬物、階躍星辰,其中有2家逐步放棄預訓練模型,縮減了預訓練算法團隊人數,業務重心轉向AI應用,而零一萬物就是其中一家。
幾日前,李开復先是在在朋友圈進行了闢謠,他表示零一萬物一直在做預訓練,去年和今年發布的Yi-34B、Yi-Coder,Yi-VL等都是發布時全球第一梯隊。
此次發布會上,李开復也公开闢謠稱,零一萬物絕不會放棄預訓練模型工作。
其回應稱,預訓練既是技術活也是費錢的事兒,但據他了解,目前“AI六小虎”做預訓練仍不成問題。
“這6家公司融資額度都是夠的,我們做預訓練production run,一次花費三四百萬美金,這個錢頭部公司都付得起,我覺得中國的6家大模型公司只要有夠好的人才和想做預訓練的決心,融資額跟芯片都不會是問題。”
標題:“閃電”奇襲!零一萬物新旗艦模型超越GPT-4o,進擊全球模型企業前三
地址:https://www.iknowplus.com/post/157652.html