2024:AI Agent智能體的落地之年
當前基於大語言模型的應用落地緩慢、同質化嚴重,單一文字模態、任務鏈長度短等爲技術層面主要約束。自2024年以來,Google、OpenAI等頭部廠商模型技術路线更側重於應用落地,原生多模態、長文本處理成爲其算法模型更新的重點,AI Agent(智能體)作爲當前語言模型應用落地的最佳形式,料將迎來技術轉折。展望後續AI Agents應用的發展路徑,成本優化將是焦點,目前的技術方案提供了多種針對成本問題的優化方案,但仍需要時間來進行實踐,我們判斷距離AI Agents應用落地還有約6-12個月時間。投資維度,我們建議關注:AI Agents的核心記憶部分(數據倉庫、向量數據庫等)、AI算力(芯片、存儲、網絡)、上層應用環節(互聯網、軟件)等相關環節領先廠商。
報告緣起:
在2023年的AI熱潮過去後,市場投入了大量人力與資本押注基於語言模態的Transformer大模型,如GPT、Gemini、Claude等,其在語言問答的相關能力上已經較爲成熟,但遲遲沒有看到進一步的爆款應用落地。當前AI應用仍主要圍繞以擴散模型(Diffusion Model)爲底層的圖片創作和圖片修改模型,以Transformer爲底層的大語言模型整體應用落地進度較爲緩慢。我們預計2024年以來的技術路线變化將顯著改變這一情況。考慮到當前頭部模型廠商對多模態以及長文本能力的重視,我們判斷AI Agent(智能體)將會是當前語言模型應用落地的最佳形式。
AI應用現狀:落地進度較慢,同質化嚴重。
當前較爲成熟的AI商業化模式集中在文生圖,基於擴散模型的應用進展迅速,而大語言模型的落地速度較慢。擴散模型因其低成本和高效生成圖像的能力而受到青睞,Midjourney和Adobe等公司在這一領域取得了顯著成果。相比之下,盡管Transformer模型備受關注,但其商業化進展緩慢,成功應用主要集中在GPT Store和微軟Office Copilot等少數項目。
大模型應用落地面臨兩大主要挑战。首先,單一的文字模態限制了實際應用場景,多模態模型由於成本和延遲問題尚未廣泛應用,難以滿足復雜需求。根據《2024: Gartner's IT Automation Trends Revisited》報告,Gartner預計,截至2024年,圖片內容處理將佔實際使用場景的32%,而文字模態無法滿足這一需求。其次,任務流程鏈較短導致模型同質化,缺乏對復雜任務的支持,影響應用效果和用戶體驗。這些問題表明,提升記憶能力和支持多模態輸入是實現大模型廣泛應用的關鍵。
AI Agent技術支撐:原生多模態、長文本記憶等。
2024年初,多模態與長文本處理成爲AI大廠更新的核心重點,Gemini 1.5 Pro、Claude 3、GPT-4o以及Kimi等模型在多模態能力與長文本處理上取得突破,意味着AI Agent技術出現標志性轉折點。原生多模態技術有效解決了Agent模態轉換中的延遲問題,OpenAI推出的GPT-4o通過端到端訓練處理多模態輸入,充分體現了原生多模態在AI Agents應用中的潛力。支持長任務鏈流程是避免模型同質化的核心要點,其中長上下文(long context)被認爲是解決問題的根本途徑。2024年初各大模型在文本輸入能力上實現大幅提升,通過優化編碼器-解碼器架構和注意力機制,模型在長任務鏈記憶上的表現顯著提升,從基礎能力上對AI Agent的支持成爲可能。
AI Agent當前約束:成本優化。
成本是增加上下文長度帶來的核心問題,AI Agent的落地需要進一步優化成本。上下文長度增加會顯著提升attention的計算成本,如果將KV Cache持久化,則需要大量存儲空間。如果Agent要與用戶建立長期關系,例如每天一小時的語音聊天,大約會生成15K tokens,一個月就會達到450K tokens,超出大多數長上下文模型的限制。即使支持450K tokens的上下文,做簡單估算GPT-4-Turbo的1K輸出token成本爲$0.03大多數場景下用戶無法負擔如此高的費用。僅在一些to B應用場景和高附加值的to C場景(如AI心理咨詢、AI在线教育)中使用GPT-4-Turbo才能保持盈虧平衡。相比之下,從性價比更高的GPT-3.5开始構建Agent可能是更具經濟效益的選擇。我們測算,對於性能要求不高的簡單陪聊類Agent,8B模型的1K輸出token成本甚至可以降到$0.0001,是GPT-4-Turbo價格的1/300。因此,類似於MOE的模型路由可能是AI Agent的一個可行方向,可以將簡單問題分配給簡單模型,復雜問題分配給復雜模型,從而降低成本。
風險因素:
AI核心技術發展不及預期風險;科技領域政策監管持續收緊風險;私有數據相關的政策監管風險;全球宏觀經濟復蘇不及預期風險;宏觀經濟波動導致歐美企業IT支出不及預期風險;AI潛在倫理、道德、用戶隱私風險;企業數據泄露、信息安全風險;行業競爭持續加劇風險等。
投資策略:
2024年以來,Google、OpenAI等大廠的技術變化顯示出明顯更側重於大模型應用落地的趨勢:原生多模態能力以及長文本輸入解決了長期AI Agent類應用的兩大落地困境。展望後續AI Agents應用的發展路徑,預計成本問題將是短期主要阻礙,仍需時間進行優化。我們判斷距離AI Agents應用落地還有約6-12個月的時間。投資維度,我們建議關注AI Agents的核心記憶部分(數據倉庫、向量數據庫等)、AI算力(芯片、存儲、網絡)、上層應用環節(互聯網、軟件)等相關環節領先廠商。
注:本文節選自中信證券研究部已於2024年5月30日發布的《前瞻研究人工智能AI行業專題報告—2024:AI Agent智能體的落地之年》;
標題:2024:AI Agent智能體的落地之年
地址:https://www.iknowplus.com/post/112355.html