2024：AI Agent智能體的落地之年

當前基於大語言模型的應用落地緩慢、同質化嚴重，單一文字模態、任務鏈長度短等爲技術層面主要約束。自2024年以來，Google、OpenAI等頭部廠商模型技術路线更側重於應用落地，原生多模態、長文本處理成爲其算法模型更新的重點，AI Agent（智能體）作爲當前語言模型應用落地的最佳形式，料將迎來技術轉折。展望後續AI Agents應用的發展路徑，成本優化將是焦點，目前的技術方案提供了多種針對成本問題的優化方案，但仍需要時間來進行實踐，我們判斷距離AI Agents應用落地還有約6-12個月時間。投資維度，我們建議關注：AI Agents的核心記憶部分（數據倉庫、向量數據庫等）、AI算力（芯片、存儲、網絡）、上層應用環節（互聯網、軟件）等相關環節領先廠商。

報告緣起：

在2023年的AI熱潮過去後，市場投入了大量人力與資本押注基於語言模態的Transformer大模型，如GPT、Gemini、Claude等，其在語言問答的相關能力上已經較爲成熟，但遲遲沒有看到進一步的爆款應用落地。當前AI應用仍主要圍繞以擴散模型（Diffusion Model）爲底層的圖片創作和圖片修改模型，以Transformer爲底層的大語言模型整體應用落地進度較爲緩慢。我們預計2024年以來的技術路线變化將顯著改變這一情況。考慮到當前頭部模型廠商對多模態以及長文本能力的重視，我們判斷AI Agent（智能體）將會是當前語言模型應用落地的最佳形式。

AI應用現狀：落地進度較慢，同質化嚴重。

當前較爲成熟的AI商業化模式集中在文生圖，基於擴散模型的應用進展迅速，而大語言模型的落地速度較慢。擴散模型因其低成本和高效生成圖像的能力而受到青睞，Midjourney和Adobe等公司在這一領域取得了顯著成果。相比之下，盡管Transformer模型備受關注，但其商業化進展緩慢，成功應用主要集中在GPT Store和微軟Office Copilot等少數項目。

大模型應用落地面臨兩大主要挑战。首先，單一的文字模態限制了實際應用場景，多模態模型由於成本和延遲問題尚未廣泛應用，難以滿足復雜需求。根據《2024: Gartner's IT Automation Trends Revisited》報告，Gartner預計，截至2024年，圖片內容處理將佔實際使用場景的32%，而文字模態無法滿足這一需求。其次，任務流程鏈較短導致模型同質化，缺乏對復雜任務的支持，影響應用效果和用戶體驗。這些問題表明，提升記憶能力和支持多模態輸入是實現大模型廣泛應用的關鍵。

AI Agent技術支撐：原生多模態、長文本記憶等。

2024年初，多模態與長文本處理成爲AI大廠更新的核心重點，Gemini 1.5 Pro、Claude 3、GPT-4o以及Kimi等模型在多模態能力與長文本處理上取得突破，意味着AI Agent技術出現標志性轉折點。原生多模態技術有效解決了Agent模態轉換中的延遲問題，OpenAI推出的GPT-4o通過端到端訓練處理多模態輸入，充分體現了原生多模態在AI Agents應用中的潛力。支持長任務鏈流程是避免模型同質化的核心要點，其中長上下文（long context）被認爲是解決問題的根本途徑。2024年初各大模型在文本輸入能力上實現大幅提升，通過優化編碼器-解碼器架構和注意力機制，模型在長任務鏈記憶上的表現顯著提升，從基礎能力上對AI Agent的支持成爲可能。

AI Agent當前約束：成本優化。

成本是增加上下文長度帶來的核心問題，AI Agent的落地需要進一步優化成本。上下文長度增加會顯著提升attention的計算成本，如果將KV Cache持久化，則需要大量存儲空間。如果Agent要與用戶建立長期關系，例如每天一小時的語音聊天，大約會生成15K tokens，一個月就會達到450K tokens，超出大多數長上下文模型的限制。即使支持450K tokens的上下文，做簡單估算GPT-4-Turbo的1K輸出token成本爲$0.03大多數場景下用戶無法負擔如此高的費用。僅在一些to B應用場景和高附加值的to C場景（如AI心理咨詢、AI在线教育）中使用GPT-4-Turbo才能保持盈虧平衡。相比之下，從性價比更高的GPT-3.5开始構建Agent可能是更具經濟效益的選擇。我們測算，對於性能要求不高的簡單陪聊類Agent，8B模型的1K輸出token成本甚至可以降到$0.0001，是GPT-4-Turbo價格的1/300。因此，類似於MOE的模型路由可能是AI Agent的一個可行方向，可以將簡單問題分配給簡單模型，復雜問題分配給復雜模型，從而降低成本。

風險因素：

AI核心技術發展不及預期風險；科技領域政策監管持續收緊風險；私有數據相關的政策監管風險；全球宏觀經濟復蘇不及預期風險；宏觀經濟波動導致歐美企業IT支出不及預期風險；AI潛在倫理、道德、用戶隱私風險；企業數據泄露、信息安全風險；行業競爭持續加劇風險等。

投資策略：

2024年以來，Google、OpenAI等大廠的技術變化顯示出明顯更側重於大模型應用落地的趨勢：原生多模態能力以及長文本輸入解決了長期AI Agent類應用的兩大落地困境。展望後續AI Agents應用的發展路徑，預計成本問題將是短期主要阻礙，仍需時間進行優化。我們判斷距離AI Agents應用落地還有約6-12個月的時間。投資維度，我們建議關注AI Agents的核心記憶部分（數據倉庫、向量數據庫等）、AI算力（芯片、存儲、網絡）、上層應用環節（互聯網、軟件）等相關環節領先廠商。

注：本文節選自中信證券研究部已於2024年5月30日發布的《前瞻研究人工智能AI行業專題報告—2024：AI Agent智能體的落地之年》；

標題：2024：AI Agent智能體的落地之年

地址：https://www.iknowplus.com/post/112355.html