爆火的DeepSeek,足以載入史冊。很多年後人們回想起這一刻,結論或許是從2022年底OpenAI發布Chatgpt,中國AI發展的主流敘事始終是“追趕”,而DeepSeek橫空出世,將“追趕“變成了“創新”和“普及”,甚至是“重塑”和“超越”。

但VC們顯然是失意的,因爲包括“大模型六小龍”在內,他們支持的大模型創業項目,自始沒有一個達到DeepSeek這樣的全球熱度,幾乎與DeepSeek同時發布的,Kimi全新強化學習模型k1.5,雖然是全球繼OpenAI之後首個多模態類o1模型,在諸多層面能力接近o1甚至是超越,但沒有濺起多大水花,同樣淹沒在了DeepSeek狂熱的輿論中。

一切或許要從DeepSeek創始人梁文鋒登上新聞聯播,成爲總理的座上賓开始。他在這次會上說了什么,可能不是最重要的,輿論關心的是,爲什么一個留着長劉海的80後,會突然得到高層的關注?再看看朋友圈,哦?做量化基金的。更好奇了。

作爲長期跟蹤AI產業的一級市場觀察者,輿論發酵速度低於我的預期,程度卻遠超我的想象。1月20日,周日晚間梁文鋒登上新聞聯播,發酵了足足一周,顛覆全世界的“DeepSeek R1 550萬美元訓練成本”,只讓周五英偉達的股價下跌3.12%,轉過頭來的下周一,卻讓A股創業板收獲了根-2.73%的大陰线。當時我的評價是,DeepSeek打了英偉達們一個嘴巴,轉頭卻更狠地踹了A股一腳。

打臉來得很快,1月27日當天,英偉達低开低走下跌接近17%,全世界的算力一片哀嚎,高喊“狼來了”,DeepSeek就是那條狼。當然了,我個人的榮辱不算什么,打臉也是經常的事。但中國VC卻幾乎成了AI算力之外,最大的“受害者”,輿論不吝給予梁文鋒和他的理想主義最大程度的贊揚,同時也施加給中國VC極致的羞辱和討伐,比如小紅書有篇帖子,標題爲“DeepSeek再次證明,中國VC就是個笑話”。更不幸的是,點贊還過千了。

但我還是要旗幟鮮明地說一句,道德層面的討伐很低級,這個階段討論“VC爲什么沒投到DeepSeek”,除了情緒上的宣泄,也沒太大意義,沒投到就是沒投到,任何客觀或主觀的原因都像是辯解。進一步的反思雖然非常有必要,但也不是立刻,縱觀國內一級市場,從LP到GP,再到募投管退的各個環節,大量“頑疾”很難短時間根除,很多也根本不是VC/PE們能決定的。

我認爲亟待討論的是現在和未來,至少包括三個問題:現在DeepSeek能不能投到以及估值多少?DeepSeek對此前已經投資的各類AI項目有什么影響?DeepSeek引發的AI產業變革,對VC下一步在AI的資本部署,有哪些積極指引?


DeepSeek融資?梁文鋒“打太極”


關於DeepSeek估值多少以及能不能投到,這兩天已經有不少消息流出了。就在昨天晚間,有消息稱阿裏將以100億美元估值,投資10億美元佔股10%。對此阿裏副總裁顏喬很快通過朋友圈闢謠稱,“外界流傳阿裏投資 DeepSeek的信息是假消息”。不過,一位可能接近此次交易的投資人向投中網表示,“現在比較敏感,他們也不方便說,要再等等”,因此這筆被否認的交易,不排除還可能存在一些變數。

而在此之前,就有某AI投資人對投中網表示,DeepSeek正與投資人接觸,他透露的估值是80億美元,與前述“阿裏給出100億美元估值”的“假消息”有差距,而不管是80億美元,還是100億美元,DeepSeek的估值目前已遠超“大模型六小龍”中最高的MiniMax——40億美元。

據投中網了解,這幾天有不少投資人,都直接或間接找到梁文鋒確認是否正式啓動融資,估值也大致圍繞上述範圍,但梁文鋒並未給出承認或否認的正面回應,而是以“打太極”爲主。也有不少投資人找到DeepSeek負責IR的相關人士詢問是否正在進行融資,截至昨天都得到了否認的結果。

另外還有一層信息是,DeepSeek內部也有人“勸過梁文鋒很多次,DeepSeek要不要融資”。這至少意味着兩點,一是對於是否進行融資,DeepSeek內部意見也許並不統一,但決定權一定在梁文鋒,只有他握着开啓寶藏的鑰匙;二是梁文鋒近期很可能與一些投資人或產業資本有過接觸,但維持在一個極小的圈子。

比如多次對投資大模型嗤之以鼻的朱總,就肯定不在這個圈子中,即使DeepSeek讓他轉變了對大模型的態度,表示“我肯定會投啊”,但投中網向他詢問是否聽說DeepSeek融資的消息時,得到的回復是“沒有”。但朱總畢竟是朱總,對VC應不應該參與DeepSeek融資的重點拿捏得很准,“這個價格已經不太重要了,關鍵是參與在這裏面”。

扯遠了,總之現在VC對於DeepSeek融資這件事,預期是很高的,多位投資人從C端流量承接、激增的帶寬和算力成本、未來繼續scale up,以及最重要的,留住人才以保持持續的創新能力等角度,向投中網敘述了DeepSeek融資的必要性。

當然了,還是那句話,鑰匙只在梁文鋒,以及可以決定DeepSeek能否走向更大敘事可能的人的手中。接下來的,就是時間問題了。但從我個人出發,更樂於看到DeepSeek能否再堅持一段時間,一方面時間越長,期間博弈一定更加精彩;另一方面如某投資人在朋友圈中所說,“DeepSeek若能保持private company to build public good的純粹,這種優美是稀缺的。”


“無論如何要跪進去一些份額”


DeepSeek在春節前後的出圈,令大模型投資人心情復雜。驚喜在於,中國大模型企業能夠這么快趕上世界水平,恐慌則在於,整個AI投資的邏輯可能會發生巨大的變化。

至少在國內,DeepSeek已經贏了這場战爭。它正在進行的一輪融資估值已經達到80億美元,是行業裏估值最高的一家,這都得搶破頭或只能定向融。”一位AI投資人告訴我。

DeepSeek此前並未开放融資,初期資金由幻方量化支持。按照梁文峰在訪談中的說法,他也嘗試過找資方,但礙於自己專注於研究的想法和VC更多考慮商業化的訴求不相符,於是斷了念想。與之形成鮮明對比的是,爆火之後的DeepSeek开始被投資人包圍。

鋒芒已露,縱然想要善刀而藏也是難事,在前述投資人看來,如今融資也是形勢所迫,不得已而爲之。“現在DAU飆漲到2000萬,流量來得如此迅猛,已經明顯承接不住。如果DeepSeek只是开發模型,不做應用,那沒問題,但做了應用,現在每一天都要花幾百甚至上千萬出去,必須考慮服務器、網絡資源之類的問題。另外,已經跑通了單點,現在要去scale up,scale up也是要花錢的。”

但這一消息並未得到當事方的承認。面對最近前來問詢的投資人,DeepSeek融資負責人給出的說法仍然是,“沒有融資打算”。昨晚“阿裏計劃以100億美元的估值,投資10億美元認購DeepSeek10%股權”的消息也被阿裏副總裁明確否認,而這不妨礙阿裏巴巴美股盤前一度漲超6%。一筆投得出幾十億的國資和大廠,被認爲是最有可能入局DeepSeek融資局的候選人。一些有意思的細節是,幻方杭州總部所在的匯金國際大廈,與浙江省金控在同個寫字樓不同座,目前已經擠滿了記者和投資人,DeepSeek北京辦公室所在的融科大廈,又跟百度投資在一座樓上。

一位省級國資的投資人對投中網表示,最近他們機構“從上到下”,都在跟DeepSeek方面接觸,無論如何希望“跪一部分份額”進去,但DeepSeek口咬得很死,堅稱目前並沒有开放融資窗口。

事實上,對AI圈子裏的人來說,DeepSeek不算神祕,疫情期間囤了一萬張A100的江湖傳說流傳甚廣。我從投資人處了解到的信息是,2023年初,DeepSeek曾經聊過一圈大模型公司和投資機構,也包括小紅書的創始人毛文超。不過在今年1月,DeepSeek和小紅書達成合作,目前DeepSeek入駐的官方社交媒體,也只有小紅書、X、微信公衆號。顯然,梁文鋒對小紅書是有些偏愛的。

跟梁文峰的說法一樣,聊完以後,梁文峰和VC們發現大家的目標並不一致。“VC都是幫LP管錢,都得賺錢,所以就談不到一塊去。”2023年7月,梁文鋒成立杭州深度求索(DeepSeek)人工智能基礎技術研究有限公司,專注於通用人工智能與大模型研發。巧的是,字節开始投入AI研發也是在那個時間點。

另外的細節是,2022年左右,量化基金被政策持續打壓,幻方管理規模也持續縮減。而梁文鋒在創立DeepSeek前除了接觸過VC外,因爲手握大量的GPU算力集群,再加上梁文鋒自己的錢,曾想通過投資入股、找雲廠商合作等方式,將手中富裕的算力“用出去”,還爲此招了兩個人專門做战投,看了大量包括低空等在內的科技項目,但幻方的結論是,“外面能做的,自己也能做”,多數項目“意思不大”,最終“一個也沒投”。後來基於梁文鋒技術理想主義的情懷,DeepSeek應運而生。

大模型市場的變化瞬息萬變,DeepSeek很快將成爲攪動市場的鮎魚。“我去看各種AI項目的時候,基本上都會問對方在用哪些基座,覺得哪些模型比較好,到2024年的時候,大家的普遍反饋已經是通義、豆包和DeepSeek。”一家投資機構的合夥人Eric(化名)告訴我。

DeepSeek在大衆層面的普及來源於兩個模型。1月13日,DeepSeek推出App版本,使用V3大模型,這是一個全开源MoE(混合專家)模型。DeepSeek報告稱其V3模型的訓練成本僅爲600萬美元,只有Llama 3的1%。1月20日,DeepSeek發布开源大模型R1,又以極低訓練成本達到與OpenAI最新O1模型相近的性能。一天後,DeepSeek登頂蘋果中美地區應用商店免費下載排行榜。

“應該沒有人能預想到DeepSeek會這么火。發布V3的時候,業內都注意到了,但因爲當時 App沒上线,所以還沒有引爆C端。當應用發布之後,普通人都覺得產品效果好,DeepSeek便开始出現在街談巷議之中。自然流量和买來的流量,這時候差異一下就顯出來了。”一家機構的合夥人Jared(化名)說。

任何產品的火爆離不开天時地利人和,時點很重要。在Eric看來,當下AI的上升曲线已經變緩,預訓練的數據差不多用光了,大語言模型能力不再容易上升,只能轉換思路轉向以OpenAI的 O1和DeepSeek的 R1爲代表的推理模型。“這個時候,是選擇繼續砸大錢去搏一個上限,還是不追求那5%的進步而是把成本降到原來的1/10?DeepSeek代表的降成本路线恰恰出現在一個合適的時間點上。”


“六小龍”不走差異化之路

將很難再融到錢


“國內大模型訓練的綜合成本(數據,人工,電力和算力)比美國低,而DeepSeek因爲其出色的工程能力,更是把成本控制到極致。在未來兩個季度裏,DeepSeek會成爲行業基准线,降成本是大勢所趨。如果爲了提高5%的上限,再花10倍的錢,從資本和商業角度考量,這是不值當的。”Jared認爲。

大模型過去燒錢兇猛,研發成本降低,首先動搖的是對這些企業的估值邏輯。

Eric認爲,DeepSeek之所以在海外引發這么高的恐慌情緒,正是因爲那些大公司的估值要重新評價了。“過去大家相信,大模型本質上是資本的競爭,正如我們說2023年5月之前如果沒拿到1億美金,在國內就別搞大模型了。但當大家發現不需要那么多錢,大模型公司的估值恐怕很難撐得住。長期來看,估值是建立在你創造的價值基礎上,短期來看取決於大家認爲你的壁壘有多高。”

王榮進則認爲,DeepSeek出現後會不會對現有大模型公司估值產生影響,現在還不好說,但他們極低的成本對業內還是帶來衝擊。如果大模型企業能通過其他方式去創新降低訓練或推理成本,估值受到影響或許比較有限。“不排除國內的公司通過其他方式去創新達到類似的效果,關於這一點也值得期待。”

Jared的態度比較悲觀。他相信,如果“六小龍”不走差異化之路,將很難再融到錢。大廠有資本加持,可以繼續战鬥,但創業公司如果在單一項目上卷不到第一,基本上沒有太大意義。“當然,只要有差異化,並且不燒錢,苟活着也是個出路。”

事實上,“六小龍”已經分化出不同的路徑。有的公司仍在燒錢訓練大模型,比如我了解到某公司去年收入3個億左右,但成本卻高達20多億。有的公司已經放棄,比如零一萬物已與阿裏雲成立 “產業大模型聯合實驗室”,不再追求訓練超級大模型,但會繼續訓練參數適中的更快、更便宜的模型,基於後者打造可以賺錢的應用。

“當預訓練結果已經不如开源模型時,每個公司都不應該執着於預訓練。”在《晚點》訪談中,李开復如是說。也有的公司投入更多精力在多模態上,比如MiniMax。還有的公司轉向扎根垂直行業,比如百川的重點已經落在了做醫療大模型上。Jared認爲,最終這些大模型企業估值是否重構還是取決於商業化的成果,DeepSeek如果融資也會面臨一樣的商業化問題。


關於DeepSeek的共識和分歧


DeepSeek已經被一些人視爲“國運”的象徵,但能否獨佔鰲頭在投資人眼中仍有分歧。

Jared相信,大廠很難做出DeepSeek那樣的創新。原因在於,大廠資源過剩,反而就沒有人會想着如何極致地優化成本。同時內部賽馬嚴重,更多是在卷人,而不是卷事情。KPI通常被簡化爲“實現多少DAU”這一通過买流量就能實現的目標,也會導致大家很難扎扎實實做技術創新。而做對衝基金出身的人對資源和成本看得很重,總是在想着怎么工程化創新降低成本,這跟大廠的基因和技能點也不一樣。

但Eric認爲,在那些明星創業公司裏DeepSeek會長期居於第一位,但還很難說DeepSeek比阿裏和字節的大模型厲害,從所採用的技術範式上來看,理論上OpenAI的O1的範式上限要高於DeepSeek 的R1。“到底應該省錢,還是追求高上限,這是一個選擇問題。放在國內來講,大家的能力都很強,只不過側重點不一樣,豆包和通義都做了多模態模型,DeepSeek做得更聚焦,只做語言模型,它最強大的地方還是在於省錢。”

春節期間,軒元資本創始合夥人王榮進一直在找資料研究DeepSeek的底層邏輯。在他看來,DeepSeek在應用、工程、架構等多個方面做了很多創新。至於市場討論的借鑑方面,他覺得這也沒什么,OpenAI的Transformer源於Google,蘋果的iOS部分參考了富士施樂,微軟的Microsoft的GUI部分參考的是富士施樂的Xerox Alto,大家都是站在巨人的肩膀上更進一步。”

外媒的描述更有意思。有的媒體將OpenAI和DeepSeek之間的不同路徑比作17世紀英國內战中“錯誤但浪漫”的保皇黨與“正確但令人反感”的圓顱黨之間的衝突。人工智能保皇黨不惜一切代價追求AGI,而人工智能圓顱黨專注於更實際的目標,盡可能高效地解決特定問題。海外有關大模型融資的最新消息是,Ilya Sutskever 創立的Safe Superintelligenc正以200億美元估值洽談融資——仍然是一個昂貴的價格。

彌漫在行業上空的還是一團迷霧。“連着幾年,大模型在年初都有讓人震撼的新進展,而且往往年初和後面發生的事情脫節,所以現在誰也不能預測年底到底會發生什么。”Jared說。

Eric認爲,R1代表的這種後訓練模型模式剛剛开始,DeepSeek只是在中間提出了一個分叉,到底會跑成什么樣還不知道,但毫無疑問創業的需求會急劇加大。在他看來,DeepSeek更重要的意義在於帶來一種全新的價值觀。“他們的目標不是說賺多少錢,而是能不能做出有價值的創新,這個價值觀值得中國企業尤其是大公司思考。”

正如梁文峰在採訪中所說,“以後硬核創新會越來越多。當這個社會讓硬核創新的人功成名就,群體性想法就會改變。我們只是還需要一堆事實和一個過程。”過去四十年,房地產和互聯網的造富運動都並非由底層創新驅動,而只有當人們看到回報和付出有一定的關系,投機才不會成爲中國商業社會最大的價值觀。

“2025年,AI應用會迎來爆發之年。”

這是我在去年年底從投資人和FA口中聽到的最多的觀點,甚至有投資人明確表示:2025年只看AI應用。

春節過後,有了DeepSeek這把火,投資人和企業們對於AI應用的期盼更加強烈了。但興奮之余,他們眼中也難掩迷茫:知道機會來了,可看不到機會在哪兒?

需要承認的是,面對DeepSeek帶來的變革,大部分公司都沒來得及在战略層面做調整,但從行動來看,都在緊急圍繞DeepSeek开會。也有投資人表示,开工之後接連兩天,都在开關於DeepSeek的會,已經做了緊急部署。

提到DeepSeek,很多人的第一印象是高性價比。單就這一點帶來的影響,業界也並未達成一致。

TrainiCEO孫鄰家認爲,“技術過度平權不一定是好事,會失去創新的驅動力。現在看來,2025年是一個從閉源套殼轉爲开源套殼的年份,造成的結果可能是出現一堆同質化產品,依然找不到盈利的方法。目前,能做Fine-tuning(大模型微調)的公司沒有想象中的那么多,能持續做並且有創新的就更少,缺數據和人才。”

當然,他也承認,模型變小和經濟性提高,對應用肯定是積極影響,但是在應用側,技術不是最大的制約,而是對產業的理解。

其實,現在Prompt已經可以滿足很多應用的需求了,似乎沒有做出什么好產品。如果因爲iOS閉源,我們有了安卓系統,也沒有出現很多手機品牌。在安卓上長出的軟件應用也沒有殺死iOS和其應用。Llama的能力也很強大,可以滿足多數應用的需求,離我們期待的也差很遠。

更多的人還是愿意看到DeepSeek給應用端帶來的積極一面,比如有投資人指出,DeepSeek出來之後,做應用的廠商只需要專注在應用本身的前後端交互體驗,同時再基於場景做打磨就可以了,這省去了很多基礎層面的投入。

合思創始人兼CEO馬春荃指出,AI的發展就像電力的發展一樣,會催生出非常多的應用的廠商,這是一個基礎的能力。DeepSeek的出現把這種基礎能力的成本變成白菜價。

他進一步解釋稱:很多原來舍不得用AI的地方,現在可以去進行探索和創新,因爲當下AI在算力上的消耗成本,相比於客戶價值或者輸出結果相比,已經是九牛一毛了。比如在小票識別領域,我們過去只敢小小批量應用,如今幾乎變成了零成本,我們就可以“肆無忌憚”地應用了。

需要指出的是,究竟是C端應用還是B端應用更能讓VC們青睞時,我從投資人那裏得到了統一的答案——那就是to B應用更具投資性價比。

就連非投資行業的企業內部人員,也認爲今年DeepSeek相關項目在投資市場會比較火爆,因爲在他們看來,完全开源的DeepSeek,會加速很多細分場景模型的誕生。

首先,B端用戶是最具付費能力的,而且所有B端應用都還是沿着原來企業軟件的思路,也就是說每個領域都將有自己的大模型。這是因爲不同領域間的數據庫和知識庫存在差異。

但當下的問題是,應用廠商自己不做模型,看不到需求和效果,更重要的,應用創業不同於大模型,投資人們不會給企業很多的時間和資金來試錯。

同樣,現在還無法預測哪些場景會爆發,只能說這些細分應用的出現正在加速。

其次,成本低了,之前只能在實驗室裏進行的,可以應用到每個角落。換句話說,當前很多沒有被AI覆蓋的場景,會有更多的廠商用非常低成本的AI去進行改造。

在國科嘉和高級合夥人陸佳清看來,如果有特色應用能夠出現,那可以很快起量。尤其是有應用場景的上市公司,之前打造一個行業應用可能需要幾百台服務器,現在只需要十台,成本驟降。

第三,AI應用肯定會越來越多,而且會佔據市場更多的眼球,因爲眼下應用還沒有實現真正大規模的商業化。

對於爲何不會選擇C端產品,這是因爲投資人們有這樣一個共識——C端應用遲早是大廠們的天下,這在之前是有跡可循的。

除了應用層外,在更底端的硬件層也在發生巨變。比如爲了承接住DeepSeek帶來的流量洪流,此前各地建造的闲置計算中心也被盤活了,相關從業者表示,這些計算中心當下已經开始產生收益。而DeepSeek本身也因爲此前浙江省建造的數據中心獲益。有接近DeepSeek的投資人表示,自從節前爆火後,浙江將很多空余的數據中心低價給了DeepSeek。

據某雲服務廠商的體感來看,上线了DeepSeek R1版本之後,用戶的注冊量有一個非常明顯的提升,一兩天內注冊量增長了一個數量級,大約是10~20倍的水平。而這些注冊用戶主要分爲兩類,一類是個人开發者,他們會去驗證自己的一些創新思路,另一類是企業的开發人員,這類用戶則更多是想通過AI與業務結合做創新應用。

在這個領域,業界也存在着一些非共識。

“DeepSeek的出現短期內可以顛覆對算力的邏輯,但長期來看,AI和應用的蓬勃發展,必然帶來總體需求的增長,算力還是有價值的。當然,對於國產GPU來講還是偏利空的,因爲低制程的芯片可以用了,市場就不需要存在那么多家了,未來能夠上市的也將只有一兩家。對於其他國產大模型公司也是偏利空的。”陸佳清如此判斷。

另一位芯片投資人表示:“這對芯片行業算是絕對利好,核心在於可以用算力比較低的芯片做出很好的訓練效果,這意味着很多芯片廠商能夠獲得相關訂單。同時,越低的訓練成本越有助於人工智能在應用領域的滲透。”

作爲專注於智能汽車產業鏈的投資機構,王榮進也會關注DeepSeek是否會對智駕格局產生影響,會不會引起其他公司快速迭代,衝出一條新的路出來,從而導致相關標的的估值的重估。

關於DeepSeek帶來的變革和機會,我相信遠遠不止上述討論。更重要的是,DeepSeek的崛起不僅是一次技術迭代,更帶動了國內目前最稀缺的東西——信心。我不由想起了《人類簡史》關於“講故事”和“相信故事”的觀點,人類社會幾千年來,就是從一次次舊敘事崩塌和新敘事構建螺旋向上發展的,樂觀點看,也許DeepSeek就是中國經濟在各階層重新凝聚信心的轉折點。



標題:“我勸過梁文鋒很多次,DeepSeek要融資”

地址:https://www.iknowplus.com/post/191324.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。