大模型入秋

0 評論 384 瀏覽 1 收藏 14 分鐘

2024年,大模型行業(yè)經(jīng)歷了從熱潮到冷靜的轉(zhuǎn)變。盡管融資事件和新產(chǎn)品發(fā)布依然頻繁,但從業(yè)者對行業(yè)的熱情逐漸降溫,市場對大模型的質(zhì)疑聲也日益增多。

到2024年的最后一個(gè)月,大模型依然是最熱鬧的賽道,沒有之一。

12月,智譜AI與階躍星辰相繼完成新一輪融資,OpenAI以直播的形式舉辦了一場長達(dá)12天的馬拉松式新品發(fā)布會。

但對從業(yè)者肖琳(化名)來說,年底的任何融資事件和新產(chǎn)品發(fā)布都已經(jīng)很難讓她眼前一亮,反倒是幾個(gè)月前的一張網(wǎng)傳圖片成了她的“年度記憶”。

這張圖片顯示,騰訊、字節(jié)、百度、科大訊飛和月之暗面旗下大模型的新增用戶留存率,在30天后均會降至1%以下。9月,它一度在社交媒體和從業(yè)者交流群中瘋傳。

假,是肖琳對這張圖片的第一印象,“圖片里的數(shù)據(jù)沒有任何可靠來源”。她不屑于去認(rèn)真討論它的可信度。

不過這并沒有阻止它的廣泛流傳,甚至肖琳自己也是傳播者之一。有人感嘆大模型任重道遠(yuǎn),有人預(yù)測未來有多少玩家能活下來,也有人批評圖片中的大模型不好用。

“(這張圖)之所以能引發(fā)這么大的波瀾,是契合了大家的情緒?!?/p>

一、寒風(fēng)

2024年,寒風(fēng)幾乎吹進(jìn)過大模型的每一個(gè)角落,連象牙塔里的人們也感受到了氣溫的降低。

張楠楠(化名)是一名人工智能方向的在讀碩士。過去兩年間,他時(shí)刻關(guān)注大模型的動(dòng)態(tài),這個(gè)行業(yè)的起伏一定程度上影響著他畢業(yè)后的工作前景。

6月,他在與學(xué)長學(xué)姐的交流中,得知在大模型“六小龍”中已經(jīng)有公司放棄了預(yù)訓(xùn)練。

“六小龍”是指月之暗面、MiniMax、零一萬物、百川智能、智譜AI和階躍星辰這六家公司,它們是國內(nèi)大模型的頭部初創(chuàng)公司。此前有媒體報(bào)道稱,六小龍中有兩家停止了預(yù)訓(xùn)練。

投資機(jī)構(gòu)分析師陳琳(化名)告訴雪豹財(cái)經(jīng)社,“絕對不止兩家。”

預(yù)訓(xùn)練減少,讓張楠楠開始擔(dān)心,未來幾年大模型公司的數(shù)量會變少、相關(guān)崗位的薪資會降低,這可能會波及他未來的就業(yè)和薪資。

張楠楠的部分擔(dān)憂已經(jīng)變?yōu)楝F(xiàn)實(shí)。

凱文(化名)是一位服務(wù)于大廠和“六小龍”的大模型獵頭。他發(fā)現(xiàn),從4月起,不管是大廠還是六小龍,招聘需求都在顯著減少。今年,他手中大模型崗位比去年同期減少了30%~40%。

求職者的漲薪訴求也越來越難談。去年,凱文推薦的候選人,薪資翻倍的多到他記不清。今年,漲薪一倍的候選人只有一位,準(zhǔn)確地說,還只是接近翻倍。

一家招聘方為頻繁跳槽的求職者畫了一條紅線:五年跳三次。如果候選人的跳槽頻率高于這條線,“連面試機(jī)會都沒有”。

與崗位一起收縮的,還有投資人的決心。

陳琳在與投資人溝通中發(fā)現(xiàn),原本懷著FOMO(Fear of Missing Out)情緒的投資人,開始擔(dān)心頭部大模型創(chuàng)企估值過高。智譜AI、月之暗面和百川智能等幾家公司的估值已經(jīng)快速上升至約200億元人民幣的門檻。

陳琳的感知與知名投資人朱嘯虎一致。6月,朱嘯虎表示,“去年大模型非?;穑衲隀C(jī)構(gòu)都不敢投大模型。”

大洋彼岸,同此涼熱。

“我們感覺到,華爾街對AI越來越持懷疑態(tài)度?!卑涂巳R銀行在9月的一份研報(bào)中表達(dá)了自己的擔(dān)憂。該行測算,2026年大型科技公司在開發(fā)模型上的花費(fèi)約為600億美元,但從AI中獲得的收入僅約為200億美元。這400億美元的差額,幾乎是特斯拉去年凈利潤的2.7倍。

技術(shù)和產(chǎn)品體驗(yàn)的進(jìn)步也在放緩。

11月,有外媒報(bào)道稱,OpenAI的下一代旗艦?zāi)P停y試代號為Orion)雖然在性能上已經(jīng)超越了現(xiàn)有模型,但可能不會像前面幾代產(chǎn)品那樣帶來巨大飛躍。

消息一出,著名的AI悲觀主義者、紐約大學(xué)名譽(yù)教授Gary Marcus在社交媒體上“慶?!逼鹆俗约旱膭倮骸盎镉?jì)們,游戲結(jié)束,我贏了。GPT大模型正在進(jìn)入收益遞減期?!?/p>

二、暗淡的白月光

2023年2月,美團(tuán)聯(lián)合創(chuàng)始人王慧文與出門問問CEO李志飛、真格基金合伙人戴雨森和劉元在一家日式餐廳中,探討了中國大模型的未來。

此前4個(gè)月,OpenAI在沒有任何預(yù)熱,也未舉辦發(fā)布會的情況下,上線了基于大語言模型研發(fā)的AI應(yīng)用程序ChatGPT-3.5,兩個(gè)月便吸引來一億月活用戶。與之對比,蘋果iTunes達(dá)到一億用戶用了六年半,微信用了一年零兩個(gè)月。

飯局結(jié)束后不久,王慧文發(fā)布了自己的人工智能宣言:“5000萬美元,帶資入組,不在意崗位、薪資和title,求組隊(duì)。”李開復(fù)、前京東高級副總裁周伯文、快手前MMU負(fù)責(zé)人李巖和李志飛等,均投身大模型創(chuàng)業(yè)。

大廠們也跑步入場。2023年3月,百度率先發(fā)布了文心一言大模型。此后,AI公司、互聯(lián)網(wǎng)公司和智能硬件公司們相繼跟進(jìn),騰訊、阿里、商湯、快手、美團(tuán)、京東、阿里、OPPO、理想汽車均發(fā)布了自己的大模型。

一時(shí)間,“做中國的OpenAI”成為行業(yè)熱詞,這點(diǎn)燃了一級市場久違的投資熱情。

據(jù)創(chuàng)業(yè)邦旗下科創(chuàng)數(shù)據(jù)平臺“睿獸”數(shù)據(jù),去年,機(jī)構(gòu)在大模型層的投資事件為66起,是上一年的投資事件數(shù)量的近2.3倍。大廠們自然沒有缺席這場資本盛宴。“六小龍”中,阿里與騰訊均投資了5家。

“當(dāng)時(shí)在深圳的酒吧,人們要么在討論美股,要么在討論大模型?!毙ち栈貞浫ツ甑那榫?,她并非一個(gè)懷有AGI信仰的人,但身處此種環(huán)境,她甚至開始幻想自己會不會成為改變世界的一員。

2023年中旬,國內(nèi)大模型已成“百模大戰(zhàn)”之勢。可就在此時(shí),先行者的故事戛然而止。

投身大模型創(chuàng)業(yè)4個(gè)月之后,王慧文確診抑郁癥并入院治療,短期內(nèi)無法繼續(xù)領(lǐng)導(dǎo)團(tuán)隊(duì)。最終,美團(tuán)以約20.65億元的價(jià)格,完成了對光年之外的股權(quán)收購。

光年之外前員工賈晨(化名)還記得,王慧文在創(chuàng)業(yè)之初精神狀態(tài)良好,對公司也很上心,但“公司經(jīng)營的成本很大,而且技術(shù)難題很多”。

一個(gè)能拿出5000萬美元的人,因大模型創(chuàng)業(yè)得了抑郁癥,這讓賈晨萌生了“大模型究竟是不是一門好生意”的疑問。帶著這個(gè)疑問,他選擇更穩(wěn)妥的探索方式:去大廠。

王慧文病退后,行業(yè)中開始出現(xiàn)大模型是否終將淪為巨頭游戲的討論。不久后,機(jī)構(gòu)也發(fā)出了預(yù)警。

2023年10月,科技研究和咨詢公司CCS Insight在一份報(bào)告中表示,備受關(guān)注的生成式人工智能領(lǐng)域?qū)⒃?024年接受考驗(yàn),這些考驗(yàn)的具體表現(xiàn)為:技術(shù)炒作逐漸消退,運(yùn)行成本不斷上升,監(jiān)管呼聲越來越多,投資人不再像之前那樣興奮和樂觀。

機(jī)構(gòu)的預(yù)測,成了肖琳經(jīng)歷的現(xiàn)實(shí)。

2024年初,肖琳看到公司里來了幾位身穿白色長袍的外籍人士,她猜測這便是傳言中的“來自中東的投資人”。她希望這筆融資能順利到賬,這樣她的工作也會更加穩(wěn)定。但事與愿違,投資人試用大模型后,因功能不及預(yù)期而減少了投資金額。

察覺到投資人收緊錢包的不只一家公司。按朱嘯虎上述說法,“機(jī)構(gòu)都不敢投大模型。”

投資機(jī)構(gòu)分析師陳琳認(rèn)為,投資人們態(tài)度的變化,與大模型應(yīng)用難以落地不無關(guān)系。

出門問問CEO李志飛感嘆,在國內(nèi)大模型創(chuàng)業(yè)浪潮爆發(fā)之初,人們曾非常激進(jìn)?!暗墙裉煸倩剡^來看,可能有些事情是過于樂觀了?!?/p>

三、誰能活下來

李志飛認(rèn)為,自己“可能是中國最早一批關(guān)注到GPT-3的人”。他將其視為大模型發(fā)展的轉(zhuǎn)折點(diǎn),讓他看到實(shí)現(xiàn)通用人工智能的希望。

GPT-3是OpenAI在2020年發(fā)布的一款語言模型(Language Models),該模型的參數(shù)量達(dá)到1750億,是GPT-2的117倍,GPT-1的1496倍。

在李志飛看來,這是一次“暴力美學(xué)”的勝利。在此之前,他非常反感這個(gè)概念,因?yàn)椤皼]有什么深度,研究也沒有美感”。

“暴力美學(xué)”的概念并不難理解,它由先進(jìn)的算法、海量的訓(xùn)練數(shù)據(jù)和龐大的參數(shù)構(gòu)成。

而這一切,需要以資金為后盾。

國盛證券曾測算,GPT-3訓(xùn)練一次的成本約為140萬美元。兩年后上線的ChatGPT-3.5單次訓(xùn)練成本上升到了460萬美元,可以購買一輛博蘭基尼Veneno(全球僅有 14 輛)。

在金錢的助推下,2023年4月上線的GPT-4參數(shù)繼續(xù)增加至1.8萬億左右。馬斯克曾估算,參數(shù)量超百萬億的GPT-5僅芯片成本超過7億美元,高于小鵬汽車在AI領(lǐng)域全年的投入(35億元)。

李志飛認(rèn)為,國內(nèi)公司無法效仿OpenAI這種并不追求ROI的“暴力美學(xué)”。傅盛也認(rèn)同這個(gè)看法。他在接受采訪時(shí)舉了一個(gè)例子:“如果一個(gè)谷歌研究員跟老板說訓(xùn)練一次2000萬美元,老板問能不能做成,你說不知道,肯定就很難申請到資源?!?/p>

但生意還得繼續(xù)做。

目前,國內(nèi)大模型行業(yè)的共識是卷應(yīng)用,將大規(guī)模數(shù)據(jù)集訓(xùn)練出來的深度神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于實(shí)際問題中,通過大模型賺到錢。

在7月舉辦的2024年世界人工智能大會上,百度董事長兼CEO李彥宏稱,沒有應(yīng)用,光有一個(gè)基礎(chǔ)模型,不管是開源還是閉源,都一文不值。李開復(fù)在11月初的一次分享中表示,當(dāng)下國內(nèi)AI行業(yè)的發(fā)展,已經(jīng)進(jìn)入應(yīng)用“落地為王”的階段。

另一個(gè)共識是,目前大模型行業(yè)已進(jìn)入淘汰賽階段。

多位從業(yè)者告訴雪豹財(cái)經(jīng)社,他們認(rèn)為字節(jié)將成為贏家之一。創(chuàng)業(yè)公司方面,他們普遍認(rèn)為目前的“六小龍”將活下來一到兩家。

百川智能CEO王小川預(yù)測,未來國內(nèi)大模型市場第一梯隊(duì)或僅有五家,大廠占據(jù)主導(dǎo)地位,小型創(chuàng)業(yè)公司能存活的寥寥無幾。

朱嘯虎一度認(rèn)為,5年后將沒有獨(dú)立的大模型公司存在。2024年8月,他又在一次采訪中,將這一期限縮短至3年之內(nèi),稱大模型創(chuàng)企“最好的結(jié)果就是賣給大廠”。

李志飛早早嗅到了淘汰賽的氣息。2023年4月,他便預(yù)測大模型行業(yè)將“卷出天際”,投身其中的公司大概率與上一代AI公司一樣,商業(yè)化異常艱難。

“一切都是熟悉的配方和味道?!彼f。

作者丨王亞駿

本文由人人都是產(chǎn)品經(jīng)理作者【雪豹財(cái)經(jīng)社】,微信公眾號:【雪豹財(cái)經(jīng)社】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!