引言:2025年, 注定是中國(guó)改變世界的一年,起碼,改變了整個(gè)世界對(duì)中國(guó)的看法從deepseek火熱出圈,到哪吒2登頂世界動(dòng)漫電影票房冠軍,每件事都足以讓國(guó)人引以為傲但是,作為一個(gè)互聯(lián)網(wǎng)自媒體,我對(duì)deepseek更加感興趣,所以,這段時(shí)間花費(fèi)了非常多的時(shí)間,到處查找關(guān)于deepseek創(chuàng)始人梁文鋒相關(guān)的信息我想了解一下,到底是一個(gè)什么樣的人,才會(huì)做出這么厲害的產(chǎn)品,又是什么樣的契機(jī),讓他做出來(lái)的很遺憾,梁文鋒為人很低調(diào),網(wǎng)上就連百度百科的資料都寥寥數(shù)語(yǔ),能查到的公開(kāi)演講只有一次,2023年和2024年接受過(guò)36氪兩次采訪但是,這次查找,也找到了一些有用信息于是,花費(fèi)了1個(gè)星期,整理這篇文章
壹:求學(xué)
1984年秋天,好萊塢的銀幕上亮起一道紅光。導(dǎo)演詹姆斯·卡梅隆執(zhí)導(dǎo)的《終結(jié)者》上映,人工智能首次以“天網(wǎng)”形象引發(fā)全球恐慌
機(jī)器人“終結(jié)者”用機(jī)械腔調(diào)說(shuō)出那句經(jīng)典臺(tái)詞:“I’ll be back(我會(huì)回來(lái)的)”,全世界的觀眾倒吸一口冷氣——人類第一次在電影里被自己創(chuàng)造的AI追殺。
1985年,當(dāng)人們還沉浸在電影《終結(jié)者》帶來(lái)的震撼中,蝴蝶的翅膀開(kāi)始扇動(dòng),命運(yùn)的齒輪開(kāi)始轉(zhuǎn)動(dòng)。
中國(guó)南部廣東湛江的小漁村,一個(gè)普通教師家庭出生了一個(gè)男嬰,父親為其取名梁文鋒
沒(méi)人能想到,當(dāng)卡梅隆用電影預(yù)言AI毀滅人類時(shí),這個(gè)喝著咸腥海風(fēng)長(zhǎng)大的男孩,會(huì)在40年后用中文大模型重新定義人與機(jī)器的關(guān)系。
梁文鋒的父母的都是當(dāng)?shù)氐慕處?,從小?duì)孩子的教育就很上心,可能也基于這樣的家庭,從小便展現(xiàn)出了過(guò)人的學(xué)習(xí)能力
梁文鋒的小學(xué)時(shí)光是在父親執(zhí)教的梅菉小學(xué)度過(guò)的,
梁文鋒在小學(xué)三、四年級(jí)的時(shí)候就愛(ài)好集郵,他集郵有一個(gè)特點(diǎn)是“以郵養(yǎng)郵”,就是收到郵票后拿去賣,賣后又集回,基本不用花父親的錢。可以說(shuō),從小就有掙錢的心得
六年級(jí)的時(shí)候,在梅菉小學(xué)六(3)班擔(dān)任學(xué)習(xí)委員,成績(jī)?cè)诎嗌厦星懊?span lang="EN-US">1996年,梁文鋒以優(yōu)異的成績(jī)從梅菉小學(xué)直升至吳川一中,成為當(dāng)時(shí)整個(gè)梅菉小學(xué)僅有的4名直升生之一。
梁文鋒初中和高中階段均就讀于吳川一中,一直是學(xué)校里的“尖子生”,并在數(shù)學(xué)學(xué)科表現(xiàn)出極大天賦,初中時(shí)期就學(xué)完了高中數(shù)學(xué),甚至開(kāi)始學(xué)大學(xué)的數(shù)學(xué),數(shù)學(xué)思維能力很強(qiáng)。
初中時(shí)期的梁文鋒性格很文靜,但不是書呆子,他在學(xué)習(xí)上很有自己的“一套方法”,一般愛(ài)玩,但學(xué)習(xí)成績(jī)從沒(méi)落下,每一科成績(jī)都很好。
2002年,17歲的梁文鋒參加全國(guó)普通高考,以理科816分、吳川市第一中學(xué)“高考狀元”的成績(jī)考上浙江大學(xué)本科電子信息工程專業(yè)
當(dāng)時(shí)他的班主任想讓他報(bào)清華,梁文鋒說(shuō):“要是去清華,不能選擇自己心儀的專業(yè)。”所以轉(zhuǎn)身選了浙江大學(xué)。
2002年9月至2006年6月,梁文鋒來(lái)到浙江杭州,在浙江大學(xué)電子信息工程專業(yè)讀本科。改變命運(yùn)的起點(diǎn)便是浙江大學(xué),因?yàn)檫@里有人在等著他
2005年,浙江大學(xué)竺可楨學(xué)院混合班讀本科的高材生徐進(jìn),和學(xué)長(zhǎng)方毅一起創(chuàng)業(yè),注冊(cè)了一個(gè)叫做每日科技的公司。
插播一句,浙江大學(xué)竺可楨學(xué)院介紹:
竺可楨學(xué)院是以竺可楨老校長(zhǎng)之名命名的榮譽(yù)學(xué)院,前身為1984年創(chuàng)辦的原浙江大學(xué)(工科)混合班。學(xué)院是浙江大學(xué)對(duì)優(yōu)秀本科生實(shí)施“特別培養(yǎng)”和“精英培養(yǎng)”的重要基地。如果說(shuō)考上浙江大學(xué)是人才,那么再進(jìn)入竺可楨學(xué)院的就是人才中的人才。
進(jìn)入竺可楨學(xué)院后,不分專業(yè),先在文、理、工三大類平臺(tái)上進(jìn)行通識(shí)課程和基礎(chǔ)課程的前期培養(yǎng)。在第二學(xué)年,根據(jù)自己的興趣、特長(zhǎng)確認(rèn)主修專業(yè),并進(jìn)入后期培養(yǎng)階段,同時(shí)實(shí)行本科生專業(yè)導(dǎo)師制。學(xué)生既可以按各專業(yè)普通通道進(jìn)行后期培養(yǎng),亦可以按照長(zhǎng)學(xué)制及雙專業(yè)、雙學(xué)位等多通道多規(guī)格發(fā)展途徑進(jìn)行后期培養(yǎng)
2007年,22歲的梁文鋒又考上浙江大學(xué)信息與通信工程專業(yè)研究生。導(dǎo)師是大名鼎鼎的項(xiàng)志宇教授,主要做機(jī)器視覺(jué)研究。
到這里一切都很平常且平淡,梁文鋒這期間不是在學(xué)習(xí),就是研究代碼,要么就是待在圖書館。
而真正的轉(zhuǎn)折才剛開(kāi)始
貳:轉(zhuǎn)折
2008年,在浙大讀書期間,23歲的梁文鋒和正在讀博士的學(xué)長(zhǎng)徐進(jìn),連同其他幾個(gè)同學(xué)一起研究,開(kāi)始使用機(jī)器學(xué)習(xí)等技術(shù)探索全自動(dòng)量化交易,
這在所有人看來(lái),都是極其瘋狂。因?yàn)樵S多人對(duì)量化投資能否盈利持懷疑態(tài)度,認(rèn)為這種依靠計(jì)算機(jī)算法和數(shù)據(jù)模型的投資方式過(guò)于抽象和不可靠。
正是這次的嘗試,讓他賺得了人生的第一桶金,同時(shí),開(kāi)始累積了市場(chǎng)行情數(shù)據(jù)、金融市場(chǎng)其他相關(guān)數(shù)據(jù)以及宏觀經(jīng)濟(jì)等數(shù)據(jù)。
注意這個(gè)時(shí)間段,2008年,正值全球金融危機(jī)。
2010年6月,25歲的梁文鋒從浙江大學(xué)信息與通信工程專業(yè)碩士畢業(yè),他的碩士畢業(yè)論文題目是《基于低成本PTZ攝像機(jī)的目標(biāo)跟蹤算法研究》。
同一年,徐進(jìn)也浙江大學(xué)博士畢業(yè)了
畢業(yè)以后,很多同學(xué)都拿到了大廠offer,梁文鋒卻選擇了去成都,在出租屋里繼續(xù)研究用計(jì)算機(jī)做量化交易
也是在這期間,有個(gè)同樣瘋癲的、在深圳城中村做著“不靠譜”飛行器的朋友拉他入伙。因?yàn)榱何匿h心中一直埋藏著一個(gè)更大的夢(mèng),而今他似乎已經(jīng)摸到了門檻,他得去實(shí)現(xiàn)它,所以婉拒了朋友的要求。
2010年梁文鋒就一直全身心投入到全自動(dòng)量化交易和AI算法研究中。這一年滬深300股指期貨正式推出,這一里程碑事件為量化投資帶來(lái)了前所未有的發(fā)展機(jī)遇,憑借著扎實(shí)的技術(shù)功底和敏銳的市場(chǎng)洞察力,梁文鋒帶領(lǐng)他的團(tuán)隊(duì)迅速抓住這一機(jī)遇,在市場(chǎng)中大展身手。
他們所采用的量化投資策略取得了巨大的成功,自營(yíng)資金從6萬(wàn)元如滾雪球般迅速增長(zhǎng),超過(guò)了5億元。
在梁文鋒還小的時(shí)候,很多家長(zhǎng)找到他父親說(shuō)讀書沒(méi)有用,想要讓孩子不上學(xué)出去干活。但梁文鋒的父親堅(jiān)信,改變命運(yùn)的一定的知識(shí)
這次嘗試做量化交易,讓梁文鋒和團(tuán)隊(duì)掙到了錢, 掙到了很多人一輩子都掙不到的錢。而此時(shí)的梁文鋒,似乎正在用自己的改變來(lái)詮釋當(dāng)初父親堅(jiān)持的想法
2012 年,深度學(xué)習(xí)算法 AlexNet 在圖像識(shí)別領(lǐng)域取得重大突破,在人工智能界掀起千層巨浪。這在當(dāng)時(shí),給作為業(yè)內(nèi)人士的梁文鋒來(lái)了非常大的沖擊.
梁文鋒在后來(lái)的采訪中說(shuō)“AlexNet帶來(lái)的沖擊已經(jīng)引領(lǐng)一個(gè)新的時(shí)代,因?yàn)?span lang="EN-US">AlexNet的錯(cuò)誤率遠(yuǎn)低于當(dāng)時(shí)其他模型,復(fù)蘇了沉睡幾十年的神經(jīng)網(wǎng)絡(luò)研究。”
梁文鋒無(wú)比篤信“人工智能一定會(huì)改變世界”
同時(shí)他意識(shí)到 AI 的潛力遠(yuǎn)不止于此,AI一定還能有更大的作為,此刻AI變革的種子已經(jīng)在他心里深深種下,眼下,必須得把之前累積出來(lái)做量化的數(shù)據(jù)排上用場(chǎng)
而彼時(shí)的徐進(jìn),繼每日互動(dòng)科技公司以后去了華為工作,后來(lái)又去了杭州捷尚智能電網(wǎng)科技公司。梁文鋒再次找到徐進(jìn),決定用AI來(lái)做專業(yè)量化交易公司
2013年,回到杭州的梁文鋒和徐進(jìn),創(chuàng)立杭州雅克比投資管理有限公司,決定用AI進(jìn)行量化投資交易,這算是在AI在實(shí)際應(yīng)用的一次嘗試
量化交易,簡(jiǎn)單理解就是:用設(shè)定的數(shù)學(xué)模型和AI進(jìn)行自動(dòng)投資,由機(jī)器和AI做決策,而這些數(shù)學(xué)模型的數(shù)據(jù)來(lái)源,就是他在早年的探索中累計(jì)的
2015年4月16日,上證50、中證500股指期貨交易正式在中國(guó)金融期貨交易所掛牌交易,這為量化基金創(chuàng)造了更大的操作空間。
2個(gè)月后,看到機(jī)會(huì)的梁文鋒和徐進(jìn),創(chuàng)辦杭州幻方科技有限公司,立志成為世界頂級(jí)的量化對(duì)沖基金。后更名為浙江九章資產(chǎn)管理有限公司。
幻方量化是最早探索用機(jī)器學(xué)習(xí)替代傳統(tǒng)量化策略的量化機(jī)構(gòu)之一。
梁文鋒帶著團(tuán)隊(duì)利用僅有的10張GPU顯卡,采用高頻量化投資策略,在國(guó)內(nèi)發(fā)生股災(zāi)期間,取得了不錯(cuò)的成績(jī),從此幻方量化逐漸走入大眾視野,被人們熟知。
梁文鋒說(shuō):對(duì)研究員來(lái)說(shuō),對(duì)算力的渴求是永無(wú)止境的。做了小規(guī)模實(shí)驗(yàn)后,總想做更大規(guī)模的實(shí)驗(yàn)。那之后,我們也會(huì)有意識(shí)地去部署盡可能多的算力
GPU提供的算力決定了他們能做多大的規(guī)模,他一直好奇,我要是有足夠足夠大的算力支持的時(shí)候,會(huì)是什么樣子呢,而他心里,還有更加深層次的考慮
而這份好奇心,正是驅(qū)動(dòng)著梁文鋒在不斷探索更高算力的邊緣試探。他的腦海里,不止一次浮現(xiàn)過(guò),當(dāng)擁有1000張顯卡,1萬(wàn)張顯卡的時(shí)候,能調(diào)用的算力有多龐大
10月,幻方量化在一天內(nèi)創(chuàng)立10支產(chǎn)品,兩個(gè)月后,又成立另外的10支產(chǎn)品,快速積累提升自身的募資能力。
2016 年10月21日,幻方第一個(gè)由深度學(xué)習(xí)算法模型生成的股票倉(cāng)位上線實(shí)盤交易,使用GPU進(jìn)行計(jì)算。
這一年,幻方量化管理的資金規(guī)模大約10億元。在此之前,算法主要依靠線性模型和傳統(tǒng)機(jī)器學(xué)習(xí)算法,模型計(jì)算主要依賴于CPU。
幻方量化在這一年加入了中基協(xié)(中國(guó)證券投資基金業(yè)協(xié)會(huì)),意味著他們?cè)谛袠I(yè)內(nèi)的專業(yè)性和規(guī)范性得到了官方認(rèn)可。
叁:功成
2017 年,Transformer架構(gòu)問(wèn)世,奠定自然語(yǔ)言處理(NLP)新范式。為研究人員提供了新的研究方向和機(jī)會(huì)。
這一年幻方量化實(shí)現(xiàn)投資策略全面 AI 化。但是很多客戶和同行都不理解,覺(jué)得他們就是打著用AI做量化交易噱頭,不過(guò)是為了募集更多資金罷了。
正如梁文鋒在詹姆斯.西蒙斯唯一傳記《征服市場(chǎng)的人》(中文版)寫推薦序時(shí)的一句話:
“和很多新技術(shù)一樣,量化投資剛出現(xiàn)的時(shí)候也是被嘲笑的對(duì)象,沒(méi)有人相信計(jì)算機(jī)可以像人類一樣進(jìn)行投資。但西蒙斯卻敏銳地預(yù)見(jiàn)到,隨著計(jì)算機(jī)技術(shù)的發(fā)展,終有一天‘不可能’將會(huì)變成現(xiàn)實(shí)。”
詹姆斯.西蒙斯有“量化投資之父”之稱,其創(chuàng)辦的文藝復(fù)興科技公司于1988年3月設(shè)立了第一支基金產(chǎn)品——大獎(jiǎng)?wù)禄穑?span lang="EN-US">Medallion Fund)。
有數(shù)據(jù)顯示,在1988—2018年這30年間,扣除5%的管理費(fèi)和44%的業(yè)績(jī)提成后,該基金獲得了39.1%的年化復(fù)合收益率,為公司賺取的利潤(rùn)超過(guò)1000億美元。
詹姆斯.西蒙斯算是梁文鋒進(jìn)入量化投資這一領(lǐng)域的領(lǐng)路人。
梁文鋒說(shuō),“每當(dāng)在工作中遇到困難的時(shí)候,我會(huì)想起西蒙斯的話:“一定有辦法對(duì)價(jià)格建模。”
西蒙斯在去年一次接受訪談時(shí)說(shuō),文藝復(fù)興科技只雇傭沒(méi)有金融背景、與華爾街沒(méi)有關(guān)系的數(shù)學(xué)家、物理學(xué)家和計(jì)算機(jī)科學(xué)家。
而這一觀點(diǎn)也對(duì)梁文鋒在后續(xù)的公司人員招募中起到很大的影響,梁文鋒說(shuō):
不一定是做過(guò)這件事的人才能做這件事?;梅秸腥擞袟l原則是,看能力,而不是看經(jīng)驗(yàn)。我們的核心技術(shù)崗位,基本以應(yīng)屆和畢業(yè)一兩年的人為主。
做一件事,有經(jīng)驗(yàn)的人會(huì)不假思索告訴你,應(yīng)該這樣做,但沒(méi)有經(jīng)驗(yàn)的人,會(huì)反復(fù)摸索、很認(rèn)真去想應(yīng)該怎么做,然后找到一個(gè)符合當(dāng)前實(shí)際情況的解決辦法。
我們的核心團(tuán)隊(duì),連我自己,一開(kāi)始都沒(méi)有量化經(jīng)驗(yàn),這一點(diǎn)很特殊。不能說(shuō)是成功的秘密,但這是幻方的文化之一。我們不會(huì)故意回避有經(jīng)驗(yàn)的人,但更多是看能力。
拿銷售這個(gè)崗位舉個(gè)例子。我們的兩個(gè)主力銷售,都是這個(gè)行業(yè)的素人。一個(gè)原來(lái)做德國(guó)機(jī)械品類外貿(mào)的,一個(gè)是原來(lái)在券商做后臺(tái)寫代碼。他們進(jìn)入這個(gè)行業(yè)時(shí),沒(méi)有經(jīng)驗(yàn),沒(méi)有資源,沒(méi)有積累。
而現(xiàn)在我們可能是唯一一家能以直銷為主的大私募。做直銷意味著不用給中間商分費(fèi)用,同樣規(guī)模和業(yè)績(jī)下,利潤(rùn)率更高,很多家會(huì)試圖模仿我們,但并沒(méi)有成功。
截至2017 年底,幻方幾乎所有的量化策略都已經(jīng)采用AI模型計(jì)算。自 2008 年起就開(kāi)始積累市場(chǎng)行情數(shù)據(jù)、金融市場(chǎng)其他相關(guān)數(shù)據(jù)、宏觀經(jīng)濟(jì)等數(shù)據(jù),累積數(shù)據(jù)量超過(guò) 10PB。
2018年,梁文鋒確立幻方量化以AI為主要發(fā)展方向,這一年公司首次獲得私募金牛獎(jiǎng)。
而這一年,Open AI推出了基于Transformer架構(gòu)的生成式預(yù)訓(xùn)練模型GPT-1
梁文鋒知道,這一次,在AI科技革命上,美國(guó)又一次領(lǐng)先我們走在前沿了,但他堅(jiān)信,我們一定不只是跟隨,終有一天會(huì)反超成為領(lǐng)路者。
他一直在等待,等待時(shí)機(jī)成熟,同時(shí)也一直在布局他腦海里的超級(jí)算力中心。
2019年8月,幻方量化管理規(guī)模超過(guò)百億,于是暫停旗下所有產(chǎn)品的申購(gòu)和追加以控制規(guī)模。同年,OpenAI推出了GPT-2模型,該模型擁有15億參數(shù),能夠生成更加自然、流暢的語(yǔ)言文本,并引起了業(yè)界的廣泛關(guān)注。
這一年成立幻方AI Lab,要發(fā)展幻方AI Lab,算力是基礎(chǔ)。
為滿足日益增加的算力需求,梁文鋒開(kāi)始尋求大規(guī)模算力解決方案。因?yàn)殡S著交易規(guī)模的不斷擴(kuò)大,對(duì)于算力的需求也越來(lái)越大,最初他們托管在IDC,后來(lái)規(guī)模不斷變大以后,托管無(wú)法滿足算力需求了,就開(kāi)始自建機(jī)房
梁文鋒這幾年一直不斷地購(gòu)買更多的GPU,這時(shí)候他手里已經(jīng)有了超過(guò)1000張GPU顯卡,正在醞釀著他那個(gè)龐大的超級(jí)算力中心。
2020年:OpenAI發(fā)布GPT-3,1750億參數(shù)模型實(shí)現(xiàn)高質(zhì)量文本生成,推動(dòng)AI平民化
5月,幻方量化投資2億元的深度學(xué)習(xí)訓(xùn)練平臺(tái)“螢火一號(hào)”啟用,計(jì)算集群搭載1100張高端顯卡,每秒可以進(jìn)行1.84億億次浮點(diǎn)運(yùn)算(18.4PFLOPS, 32位精度),相當(dāng)于4萬(wàn)臺(tái)個(gè)人電腦算力,平均使用率超過(guò) 90%。
2021年1月,幻方AI Lab投入10億建造的第二代超算“螢火二號(hào)”正式交付使用,搭載了1萬(wàn)張高端顯卡,已交付的AI算力為325PFLOPS(TF32),是“螢火一號(hào)”的18倍。
就在不少AI研究人員還未意識(shí)到“萬(wàn)卡”已經(jīng)成為通用人工智能不可逾越的軟硬件壁壘時(shí),幻方量化已經(jīng)對(duì)員工調(diào)用算力不設(shè)限制。
也是在這一年的年中,幻方量化管理的私募資金突破千億元大關(guān),并被稱為“量化四大天王”之一,私募行業(yè)甚至還有“北九坤,南幻方”之稱。
幻方量化用4年時(shí)間成為了百億量化私募,然后又僅用2年時(shí)間成為千億級(jí)別量化私募,速度之快無(wú)人能及。
不過(guò),也是在這一年,幻方量化業(yè)績(jī)出現(xiàn)波動(dòng),低風(fēng)險(xiǎn)對(duì)沖產(chǎn)品出現(xiàn)虧損,其中有些年內(nèi)跌幅超 8%。
2021年也是幻方量化從急速擴(kuò)容規(guī)模轉(zhuǎn)至平穩(wěn)發(fā)展的分界線。從此幻方量化開(kāi)始逐年減少持有資金規(guī)模。
12 月 28 日,幻方量化在官微發(fā)布說(shuō)明,向投資者致歉,解釋稱“長(zhǎng)周期持股波動(dòng)和量化策略同質(zhì)化嚴(yán)重,是其近期表現(xiàn)不佳的主要原因,公司正在調(diào)整策略以適應(yīng)市場(chǎng)環(huán)境變化。”
2022 年 ,幻 方 量 化 整 體 收 益 率 僅0.38%。3月初,幻方量化已主動(dòng)縮減規(guī)模至500億元左右。即使遭遇了波折,幻方在合格投資者中的熱度依然不減,2022年寧波幻方量化排名熱搜榜第三位,僅次于林園投資和正圓投資。
不得不說(shuō),做量化交易確實(shí)很掙錢,幾年時(shí)間,3萬(wàn)美元一張的英偉達(dá)A100顯卡,梁文鋒的幻方量化公司有超1萬(wàn)張。
他本人也理所應(yīng)當(dāng)實(shí)現(xiàn)了真正的財(cái)富自由,他匿名給自己的母校浙江大學(xué)捐款2.5億。幻方量化公司每年也會(huì)有2-3億的公益捐款
2022年度,幻方量化共計(jì)向慈善機(jī)構(gòu)捐贈(zèng)2.2138億元。除此以外,公司員工“一只平凡的小豬”個(gè)人向慈善機(jī)構(gòu)捐贈(zèng)1.3800億元。以上合計(jì)3.5938億元均已完成打款,將支持15家慈善的23個(gè)公益項(xiàng)目。
而有報(bào)道稱“一只平凡的小豬”就是梁文鋒本人
到這里,梁文鋒的人生對(duì)于大部分人來(lái)說(shuō),已經(jīng)是人生贏家了,但,這才是他的“剛剛開(kāi)始”
肆:再出發(fā)
2022年ChatGPT-3.5發(fā)布,展現(xiàn)了前所未有的交互能力。震動(dòng)全世界, 僅兩個(gè)月,用戶數(shù)突破1億,成為史上增長(zhǎng)最快的應(yīng)用。
一時(shí)間,所有國(guó)內(nèi)的公司,只要跟AI沾邊的股票都在蹭蹭漲,甚至很多公司連夜就做出來(lái)AI相關(guān)的應(yīng)用
而梁文鋒看到的,是中國(guó) AI 不可能永遠(yuǎn)處在跟隨的位置。我們經(jīng)常說(shuō)中國(guó) AI 和美國(guó)有一兩年差距,但真實(shí)的差距是原創(chuàng)和模仿之差。如果這個(gè)不改變,中國(guó)永遠(yuǎn)只能 是 追 隨 者 ,所 以 有 些 探 索 也 是 逃 不 掉的。
2023年3月,OpenAI發(fā)布了GPT-4模型,該模型在多模態(tài)處理能力上有了重大突破,整合了文本、圖像和音頻處理能力。人工智能未來(lái)以來(lái)。而梁文鋒已經(jīng)下定決心再次出發(fā)
2023年4月14日,幻方量化在官方公眾號(hào)宣布公司要成立新的研究組織,開(kāi)啟探索AGI本質(zhì)的新征程。
為招募所需的人才,公司海報(bào)還用了法國(guó)導(dǎo)演、編劇特呂弗寫給年輕導(dǎo)演的忠告:
“務(wù)必要瘋狂地?fù)肀坌?,同時(shí)瘋狂地真誠(chéng)。”
梁文鋒說(shuō)。“我們要做的是通用人工智能,也就是AGI。語(yǔ)言大模型可能是通往AGI的必經(jīng)之路,并且初步具備了AGI的特征,所以我們會(huì)從這里開(kāi)始,后面也會(huì)有視覺(jué)等。”
5月,38歲的梁文鋒宣布要做通用人工智能(AGI)。7月,梁文鋒創(chuàng)辦了杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,就是DeepSeek的公司。
梁文鋒被認(rèn)為是量化投資者投身AI創(chuàng)業(yè)的“第一人”,實(shí)際上在幻方創(chuàng)業(yè)時(shí),梁文鋒的公司也早就用上了AI技術(shù)。
決定做大模型,收到的不是祝賀,更多的是質(zhì)疑:好好的量化不做,這么掙錢,為什么要去做大模型呢?
梁文鋒說(shuō):
我們做大模型,其實(shí)跟量化和金融都沒(méi)有直接關(guān)系。我們獨(dú)建了一個(gè)名為深度求索的新公司來(lái)做這件事。
幻方的主要班底里,很多人是做人工智能的。當(dāng)時(shí)我們嘗試了很多場(chǎng)景,最終切入了足夠復(fù)雜的金融,而通用人工智能可能是下一個(gè)最難的事之一,所以對(duì)我們來(lái)說(shuō),這是一個(gè)怎么做的問(wèn)題,而不是為什么做的問(wèn)題。
是啊,是怎么做而不是為什么而做?
天時(shí):AI的時(shí)機(jī)才成熟
地利:國(guó)內(nèi)擁有超過(guò)1萬(wàn)枚GPU的企業(yè)不超過(guò)5家,幻方是其中之一,其他全部是大廠
人和:幻方的主要班底里,很多人是做人工智能的,正好擁有大量的技術(shù)人才
正是在這樣的一種環(huán)境下,我們現(xiàn)在比較確定的是,既然我們想做這個(gè)事,又有這個(gè)能力,這個(gè)時(shí)間點(diǎn)上,我們就是最合適人選之一。
是一種舍我其誰(shuí)的的態(tài)度去做大模型,天時(shí)地利人和,時(shí)機(jī)已然成熟。
梁文鋒說(shuō):
過(guò)去很多年,中國(guó)公司習(xí)慣了別人做技術(shù)創(chuàng)新,我們拿過(guò)來(lái)做應(yīng)用變現(xiàn),但這并非是一種理所當(dāng)然。這一波浪潮里,我們的出發(fā)點(diǎn),就不是趁機(jī)賺一筆,而是走到技術(shù)的前沿,去推動(dòng)整個(gè)生態(tài)發(fā)展。
我們認(rèn)為隨著經(jīng)濟(jì)發(fā)展,中國(guó)也要逐步成為貢獻(xiàn)者,而不是一直搭便車。過(guò)去三十多年IT浪潮里,我們基本沒(méi)有參與到真正的技術(shù)創(chuàng)新里。我們已經(jīng)習(xí)慣摩爾定律從天而降,躺在家里18個(gè)月就會(huì)出來(lái)更好的硬件和軟件。Scaling Law也在被如此對(duì)待。
但其實(shí),這是西方主導(dǎo)的技術(shù)社區(qū)一代代孜孜不倦創(chuàng)造出來(lái)的,只因?yàn)橹拔覀儧](méi)有參與這個(gè)過(guò)程,以至于忽視了它的存在。
真正的差距不是一年或兩年,而是原創(chuàng)和模仿之差
他覺(jué)得,不應(yīng)該坐享其成,也應(yīng)該瘋狂投入到做技術(shù)創(chuàng)新和研發(fā)中,成為貢獻(xiàn)者。
2024年5月,39歲的梁文鋒帶領(lǐng)深度求索(DeepSeek)發(fā)布了混合專家語(yǔ)言模型DeepSeek-V2。
DeepSeek-V2的API定價(jià)為每百萬(wàn)tokens輸入1元、輸出2元,價(jià)格僅為GPT-4 Turbo的百分之一。模型發(fā)布后,字節(jié)跳動(dòng)、阿里巴巴、百度、騰訊等大廠紛紛宣布大模型產(chǎn)品降價(jià)。
梁文鋒認(rèn)為,無(wú)論是API還是AI,都應(yīng)該是普惠的,人人可以用得起的。他強(qiáng)調(diào)技術(shù)應(yīng)該服務(wù)于大眾,而不是僅僅為了商業(yè)利益。這種理念體現(xiàn)在DeepSeek的定價(jià)策略上,他們通過(guò)降低大模型的API價(jià)格,推動(dòng)了整個(gè)行業(yè)的價(jià)格戰(zhàn),使得更多人能夠負(fù)擔(dān)得起AI技術(shù)。
因此,深度求索(DeepSeek)公司也被稱為AI界的拼多多。
2024年12月26日,梁文鋒又帶領(lǐng)深度求索(DeepSeek)公司發(fā)布了DeepSeek-V3,并且還公開(kāi)了由梁文鋒、羅福莉等人撰寫的53頁(yè)論文《DeepSeek-V3 Technical Report》。
deepseek如何才能變現(xiàn)呢?
梁文鋒沒(méi)想好,他說(shuō):
過(guò)去三十年,我們都只強(qiáng)調(diào)賺錢,對(duì)創(chuàng)新是忽視的。創(chuàng)新不完全是商業(yè)驅(qū)動(dòng)的,還需要好奇心和創(chuàng)造欲。我們只是被過(guò)去那種慣性束縛了,但它也是階段性的。
我們現(xiàn)在想的是,后邊可以把我們的訓(xùn)練結(jié)果大部分公開(kāi)共享,這樣可以跟商業(yè)化有所結(jié)合。我們希望更多人,哪怕一個(gè)小 app都可以低成本去用上大模型,而不是技術(shù)只掌握在一部分人和公司手中,形成壟斷
所以,這一次,一種好奇心驅(qū)動(dòng)。從遠(yuǎn)處說(shuō),去驗(yàn)證一些猜想。比如理解人類智能本質(zhì)可能就是語(yǔ)言,人的思維可能就是一個(gè)語(yǔ)言的過(guò)程。你以為你在思考,其實(shí)可能是你在腦子里編織語(yǔ)言。這意味著,在語(yǔ)言大模型上可能誕生出類人的人工智能(AGI)。
1月27日的新模型DeepSeek-R1再度讓DeepSeek登頂了蘋果中國(guó)及美國(guó)地區(qū)應(yīng)用商店的免費(fèi)應(yīng)用榜,其在美區(qū)下載榜上超越了ChatGPT,成為廣大用戶關(guān)注的焦點(diǎn)。被硅谷稱為“來(lái)自東方的神秘力量”。
在美國(guó)每天發(fā)生的大量創(chuàng)新里,這是非常普通的一個(gè)。他們之所以驚訝,是因?yàn)檫@是一個(gè)中國(guó)公司,在以創(chuàng)新貢獻(xiàn)者的身份,加入到他們游戲里去。畢竟大部分中國(guó)公司習(xí)慣follow,而不是創(chuàng)新。
當(dāng)別人都覺(jué)得創(chuàng)新燒錢,掙不到錢的時(shí)候,梁文鋒帶著團(tuán)隊(duì)堅(jiān)持去做研究和創(chuàng)新。
他認(rèn)為:創(chuàng)新的成本肯定不低,過(guò)去那種拿來(lái)主義的慣性也和過(guò)去的國(guó)情有關(guān)。但現(xiàn)在,你看無(wú)論中國(guó)的經(jīng)濟(jì)體量,還是字節(jié)、騰訊這些大廠的利潤(rùn),放在全球都不低。我們創(chuàng)新缺的肯定不是資本,而是缺乏信心以及不知道怎么組織高密度的人才實(shí)現(xiàn)有效的創(chuàng)新。
當(dāng)?shù)目萍脊菊衅缚唇?jīng)驗(yàn),梁文鋒深受西蒙斯的影響,招人只看能力和熱愛(ài),不看經(jīng)驗(yàn):
DeepSeek也全是自下而上。而且我們一般不前置分工,而是自然分工。每個(gè)人有自己獨(dú)特的成長(zhǎng)經(jīng)歷,都是自帶想法的,不需要push他。探索過(guò)程中,他遇到問(wèn)題,自己就會(huì)拉人討論。不過(guò)當(dāng)一個(gè)idea顯示出潛力,我們也會(huì)自上而下地去調(diào)配資源。
我們每個(gè)人對(duì)于卡和人的調(diào)動(dòng)是不設(shè)上限的。如果有想法,每個(gè)人隨時(shí)可以調(diào)用訓(xùn)練集群的卡無(wú)需審批。同時(shí)因?yàn)椴淮嬖趯蛹?jí)和跨部門,也可以靈活調(diào)用所有人,只要對(duì)方也有興趣。
華爾街大佬都在猜測(cè),梁文鋒團(tuán)隊(duì)一定挖掘了什么深不可測(cè)的人才的時(shí)候,梁文鋒說(shuō):
并沒(méi)有什么高深莫測(cè)的奇才,都是一些Top高校的應(yīng)屆畢業(yè)生、沒(méi)畢業(yè)的博四、博五實(shí)習(xí)生,還有一些畢業(yè)才幾年的年輕人。
做出來(lái)deepseek-V2大模型的團(tuán)隊(duì),甚至沒(méi)有海外回來(lái)的人,都是本土的。前50名頂尖人才可能不在中國(guó),但也許我們能自己打造這樣的人。
伍:結(jié)尾
創(chuàng)新首先是一個(gè)信念問(wèn)題。
梁文鋒說(shuō):為什么硅谷那么有創(chuàng)新精神?首先是敢。
Chatgpt出來(lái)時(shí),整個(gè)國(guó)內(nèi)對(duì)做前沿創(chuàng)新都缺乏信心,從投資人到大廠,都覺(jué)得差距太大了,還是做應(yīng)用吧。但創(chuàng)新首先需要自信。這種信心通常在年輕人身上更明顯。
而現(xiàn)在的他們?cè)谧鲎铍y的事。對(duì)頂級(jí)人才吸引最大的,肯定是去解決世界上最難的問(wèn)題。
其實(shí),頂尖人才在中國(guó)是被低估的。因?yàn)檎麄€(gè)社會(huì)層面的硬核創(chuàng)新太少了,使得他們沒(méi)有機(jī)會(huì)被識(shí)別出來(lái)。梁文鋒在做最難的事,對(duì)他們就是有吸引力的。
以后硬核創(chuàng)新會(huì)越來(lái)越多。
現(xiàn)在可能還不容易被理解,是因?yàn)檎麄€(gè)社會(huì)群體需要被事實(shí)教育。
當(dāng)這個(gè)社會(huì)讓硬核創(chuàng)新的人功成名就,群體性想法就會(huì)改變。我們只是還需要一堆事實(shí)和一個(gè)過(guò)程。
OpenAI也不是神,不可能一直沖在前面。
當(dāng)很多人發(fā)現(xiàn)過(guò)去賺快錢很可能來(lái)自時(shí)代運(yùn)氣,就會(huì)更愿意俯身去做真正的創(chuàng)新。
來(lái)源:任品微信號(hào)
1、本文只代表作者個(gè)人觀點(diǎn),不代表本站觀點(diǎn),僅供大家學(xué)習(xí)參考;
2、本站屬于非營(yíng)利性網(wǎng)站,如涉及版權(quán)和名譽(yù)問(wèn)題,請(qǐng)及時(shí)與本站聯(lián)系,我們將及時(shí)做相應(yīng)處理;
3、歡迎各位網(wǎng)友光臨閱覽,文明上網(wǎng),依法守規(guī),IP可查。
作者 相關(guān)信息
內(nèi)容 相關(guān)信息
? 昆侖專題 ?
? 高端精神 ?
? 新征程 新任務(wù) 新前景 ?
? 國(guó)策建言 ?
? 國(guó)資國(guó)企改革 ?
? 雄安新區(qū)建設(shè) ?
? 黨要管黨 從嚴(yán)治黨 ?
? 社會(huì)調(diào)查 ?