中國AI新創一夜震驚矽谷!DeepSeek 創辦人才40歲 超狂經歷曝光
[周刊王CTWANT] 大陸AI初創公司DeepSeek爆紅,力壓ChatGPT登上中美蘋果App Store免費下載榜榜首,市場憂慮將挑戰美國AI領導的地位,外界對這家公司的背後推手充滿好奇,隨著熱議,創辦人梁文鋒的背景也浮出水面。
梁文鋒現年40歲,1985年出生於廣東湛江,自小就展露數學天賦,國中就學完了高中數學,2002年以家鄉吳川市「高考狀元」的身分考進浙江大學電子資訊工程系。
之後,在攻讀資訊與通訊工程研究所期間,梁文鋒對金融市場產生興趣,並在2008年金融海嘯時,帶領團隊研究「機器學習在量化交易的應用」。2010年,滬深300股指期貨推出後,梁文鋒成功進軍量化投資,團隊資金最高達人民幣5億元(約新台幣23億元)。
2023年7月,梁文鋒創立DeepSeek,進軍通用人工智慧領域,至今從未對外融資。
僅僅不到1年的2024年5月,DeepSeek就發布了DeepSeekV2,因為創新的模型架構和史無前例的性價比爆紅。
對於為何能做到如此高的性價比,DeepSeek官方解釋稱,DeepSeek-V2採用了創新的架構,例如注意力機制方面的MLA(多頭潛在注意力)和前饋網路方面的DeepSeekMoE架構等,以實現具有更高經濟性的訓練效果和更高效的推理。
DeepSeek團隊規模不大,不到140人,但「人才密度」極高,成員多是來自中國的頂尖名校,包括清華、北大等的博士以及碩士生。陸媒報導稱,團隊沒有「海歸」,完全本土人才。
在團隊管理上,梁文鋒採用扁平化管理,淡化職級,鼓勵自由討論和創新,成員依興趣選擇研究方向並自由組隊。當一個有潛力的構想出現時,公司會自上而下調配資源。而且,成員對資源和人員的調動不設上限,不存在層級和跨部門的限制,只要有想法,隨時可以靈活調用。
此外,梁文鋒曾是量化對沖基金「幻方量化」(High-Flyer)的創辦人,利用自身資金與經驗,讓DeepSeek無需仰賴外部投資便能穩健運作。
延伸閱讀
- 記者:周刊王CTWANT
- 更多科技新聞 »