DeepSeek引發全球轟動 內媒起底創始人梁文鋒

DeepSeek引發全球轟動 內媒起底創始人梁文鋒

國產大模型公司杭州深度求索(DeepSeek)開發的AI應用程式引發全球轟動!昨日(1月27日),Deepseek應用登頂蘋果中國地區和美國地區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。Deepseek創始人梁文鋒(40歲)的背景也受到關注。
本月20日,國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會,聽取對《政府工作報告(徵求意見稿)》的意見建議,梁文鋒在會上發言。央視《新聞聯播》播出該畫面,讓許多人第一次看到了他的真實面孔。
據內媒報道,梁文鋒1985年出生於廣東省湛江市。2002年,以湛江的吳川市第一中學「高考狀元」的成績考入浙江大學電子信息工程專業,並在隨後的幾年裡繼續深造,最終於2010年獲得信息與通信工程碩士學位。
在校期間,他對金融市場產生了濃厚的興趣。特別在2008年全球金融危機之際,他帶領團隊探索了機器學習技術在全自動量化交易中的應用潛力。
2013年,他與浙大同學徐進共同創立了杭州雅克比投資管理有限公司,兩年後又成立了杭州幻方科技有限公司,致力於通過數學和人工智能進行量化投資。2015年的市場波動中,幻方依靠先進的高頻量化策略取得了令人矚目的成績。
2016年是幻方的重要轉折點。這一年,公司推出了首個基於深度學習的交易模型,並實現了所有量化策略的AI化轉型。2018年,幻方正式確立了以AI為核心的發展戰略。
2021年,幻方的資產管理規模突破千億大關,躋身國內量化私募領域的「四大天王」之列。2023年,他創辦深度求索DeepSeek,專注於做真正人類級別的人工智能。
相較內地其他商業類公司,梁文鋒掌舵的DeepSeek不做跟隨策略,而是堅持在模型結構層面做突破性的創新。他曾表示,人做投資決策是藝術,程序做決策是科學。
此前接受媒體採訪時,梁文鋒表示,中國AI不可能永遠處在跟隨的位置。「我們經常說中國 AI 和美國有一兩年差距,但真實的gap是原創和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。」
2024年5月初,DeekSeek宣布,其開源模型DeepSeek-V2的推理成本被降到每百萬token僅 1塊錢,約等於GPT-4 Turbo的七十分之一。隨後,國內排名靠前的大模型先後跟進,最高降幅甚至高達97%。經此一役,DeepSeek解鎖了一個新綽號——AI界的拼多多。
杭州深度求索於本月20日正式發表推理大模型DeepSeek-R1,甫推出便憑藉其「物美價廉」的特性,在海外開發者社群中引起了轟動。
作為開源模型,DeepSeek-R1在數學、程式碼、自然語言推理等任務上的表現,能比肩OpenAI o1模型正式版,並採用MIT授權協議,支援免費商用、任意修改和衍生開發等。

 相關推薦

熱門搜尋