亞洲週刊

DeepSeek大顛覆梁文鋒改變AI遊戲規則 ☆作者:宋陽標

♦ 本篇文章轉載自 亞洲週刊。若有侵害著作權,請速告知,我們將盡速移除 ♦

 

2025/2/10 

中國人工智能DeepSeek橫空出世,廣東湛江長大的梁文鋒,聯同年輕的本土團隊,以極低成本訓練出媲美ChatGPT的AI,全部開源,全球免費使用,改變AI遊戲規則,顛覆美國霸權,登全球下載榜首,美科技股蒸發逾一萬億。美官員誣指DeepSeek偷竊知識產權,但美科企旋即改變敵對立場,英偉達、英特爾、微軟等都連接DeepSeek。特朗普擬加大對華芯片封鎖,但梁文鋒早就應變,改用國產芯片。 


202507f04.jpg

梁文鋒從量化基金到人工智能巨頭

中國人工智能深度求索DeepSeek橫空出世,以五百萬美元成本訓練出能力媲美ChatGPT的AI,全部開源,全球免費使用,改變AI遊戲規則,顛覆美國霸權,登上全球下載榜首,推倒制裁和資本密集的「小院高牆」,美科技股應聲蒸發逾一萬億美元。美官員誣指DeepSeek偷竊知識產權,美科企開始持敵對態度,但旋即改變立場,英偉達、英特爾、微軟等都將連接DeepSeek。特朗普稱DeepSeek為敲響美國科技業的警鐘,擬加大對華芯片封鎖,但DeepSeek創辦人梁文鋒早就應變,改用國產芯片,打造中國AI全自主的生態系統。挑戰OpenAI霸主地位的中國人工智能公司DeepSeek團隊成員超過一半是「九五後」,平均年齡三十五歲,都是中國式學霸。

一月二十日,DeepSeek宣布發布其R1模型,超出任何人的預期,美國資本市場大震盪,NVIDIA(英偉達)一夜之間丟掉五千五百億美元市值,暴跌百分之十七,市值被削掉五千八百八十八點六億。納斯達克綜合指數跌百分之三點零七,台積電、博通公司、超微半導體等科技股也遭遇集體暴跌。

DeepSeek的出現改變了人工智能的賽道,中美互相領先將成為常態,風險投資家馬克.安德森指「DeepSeek R1是人工智能的斯普特尼克時刻」。據DeepSeek表示,DeepSeek-V3和DeepSeek-R1這兩個模型受到了硅谷高管和美國科技公司工程師的一致好評,與OpenAI和Meta最先進的模型不相上下。

DeepSeek發布後不久,就成為美國蘋果及安卓下載平台的冠軍。自一月二十六日在蘋果商店的一百四十個國家登頂,全球下載量一週內逾一億,超過OpenAI的ChatGPT同期表現。印度成為DeepSeek下載量最多的區域,佔總下載量的百分之十五以上。美國下載量約佔總量的百分之八。

一月二十七日,美國總統特朗普表示:「我一直在閱讀有關中國和中國一些公司的消息,特別是有一家公司想出了一種更快、更便宜的人工智能方法。如果這是真的,那很好,我認為這是一個非常積極的發展。這意味著,你不必花費數十億美元,也可以得到同樣的解決方案。中國公司發布的DeepSeek應該為我們的行業敲響警鐘,我們需要在競爭中集中精力取勝。」

特朗普於一月三十一日會見了NVIDIA總裁黃仁勳,被指是向他施壓停止向中國供應特供版的AI芯片。消息同時傳出,美國政府正準備進一步限制AI芯片出口,以確保美國與盟國保有先進運算能力。

然而,DeepSeek的創辦人梁文鋒似乎早就料到,《快科技》、《騰訊網》等內媒爆出DeepSeek正積極籌備適配國產GPU,繞過NVIDIA的底層技術,實現科技上的完全自主,以應對下一波的制裁,繼續部署AI發展戰略。梁文鋒的計劃一旦成功,中國將可實現AI全生態圈的閉環發展,完全自給自足,瓦解美國制裁令的攻擊。

DeepSeek是杭州深度求索人工智能基礎技術研究有限公司(下稱深度求索)旗下的大語言AI模型,該公司專注於通用人工智能(AGI)的研發與應用,由梁文鋒於二零二三年七月創辦並通過多層股權結構實際控制,也是著名的「杭州六小龍」之一。DeepSeek通過自研架構與高效訓練方法,試圖在性能、成本與可控性間找到平衡點,其發展路徑融合了技術理想主義(AGI長期目標)與商業現實主義(B端落地)。

202507f03.jpg

小鎮高考狀元

梁文鋒一九八五年出生於廣東湛江。二零零二年,十七歲的他以湛江吳川縣一中「高考狀元」,考上浙大本科電子信息工程專業,二零零七年,梁文鋒在同系讀研究生,獲碩士學位。二零一三年,他與浙大同學徐進共同創立了杭州雅克比投資管理有限公司,二零一五年成立杭州幻方科技有限公司。二零二三年,他創辦了DeepSeek,專注於通用人工智能領域。

大學求學期間,梁文鋒與同學一起使用機器學習等技術探索全自動量化交易。二零一五年,他和同學成立幻方量化基金公司。四年後,幻方量化資金管理規模就突破百億元。

在資本市場的大潮中,幻方量化依靠高頻量化策略取得了令人矚目的成績。二零一六年十月,幻方量化推出第一個AI模型,第一份由深度學習生成的交易倉位上線執行。到次年底,幻方量化幾乎所有的量化策略都採用AI模型計算。二零一八年,幻方量化正式確立了以AI為核心的發展戰略。

梁文鋒創辦人工智能的企業與其在資本市場的深入有關。隨著幻化量方業務的快速擴展,其計算模型算力瓶頸逐漸顯現。梁文鋒開始帶隊研發了螢火系列訓練平台。梁文鋒團隊研發「螢火二號」的投入從一號的兩億元人民幣(約二千八百萬美元)增加到十億元,搭載了約一萬張NVIDIA的A100顯卡。二零二一年,幻方的資產管理規模突破千億大關,躋身國內量化私募領域的「四大天王」之列。

梁文鋒在創辦DeepSeek之前,就已經在人工智能領域積累了豐富的經驗。為了招募到優秀的技術人才,梁文鋒親自走訪各大高校和科研機構,向他們介紹自己的創業理念和技術願景。他的真誠和熱情打動了許多人,一批優秀的技術人才紛紛加入了DeepSeek的團隊。

DeepSeek的主創團隊匯聚了一批來自不同領域的頂尖人才。除了創始人梁文鋒外,團隊還包括機器學習專家、計算機視覺專家、自然語言處理專家。這些專家的加入有效提升了DeepSeek模型的訓練效率和準確性,為DeepSeek在多個領域的應用提供了?大的技術支持。

二零二三年七月,梁文鋒正式創辦深度求索。在二零二四年五月,DeepSeek發布混合專家語言模型DeepSeek-V2,並宣布DeepSeek-V2的推理成本被降到每百萬token僅一元錢,約等於GPT-4 Turbo的七十分之一。同年十二月二十六日,DeepSeek宣布上線並同步開源的DeepSeek-V3模型,並公布了五十三頁的訓練和技術細節。模型測算數據顯示,DeepSeek-V3雖然文字生成類任務較弱,但其代碼、邏輯推理和數學推理能力均名列前茅。

DeepSeek-V3整個訓練過程僅用了不到二百八十萬個GPU小時,模型全部訓練成本僅為五百五十七萬美元,這一成本幾乎是GPT4訓練成本的二十分之一。

二零二五年一月二十日晚,DeepSeek正式發布DeepSeek-R1,該模型在數學、代碼、自然語言推理等任務上,性能比肩OpenAI正式版。

202507f07.jpg

梁文鋒回湛江老家,居民熱烈慶祝

202507f06.jpg

DeepSeek創始人梁文鋒(後排左五)回湛江老家過年:在除夕與老同學踢足球

技術理想主義者

外界評價DeepSeek創始人梁文鋒是一位技術理想主義者,提供了目前中國科技界特別稀缺的一種聲音:他是少有的把「是非觀」置於「利害觀」之前,並提醒我們看到時代慣性,把「原創式創新」提上日程的人。

梁文鋒認為:因為我們覺得現在最重要的是參與到全球創新的浪潮裏去。過去很多年,中國公司習慣了別人做技術創新,中國拿過來做應用變現,但這並非是一種理所當然。這一波浪潮裏,我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展。

梁文鋒指出:我們認為隨著經濟發展,中國也要逐步成為貢獻者,而不是一直搭便車。

同為杭州六小龍之一的《黑神話.悟空》的製作人遊戲科學創始人馮驥發評力挺DeepSeek,稱DeepSeek是國運級別的科技成果。

馮驥在經過一個月的使用之後,給出了六個方面的高度評價:

一、強大。比肩O1的推理能力,暫時沒有之一。

二、便宜。參數少,訓練開銷與使用費用小了一個數量級。

三、開源。任何人均可自行下載與部署,提供論文詳細說明訓練步驟與竅門,甚至提供了可以運行在手機上的mini模型。

四、免費。官方目前提供的服務完全免費,任何人隨時隨地可用。

五、聯網。暫時唯一支持聯網搜索的推理模型(OpenAI的o1目前還不支持)。

六、本土。深度求索是一家很小規模的年輕中國公司,由沒有海外經歷甚至沒有資深從業經驗的本土團隊開發完成。

馮驥認為,如果有一個AI大模型做到了以上的任何一條,都是超級了不起的突破。

DeepSeek的核心開發團隊成員來自於北京大學、清華大學、北京郵電大學、北京航空航天大學、中山大學等學校,無一來自於留學群體。

梁文鋒說,DeepSeek-V2研發人才都是本土的,沒有海歸,人工智能前五十名頂尖人才可能不在中國,但「也許我們能自己打造這樣的人」。

從事無人駕駛技術研究的北京人工智能專家于宏嘯認為,DeepSeek的成功說明中國還是可以有很多創新性的東西。他說,中國創新的一直不是土壤的創新,DeepSeek讓大家感覺到中國的創新也是可以突破的,另外「我們還是更愛用中國的大模型,至少我們去提供數據,我們還是很願意的」。

對於外界關於創新成本太高、DeepSeek能不能承受的疑問,梁文鋒回答:創新的成本肯定不低,過去那種拿來主義的慣性也和過去的國情有關。但現在,你看無論中國的經濟體量,還是字節、騰訊這些大廠的利潤,放在全球都不低。我們創新缺的肯定不是資本,而是缺乏信心以及不知道怎麼組織高密度的人才實現有效的創新。

梁文鋒說:「過去三十年,我們都只強調賺錢,對創新是忽視的,創新不完全是商業驅動的,還需要好奇心和創造欲,我們只是被過去那種慣性束縛了。」

202507f02.jpg

DeepSeek團隊超過一半是「九五後」,平均年齡三十五歲

美指盜竊知識產權

美國眾議院首席行政事務官向國會辦公室發出通知,警告國會辦公室不要使用中國的人工智能應用DeepSeek的服務。美國總統府、航空航天總署、海軍等也紛紛禁止使用DeepSeek。

美國多名官員表示DeepSeek是「偷竊」,正對其影響開展國家安全調查。而中國國內也有一些聲音,認為DeepSeek採用蒸餾的方式盜竊OpenAI的知識產權。

路透社報道說,美國人工智能公司Scale AI首席執行官亞歷山大.王(Alexandr Wang)在接受CNBC採訪時表示,DeepSeek擁有五萬塊NVIDIA H100芯片,但他沒有提供證據,並聲稱不會披露這些芯片,因為這將違反華盛頓的出口管制規定,該規定禁止將此類先進的AI芯片出售給中國公司。

美國政府正在調查中國人工智能公司DeepSeek是否使用受管制芯片,美國有關方面指責這些芯片或通過包括新加坡在內的多個國家轉出口至中國。

新加坡貿工部說:「我們預期像英偉達這樣的美國公司遵守美國的出口管制和我國的司法。我們的海關和執法機構將繼續與美國對等部門密切合作。」NVIDIA表示,公司來自新加坡的營收,不意味芯片被轉運至中國,因為營收數據反映的是客戶的帳單地址,而非最終產品送達的地點。

美國對DeepSeek的壓力傳導到中國,一些擔心無法獲得美國簽證的計算機專家拒絕對DeepSeek發表評論。

然而,即便有種種質疑和攻擊,美國的微軟、NVIDIA、亞馬遜、英特爾、AMD等跨國公司卻很快接入了DeepSeek-R1使用。一直宣稱要調查DeepSeek的微軟強調,DeepSeek-R1模型已通過「嚴格的紅隊測試與安全評估」,並經歷「模型行為自動化檢測與廣泛的安全審查,以降低潛在風險」。

在DeepSeek壓力之下,OpenAI二月一日凌晨突然宣布,其最新推理模型O3-mini全面上線,一次性向所有人開放了O3-mini在ChatGPT和API中的使用權限,包括免費用戶。

OpenAI的歷史錯誤

OpenAI首席執行官奧特曼認為,OpenAI站在了歷史錯誤的一邊,需要制定不同的開源策略。奧特曼表示,DeepSeek確實是一個非常好的模型,OpenAI會開發出更好的模型,但不會像往年那樣保持那麼大的領先優勢了。

《經濟學人》雜誌認為,DeepSeek的模型實際上和谷歌和OpenAI的模型一樣好,一些人已經開始認為,「證明」不重要,因為它們是將美國模型的智能「蒸餾」成自己的軟件的結果,但即使是這樣,DeepSeek-R1仍然是一個突破。

圖靈獎得主、Meta首席人工智能科學家楊立昆(Yann LeCun)表示,對於DeepSeek的成功,其正確的理解應該是:開源模型正在超越專有模型。

一月二十日,中共中央政治局常委、國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會,聽取對《政府工作報告(徵求意見稿)》的意見建議。會上,李強指出,要以科技創新推動新舊動能轉換,集中力量突破關鍵核心技術和前沿技術,加快推進科技成果產業化,努力培育更多經濟新增長點。

中國AI井噴時刻

梁文鋒參加了這次會議。梁文鋒在會上涉及的內容為人工智能國產大模型的發展和前景。

在DeepSeek-R1發布前幾小時,中國MiniMax海螺上線了語音功能,同日下午,字節豆包上線實時語音大模型。當日晚,DeepSeek發布了DeepSeek-R1模型一個多小時後,月之暗面Kimi就推出K1.5多模態思考模型,兩家都稱新模型性能對標OpenAI O1正式版。

一月二十一日,騰訊開源了混元3D生成大模型2.0;同一天,百度開啟「自由畫布」應用的公測;DeepSeek團隊也在一月二十八日拋出了兩款多模態框架——Janus-Pro和JanusFlow新模型。一月二十九日,阿里雲通義千問超大規模的MoE模型Qwen2.5-Max正式上線……

一位上海的計算機專家表示,多年來,中國的一些知識分子唱衰國產科學技術,「逢中必罵」、「中必輸」等論調甚囂塵上,對中國科研人員冷嘲熱諷,對科技進步雞蛋裏挑骨頭,近幾年來,多名中國頂級科學家非正常死亡,中國的科研人員都冒著巨大的壓力在進行工作,這些壓力不僅是技術攻堅方面,更多是來自於社會上這些輿論上,DeepSeek的成功可謂是狠狠抽了這些大嘴巴子。

他說,DeepSeek的成功可謂是改變了人工智能領域由OpenAI一家獨大的局面,也改變了賽道,從此以後大家發現,人工智能這條路上,並不是只能遵守美國人的道路。

二月三日,OpenAI發布一款新的人工智能工具「Deep Research」,旨在為用戶執行耗時的線上研究任務,覆蓋領域廣泛,從複雜科學問題到汽車推薦等等。有關報道稱,Deep Research的能力大有提升,在某些方面大大超過深度求索這個頭號競爭對手。

麥肯錫全球研究所發布的報告指出,DeepSeek的崛起加速全球人工智能產業發展。報告認為,DeepSeek的技術創新和應用模式將為其他企業提供有益的借鑒,促進全球人工智能生態系統的繁榮發展。

中國商務部國際貿易經濟合作研究院研究員梅新育認為,現在的深度求索也好、其他人工智能公司及其產品也好,都需要在刺刀見紅的競爭中實現發展。中國在這個領域總體還是處於趕超進程中,在相當一段時間裏,交替領先應該是常態。能否實現持續領先,要看中國的持續努力。

202507f05.jpg

(上圖)梁文鋒(右)出席中國國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會、(下圖)李強正專心聽取梁文鋒意見 

 

 亞洲週刊  2025年06期 2025/2/10-2/16

202507f01.jpg

 

♦ 專文屬作者個人意見,文責歸屬作者,本報提供意見交流平台,不代表本站立場 ♦ 

 

 

搜尋

追蹤我們

徵人啟事

41.png

稿約

43.png

新大學臉書粉絲頁

新大學臉書粉絲頁

QR code:

官方網站

web.png

LINE官方帳號

line.png

臉書粉絲頁

fb.png

趕食髦 Food Fashion Up

18836024_1698614263773063_6618469583031104682_n.png

「革命『仍』未成功,同志『更』須努力!」舊大學未竟的志業,香火必得新大學承接。鄭重邀請您的參與,就在這一天為「新大學」政論專欄網站的成立,再續熱忱共襄盛舉,為人類和平民主、公平正義的心力文明付出貢獻。 More...

© 2025 新大學政論專欄. All Rights Reserved. Designed By Allstars