DeepSeek 一週年:從震撼全球到歸於平靜,這場 AI 風暴教會我們什麼?
2025 年 1 月,中國 AI 新創 DeepSeek 以僅 600 萬美元的訓練成本,打造出媲美 OpenAI 頂尖模型的 R1,一度讓 NVIDIA 市值單日蒸發 6000 億美元。一年後,市場早已恢復平靜,DeepSeek 後續 7 次更新都未再造成震撼,原定的 R2 模型也因華為晶片訓練困難而延期。
2025 年 1 月,一家名不見經傳的中國 AI 公司 DeepSeek,用一款開源模型讓全球科技圈集體倒抽一口氣。
當時 DeepSeek 發布的 R1 模型,在數學推理、程式碼生成等任務上,表現直逼 OpenAI 最強的 o1 模型。但真正讓人震驚的是成本——DeepSeek 聲稱整個訓練過程僅花費約 600 萬美元,不到 OpenAI 訓練 GPT-4 成本的十分之一。
消息一出,NVIDIA 股價單日暴跌 17%,市值蒸發近 6000 億美元,創下美國股市史上單一公司最大單日跌幅紀錄。媒體紛紛用「史普尼克時刻」來形容這場衝擊,彷彿 1957 年蘇聯搶先發射人造衛星的歷史重演。
一年後,市場怎麼了?
時間快轉到 2026 年 1 月,當初的恐慌早已煙消雲散。
NVIDIA 等晶片股不僅收復失土,股價還持續創新高。過去一年,DeepSeek 陸續發布了 7 次模型更新,但沒有任何一次再造成當初那樣的市場震盪。分析師指出,後續更新被視為「延續與鞏固」,而非「新一波衝擊」。
更關鍵的是,DeepSeek 原定 2025 年中發布的次世代 R2 模型至今仍未問世。據傳原因是在華為國產晶片上訓練遇到困難——美國晶片出口管制的影響,終究還是浮現了。
開源的雙面刃
DeepSeek 選擇完全開源,任何人都可以下載模型權重來使用、微調甚至再訓練。這讓它在開發者社群中迅速擴散,也讓「低成本 AI 開發」不再只是口號。
然而,開源也帶來了爭議。由於 DeepSeek 的雲端服務資料儲存在中國境內,多國政府基於資安考量紛紛祭出禁令。義大利直接將 App 下架;台灣宣布公務機關全面禁用,學術單位若有需求,必須在不含個資的電腦上斷網使用;澳洲、韓國、美國也陸續跟進,對政府機關下達禁令。
此外,DeepSeek 在回答敏感議題時,會直接迴避或反映中國官方立場,這種內建的審查機制也讓不少使用者卻步。
對我們的啟示
DeepSeek 這一年的故事,其實透露了幾個重要訊號:
第一,AI 競爭不只是燒錢比賽。 DeepSeek 用 Mixture of Experts(MoE)等架構創新,證明了在資源受限的情況下,依然有機會打造出頂尖模型。這對預算有限的開發者和新創來說,是莫大的鼓舞。
第二,開源生態正在改變遊戲規則。 當模型權重可以自由下載,企業就有機會在本地端部署 AI,不必把敏感資料上傳到雲端。這對注重資料主權的應用場景尤其重要。
第三,地緣政治是繞不開的變數。 再強大的技術,一旦牽涉到資安與國家安全,就會面臨使用限制。選擇 AI 工具時,技術規格只是考量之一,資料流向和法規風險同樣不可忽視。
下一步看什麼?
據傳 DeepSeek 將在農曆新年前後發布新一代 V4 模型,主攻程式碼生成能力,內部測試據說已超越 Claude 3.5 Sonnet。能否再次掀起波瀾?值得持續關注。
這場從震撼到平靜的一年,或許正是 AI 產業從「狂熱」走向「務實」的縮影。技術會持續演進,但如何在創新與風險之間取得平衡,才是每個開發者和企業真正要面對的課題。