By Jason Chu in 科技新知 — 20 1月 2026

DeepSeek 一週年：從震撼全球到歸於平靜，這場 AI 風暴教會我們什麼？

2025 年 1 月，中國 AI 新創 DeepSeek 以僅 600 萬美元的訓練成本，打造出媲美 OpenAI 頂尖模型的 R1，一度讓 NVIDIA 市值單日蒸發 6000 億美元。

2025 年 1 月，一家名不見經傳的中國 AI 公司 DeepSeek，用一款開源模型讓全球科技圈集體倒抽一口氣。

當時 DeepSeek 發布的 R1 模型，在數學推理、程式碼生成等任務上，表現直逼 OpenAI 最強的 o1 模型。但真正讓人震驚的是成本——DeepSeek 聲稱整個訓練過程僅花費約 600 萬美元，不到 OpenAI 訓練 GPT-4 成本的十分之一。

消息一出，NVIDIA 股價單日暴跌 17%，市值蒸發近 6000 億美元，創下美國股市史上單一公司最大單日跌幅紀錄。媒體紛紛用「史普尼克時刻」來形容這場衝擊，彷彿 1957 年蘇聯搶先發射人造衛星的歷史重演。

時間快轉到 2026 年 1 月，當初的恐慌早已煙消雲散。

NVIDIA 等晶片股不僅收復失土，股價還持續創新高。過去一年，DeepSeek 陸續發布了 7 次模型更新，但沒有任何一次再造成當初那樣的市場震盪。分析師指出，後續更新被視為「延續與鞏固」，而非「新一波衝擊」。

更關鍵的是，DeepSeek 原定 2025 年中發布的次世代 R2 模型至今仍未問世。據傳原因是在華為國產晶片上訓練遇到困難——美國晶片出口管制的影響，終究還是浮現了。

DeepSeek 選擇完全開源，任何人都可以下載模型權重來使用、微調甚至再訓練。這讓它在開發者社群中迅速擴散，也讓「低成本 AI 開發」不再只是口號。

然而，開源也帶來了爭議。由於 DeepSeek 的雲端服務資料儲存在中國境內，多國政府基於資安考量紛紛祭出禁令。義大利直接將 App 下架；台灣宣布公務機關全面禁用，學術單位若有需求，必須在不含個資的電腦上斷網使用；澳洲、韓國、美國也陸續跟進，對政府機關下達禁令。

此外，DeepSeek 在回答敏感議題時，會直接迴避或反映中國官方立場，這種內建的審查機制也讓不少使用者卻步。

DeepSeek 這一年的故事，其實透露了幾個重要訊號：

第一，AI 競爭不只是燒錢比賽。 DeepSeek 用 Mixture of Experts（MoE）等架構創新，證明了在資源受限的情況下，依然有機會打造出頂尖模型。這對預算有限的開發者和新創來說，是莫大的鼓舞。

第二，開源生態正在改變遊戲規則。 當模型權重可以自由下載，企業就有機會在本地端部署 AI，不必把敏感資料上傳到雲端。這對注重資料主權的應用場景尤其重要。

第三，地緣政治是繞不開的變數。 再強大的技術，一旦牽涉到資安與國家安全，就會面臨使用限制。選擇 AI 工具時，技術規格只是考量之一，資料流向和法規風險同樣不可忽視。

據傳 DeepSeek 將在農曆新年前後發布新一代 V4 模型，主攻程式碼生成能力，內部測試據說已超越 Claude 3.5 Sonnet。能否再次掀起波瀾？值得持續關注。

這場從震撼到平靜的一年，或許正是 AI 產業從「狂熱」走向「務實」的縮影。技術會持續演進，但如何在創新與風險之間取得平衡，才是每個開發者和企業真正要面對的課題。