Don't Miss

DeepSeek掀生態整合戰（方保僑）

By 信報財經新聞 on March 17, 2025

本文作者方保僑為香港資訊科技商會榮譽會長，為《信報》撰寫專欄「科網人語」。

2025年初，中國AI新創公司深度求索（DeepSeek）憑藉開源大型語言模型（LLM）DeepSeek-R1與V3系列，引起全球科技業震盪。DeepSeek訓練成本僅557萬美元，卻能逼近OpenAI的GPT-4o效能。然而，更值得關注的現象是，騰訊（00700）、阿里巴巴（09988）、百度（09888）、商湯（00020）等科技巨頭，紛紛選擇接入DeepSeek技術。這背後不僅是技術競爭力的消長，更反映中國AI產業從單打獨鬥，邁向生態協作的戰略轉向。

DeepSeek的核心競爭力，關鍵在於三大技術創新，混合專家架構（MoE）、FP8混合精度訓練，以及多Token預測機制。MoE架構讓6710億參數的模型，每次推理僅須激活370億參數，大幅降低運算負擔；FP8精度則壓縮記憶體需求，提升圖像處理器（GPU）使用效率；而多Token預測突破傳統逐字生成的限制，加速推理速度。

DeepSeek的核心競爭力，關鍵在於其三大技術創新。（shutterstock網上圖片）

更重要的是，DeepSeek選擇全面開源，企業可直接調用應用程式介面（API）或部署地端模型，避免資料外洩至公有雲。這種基礎建設化的策略，讓DeepSeek如同AI領域的「水電煤」，成為生態系統不可或缺的底層支援。

中國科技企業雖早投入AI研發，卻面臨兩大樽頸，高昂訓練成本與資料合規風險。以百度文心一言為例，其訓練需動用上萬顆頂級GPU，成本突破數億美元，且模型效能受限於中美晶片戰下的硬件制裁。反觀DeepSeek僅以2000顆次級晶片完成訓練，並透過「知識蒸餾」技術，將大模型能力移植至Qwen、Llama等開源架構，讓企業能以低成本微調出產業專用模型。

百度文心一言的訓練需動用上萬顆頂級GPU，成本突破數億美元。（shutterstock網上圖片）

另一方面，中國政府對資料跨境流動的監管日趨嚴格，企業須確保AI服務符合《數據安全法》。DeepSeek的本地部署方案，正好解決此問題。這種可控的開源模式，讓企業既能享受AI紅利，又免於合規爭議，因而吸引鼎新等企業服務商合作開發地端AI一體機。

DeepSeek的成功，標誌着AI競賽從晶片軍備賽轉向生態整合戰。其開源策略不僅降低技術門檻，更重塑產業鏈價值分配，晶片龍頭如輝達的壟斷地位被動搖，而擅長模型優化與場景落地的企業將掌握新話語權。當開源成為武器，贏家不再是擁有最多晶片的公司，而是最能動員生態系統的人。

更多方保僑文章：

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI DeepSeek LLM 晶片

Tweet

Pin It

Related Posts

提示工程五大趨勢（車品覺）

提示工程五大趨勢（車品覺）

AI引導｜AI客服夥機械人公院帶路

AI引導｜AI客服夥機械人公院帶路

假AI？｜美電商菲律賓聘真人扮AI

假AI？｜美電商菲律賓聘真人扮AI

AMD｜蘇姿丰透露AMD聚焦三方向

AMD｜蘇姿丰透露AMD聚焦三方向

Latest News

晶片大戰｜輝達疑未向中方客戶披露美新禁令
中美關係陰霾重重，美國要求晶片巨頭輝達(Nvidia)對華出口H20晶片前須獲得許可證，路透引述消息人士透露，輝達在一周前已被告知新出口規定，但該公司沒有提前向一些主要客戶發出警告。

Posted April 16, 2025

0

飛行汽車｜小鵬首架飛行汽車明年量產
小鵬汽車（09868）首架飛行汽車「陸地航母」預計明年正式上市，並啟動大規模交付。

Posted April 16, 2025

0

提示工程五大趨勢（車品覺）
生成式人工智能（GenAI）正在快速發展，其中一個特別重要的領域，叫做提示工程（Prompt Engineering）。

Posted April 16, 2025

0

AI引導｜AI客服夥機械人公院帶路
本地AI方案供應商Innocorn Technology本月初在港島瑪麗醫院部署一款AI虛擬人，當中結合大型語言模型，以語音回答訪客的查詢、快速找到需要前往的位置。

Posted April 16, 2025

0

假AI？｜美電商菲律賓聘真人扮AI
美國電商Nate創辦人兼前行政總裁薩尼格，日前在紐約南區聯邦地區法院被起訴。檢方指控他涉嫌以關於AI業務的虛假陳述招攬投資，詐騙金額超過4000萬美元。

Posted April 16, 2025

0

AMD｜蘇姿丰透露AMD聚焦三方向
美國半導體巨頭超微（AMD）行政總裁蘇姿丰旋風訪台，周一（14日）與台積電董事長魏哲家見面之後，昨應邀出席台灣大學椰林講座的嘉賓，分享AMD轉型為人工智能（AI）領袖之路。

Posted April 16, 2025

0

OpenAI｜GPT-4.1三新模型編程躍進
ChatGPT開發商OpenAI宣布，旗下API（應用程式介面）新增GPT-4.1、GPT-4.1 mini及GPT-4.1 nano三大模型，後兩者是前者的小型版及微型版。

Posted April 16, 2025

0

POPULAR POSTS

Monica｜新平台Monica玩盡多款AI模型

 Shopify｜要求盡用AI節省人手

 AI魔法時代降臨（林國誠）

UALink｜反輝達聯盟推UALink互連標準

 OpenAI｜協助產業建專屬模型

 吉卜力漫畫化掀版權爭議（方保僑）

貿易通｜AI偵破深偽準確率98% 圖像影片換臉變聲無所遁形

 GitHub｜誤封中國斷網19小時

 Meta壟斷案｜正式開審朱克伯格作供

 假AI？｜美電商菲律賓聘真人扮AI

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe