Don't Miss

DeepSeek｜蒸餾技術降本增效企業性價比之選補大模型不足

By 信報財經新聞 on February 24, 2025

原文刊於信報財經新聞「EJ Tech 創科鬥室」

內地人工智能（AI）初創「深度求索」（DeepSeek），其低訓練成本的AI模型橫空出世後，一度觸發全球科企股震盪。易方資本創辦人及投資總監王華強調，DeepSeek的做法不應被完全視為「內捲式」競爭，更認為與ChatGPT等大模型相比，相信不會形成分庭抗禮的局面，而是各走不同跑道。

「AI教母」s1不輸對手

自DeepSeek橫空出世後，「AI教母」李飛飛團隊緊隨其後，發布以不到50美元（約390港元）訓練的AI模型s1。這模型同樣基於「蒸餾」技術，再結合模型微調，聲稱推理能力不輸OpenAI o1及DeepSeek-R1模型。

所謂「蒸餾」技術（Distillation），是一種把大型、複雜模型的知識，壓縮並轉移到較小模型的方法。此舉優勢是保持性能的同時，降低對計算資源的需求。易方資本AI研發顧問王遨研以s1為例，對這技術作進一步解釋。

王遨研介紹，s1屬於集三家模型之大成：阿里巴巴（09988）旗下通義千問、Anthropic旗下Claude及Google旗下Gemini模型。李飛飛團隊利用Claude整理問題列表，即用於訓練模型的合成數據集。下一步，透過Gemini模型回答問題，提取其思考過程。隨後，Claude會把Gemini的回答，與正確答案對比並評分。最後，把上述訓練的結果，用於微調s1底層的通義千問模型。

左圖：王華認為，DeepSeek創辦人梁文鋒具扎實專業能力，有助工程師下屬信服。（盧詠賢攝）右圖：王遨研表示，DeepSeek服務價格較低，在處理大量數據時，具備降本增效的優勢。（盧詠賢攝）

易方資本：各有應用場景

針對坊間有關DeepSeek「抄襲」、「內捲」等爭議，王華指出，DeepSeek使用的技術並非首創，之前有不少先例。他直言，DeepSeek之類「小模型」的出現，並非旨在取代大模型，而是新創一條跑道，各有應用的場景。

王遨研補充，「蒸餾」的實際價值，在於降本增效。當任務精確度要求不高時，模型的參數量就不那麼重要。王遨研稱，小模型是一個良好的起點，在性能有限的終端設備上，有助提升模型的表現。

談到普通用戶的日常需求，王遨研重申，DeepSeek、ChatGPT及其他模型，實際表現相距不遠。惟程式員等專業人士，ChatGPT能夠將問題，拆解為小任務並逐步解決，效果略勝一籌。至於企業層面，DeepSeek服務價格較低，當需要處理大量數據時，降本增效能力尤其突出。

採訪、撰文：周泳彤

相關文章：DeepSeek｜梁文鋒工程師出身利團隊溝通管理

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI DeepSeek feature s1 易方資本李飛飛王華王遨研蒸餾

Tweet

Pin It

Related Posts

自律型AI代理革新醫療（賴志偉）

自律型AI代理革新醫療（賴志偉）

Monica｜新平台Monica玩盡多款AI模型

Monica｜新平台Monica玩盡多款AI模型

UALink｜反輝達聯盟推UALink互連標準

UALink｜反輝達聯盟推UALink互連標準

風投a16z｜擬籌1560億入股AI企

風投a16z｜擬籌1560億入股AI企

Latest News

關稅戰｜iPhone如遷回美國生產成本料飆逾90%
美國白宮暗示蘋果公司可以在美國生產iPhone，美國銀行(Bank of America)對此認為，如果蘋果將生產轉移到美國，iPhone製造成本可能飆升90%。

Posted April 10, 2025

0

自律型AI代理革新醫療（賴志偉）
隨着人工智能（AI）技術迅速發展，已不再僅限於執行簡單任務，而是演變成具備高度自主性的智能系統。

Posted April 10, 2025

0

Monica｜新平台Monica玩盡多款AI模型
現時試玩聊天機械人，除透過美企Quora旗下Poe平台外，網上流行另一款工具Monica，毋須虛擬私人網絡（VPN）即可在單一平台試玩多種AI模型。

Posted April 10, 2025

0

UALink｜反輝達聯盟推UALink互連標準
超微半導體（AMD）、亞馬遜網絡服務（AWS）、博通、思科、谷歌（Google）、惠普企業（HPE）、英特爾、Meta、微軟及Astera Labs等一班科企供應商組成UALink聯盟（The UALink Consortium），旨在為人工智能（AI）數據中心網絡開發新產業標準。

Posted April 10, 2025

0

風投a16z｜擬籌1560億入股AI企
路透引述消息人士稱，矽谷著名風投公司Andreessen Horowitz（a16z）計劃成立一個科技投資基金，集資額高達200億美元（約1560億港元），用於專注成長階段的美國AI公司。

Posted April 10, 2025

0

AI籌款｜四款AI代理募捐得款2340元
人工智能代理（AI Agents）等工具，以自動化提高企業利潤。最近有非牟利組織證明，這技術也可成為一股向善力量。

Posted April 10, 2025

0

維基存亡｜AI猛抓資料訓練危及維基存亡藉免費數據獲利不用付儲藏營運成本
經營維基百科（Wikipedia）的維基基金會最近「報喜」，指自從2024年1月以來，維基百科多媒體內容下載量較之前上升50%。

Posted April 10, 2025

0

POPULAR POSTS

AICT｜內地AI紅綠燈下半年來港發布 AICT智能交通方案解決塞車疏導人流

 搶人才｜Google一年有薪假阻AI專才跳槽

 AI大戰｜Meta Llama 4兩多模態模型面世

 AI時代｜IBM z17主機運算量增五成

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe

DeepSeek｜蒸餾技術降本增效 企業性價比之選 補大模型不足

「AI教母」s1不輸對手

易方資本：各有應用場景

相關文章：DeepSeek｜梁文鋒工程師出身 利團隊溝通管理

支持EJ Tech

Related Posts

Latest News

POPULAR POSTS

成為 EJ Tech 會員

DeepSeek｜蒸餾技術降本增效企業性價比之選補大模型不足

相關文章：DeepSeek｜梁文鋒工程師出身利團隊溝通管理