Don't Miss

DeepSeek｜蒸餾技術降本增效企業性價比之選補大模型不足

By 信報財經新聞 on February 24, 2025

原文刊於信報財經新聞「EJ Tech 創科鬥室」

內地人工智能（AI）初創「深度求索」（DeepSeek），其低訓練成本的AI模型橫空出世後，一度觸發全球科企股震盪。易方資本創辦人及投資總監王華強調，DeepSeek的做法不應被完全視為「內捲式」競爭，更認為與ChatGPT等大模型相比，相信不會形成分庭抗禮的局面，而是各走不同跑道。

「AI教母」s1不輸對手

自DeepSeek橫空出世後，「AI教母」李飛飛團隊緊隨其後，發布以不到50美元（約390港元）訓練的AI模型s1。這模型同樣基於「蒸餾」技術，再結合模型微調，聲稱推理能力不輸OpenAI o1及DeepSeek-R1模型。

所謂「蒸餾」技術（Distillation），是一種把大型、複雜模型的知識，壓縮並轉移到較小模型的方法。此舉優勢是保持性能的同時，降低對計算資源的需求。易方資本AI研發顧問王遨研以s1為例，對這技術作進一步解釋。

王遨研介紹，s1屬於集三家模型之大成：阿里巴巴（09988）旗下通義千問、Anthropic旗下Claude及Google旗下Gemini模型。李飛飛團隊利用Claude整理問題列表，即用於訓練模型的合成數據集。下一步，透過Gemini模型回答問題，提取其思考過程。隨後，Claude會把Gemini的回答，與正確答案對比並評分。最後，把上述訓練的結果，用於微調s1底層的通義千問模型。

左圖：王華認為，DeepSeek創辦人梁文鋒具扎實專業能力，有助工程師下屬信服。（盧詠賢攝）右圖：王遨研表示，DeepSeek服務價格較低，在處理大量數據時，具備降本增效的優勢。（盧詠賢攝）

易方資本：各有應用場景

針對坊間有關DeepSeek「抄襲」、「內捲」等爭議，王華指出，DeepSeek使用的技術並非首創，之前有不少先例。他直言，DeepSeek之類「小模型」的出現，並非旨在取代大模型，而是新創一條跑道，各有應用的場景。

王遨研補充，「蒸餾」的實際價值，在於降本增效。當任務精確度要求不高時，模型的參數量就不那麼重要。王遨研稱，小模型是一個良好的起點，在性能有限的終端設備上，有助提升模型的表現。

談到普通用戶的日常需求，王遨研重申，DeepSeek、ChatGPT及其他模型，實際表現相距不遠。惟程式員等專業人士，ChatGPT能夠將問題，拆解為小任務並逐步解決，效果略勝一籌。至於企業層面，DeepSeek服務價格較低，當需要處理大量數據時，降本增效能力尤其突出。

採訪、撰文：周泳彤

相關文章：DeepSeek｜梁文鋒工程師出身利團隊溝通管理

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI DeepSeek feature s1 易方資本李飛飛王華王遨研蒸餾

Tweet

Pin It

Related Posts

擁有數據素養：利用數據驅動UNSDG（韋達人博士）

擁有數據素養：利用數據驅動UNSDG（韋達人博士）

港建全球AI樞紐借鑑杭州（湛家揚博士）

港建全球AI樞紐借鑑杭州（湛家揚博士）

本地創科動態｜科大交流展介紹創新醫療

本地創科動態｜科大交流展介紹創新醫療

太陽AI模型｜阿里太陽AI大模型預報耀斑

太陽AI模型｜阿里太陽AI大模型預報耀斑

Latest News

擁有數據素養：利用數據驅動UNSDG（韋達人博士）
數據素養是解鎖永續發展的關鍵能力。通過理解數據分析的核心邏輯，我們能精準識別社會痛點，例如運用貧困地區的經濟、教育與醫療數據，定位資源缺口，推動針對性扶貧政策；或透過收入與機會的量化分析，揭露結構性不平等，促使制度革新。

Posted April 3, 2025

0

港建全球AI樞紐借鑑杭州（湛家揚博士）
中國科技界近期的創新吸引了全球目光。DeepSeek及宇樹科技等初創公司，憑藉突破性的技術及機械人表演，向世界展示了杭州的科技實力。

Posted April 3, 2025

0

本地創科動態｜科大交流展介紹創新醫療
在人工智能（AI）浪潮下，醫療行業亦要不斷革新，以趕上急速的發展步伐。香港科技大學昨天舉辦「業界交流日」，以AI、生物科技及醫療科研為主題。

Posted April 3, 2025

0

太陽AI模型｜阿里太陽AI大模型預報耀斑
阿里（09988）在微信平台提到，中國科學院國家天文台與阿里雲合作，發布全球首個太陽人工智能（AI）模型「金烏」。

Posted April 3, 2025

0

腦機介面｜腦機介面解碼助癱者「說話」
美國加州大學柏克萊與三藩市分校的研究團隊，已成功開發和優化一種創新的腦機介面技術，讓一位因腦幹中風導致癱瘓、失去語言能力長達18年的女性，藉腦波即時合成語音與文字重新「說話」。

Posted April 3, 2025

0

AI代理｜外國逾半大企業已部署AI代理英澳佔比領先 IT客服財務部最受惠
美國數碼營運管理平台PagerDuty發布一項國際調查，在美國、英國、澳洲及日本等國家，今年2月底訪問大約1000名IT及企業高管，所有公司年收入至少5億美元。

Posted April 3, 2025

0

我命由我不由天的創業信念（鄧淑明博士）
眾所周知，創業的成功率非常低，能慶祝開業一周年的不足一成，而可以捱過5年的普遍只得3%，而香港更低於1%。

Posted April 2, 2025

0

POPULAR POSTS

AI預測｜蓋茨：兩工作十年內較受AI衝擊

 新凱來｜中國光刻機躍進挑戰龍頭ASML

吉卜力之亂 AI搶飯碗（高天佑）

Runway｜Gen-4合成短片風格統一

 我命由我不由天的創業信念（鄧淑明博士）

鐳射沃｜5年斥3億在港升級生產

 GenAI技術突破到應用變革（黃莹博士）

腦機介面｜腦機介面解碼助癱者「說話」

沈祖堯｜中大前校長：醫生不用AI會被取代

 AI搜尋「從一到多」演變（黃岳永）

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe

DeepSeek｜蒸餾技術降本增效 企業性價比之選 補大模型不足

「AI教母」s1不輸對手

易方資本：各有應用場景

相關文章：DeepSeek｜梁文鋒工程師出身 利團隊溝通管理

支持EJ Tech

Related Posts

Latest News

POPULAR POSTS

成為 EJ Tech 會員

DeepSeek｜蒸餾技術降本增效企業性價比之選補大模型不足

相關文章：DeepSeek｜梁文鋒工程師出身利團隊溝通管理