You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

DeepSeek|分析料DeepSeek硬件投資39億

By on February 3, 2025

原文刊於信報財經新聞

中國人工智能(AI)大模型公司DeepSeek,以僅約560萬美元(約4368萬港元)及使用2048夥輝達(Nvidia)「H800」繪圖處理器(GPU),推出的新模型DeepSeek-R1,成本遠低美國科技巨擘,震驚全球市場。半導體研究機構SemiAnalysis近日發表報告估計DeepSeek歷來硬體投資支出遠高於5億美元(約39億港元)。

DeepSeek成本遠低美國科技巨擘,震驚全球市場。(路透資料圖片)

SemiAnalysis報告估計,DeepSeek使用5萬顆輝達Hopper架構GPU,包括1萬顆H800及1萬顆「H100」,還有特供中國的「H20」,這些GPU主要用於AI訓練、研究及財務模型。換算下來,DeepSeek總資本支出約為16億美元(約124.8億港元),其中營運成本估計有9.44億美元,對GPU的投資額超過5億美元。

綜合外媒報道,DeepSeek指只用6710億個參數數進行訓練的「V3」模型;2048顆輝達「H800」GPU、僅費時2個月,相當於280萬個GPU小時。至於Facebook母公司Meta Platforms使用4050億個參數訓練的「Llama 3」模型,則用3080萬個GPU小時,花費運算資源較V3多10倍,並採用的超級電腦內建16384顆「H100」GPU、費時54天。

至於DeepSeek日前文件透露,其模型DeepSeek V3的訓練成本僅為557.6萬美元,並註明成本包括V3的官方訓練,不包括與架構、演算法或資料相關的先前研究和消融實驗(ablation experiments)的成本。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們