You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

HKGAI V1|港年內推首個大模型 接入DS結合本地數據

By on February 26, 2025

原文刊於信報財經新聞「EJ Tech 創科鬥室

香港科技大學主導成立的研究機構InnoHK香港生成式人工智能研發中心(HKGAI),昨全球首發HKGAI V1大模型,主打理解香港風土民情及歷史文化,目標今年內供本港市民及開發者使用。創新科技及工業局局長孫東致詞時稱:「這波以人工智能(AI)為代表的科技浪潮中,香港沒有缺席。」他希望本港研發的大型語言模型,能夠立足香港、盡快服務大眾,以此平台服務數以千萬的海外華人。

科大首席副校長、HKGAI主任郭毅可指出,HKGAI V1標榜為香港唯一的基礎大模型,它是在數碼港超算中心支持下,以不多於2000張圖像處理器(GPU)訓練而成。以內地開源模型DeepSeek(DS)671B為基礎,全參數微調後結合香港獨有數據,例如港府公開資料集、本地文化資料、專業術語詞彙表解釋,以及特定領域知識庫訓練出來,從文本模態到多模態擴展。

設多個App 擅長公文法律環評

HKGAI V1全面支持兩文三語,包括粵語、英語及普通話。測試跑分方面,大規模多任務語言理解(MMLU)評分超過90分,表現遠超3年目標68分;AGIEval基準測試錄得82.13得分,優於Meta Llama 3 405B之71.6分;在基本性能及安全性能評測,HKGAI V1(R1)分別錄得90.4分及88.95分,後者跑贏DeepSeek兩大模型V3(83.81分)及R1(70.41分)。

實際應用方面,HKGAI V1擅長政府知識及即時資訊,已部署在HKCoPilot系統。在數字政策辦公室協調下,港府大約70個部門參與試用,服務本地公務員文書工作。另一方面,大模型旗下有多個垂直應用(App),包括聊天機械人「港話通」(HKChat)、公文用途的「港文通」、總結會議重點的「港會通」、分析法律文件的「港法通」,以及聚焦環評資訊的「港環通」。

郭毅可介紹,HKGAI V1旗下有多個垂直應用,包括「港話通」、「港文通」、「港會通」、「港法通」及「港環通」。(邱敏聰攝)

郭毅可:開發團隊重視版權

現場示範可見,用戶可以經由「港話通」手機程式,以語音查詢港府組織架構,亦可列出本地旅遊景點、國產動畫電影《哪吒2》最新票房,更可用《水調歌頭》詞牌為哪吒寫一首詞。生成應用方面,HKGAI V1可用作譜曲、虛擬人物唱歌及影視創作。團隊利用已故全國政協副主席霍英東照片,複製聲線後再生成其談話影片,跨時空跟其長孫霍啟剛「聊天」。

用戶可經由「港話通」手機程式,語音查詢港府組織架構,或本地熱門旅遊景點。(邱敏聰攝)
研發團隊以已故全國政協副主席霍英東照片,複製聲線後再生成其談話影片。(邱敏聰攝)

訓練AI模型必須有人才配合,郭毅可表示,科大在2024年QS全球大學分科排名,在數據科學及AI學科位列全球第十。研發團隊來自清華、北大等內地高校,亦有70多個科大學生參與開發,強調學生及研究是「第一梯隊」。針對近日政府建議修訂《版權條例》,擬引入文本及數據開採豁免,供AI模型訓練。郭毅可強調,團隊非常重視版權問題,必須保證訓練數據合法性,他相信本港的法律專家會與外界探討合適的法律。

AI模型研發團隊來自內地高校,亦有70多個科大學生參與開發。(邱敏聰攝)

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們