You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

開源語言模型StableLM 實測中文訓練未成熟

By on April 21, 2023

原文刊於信報財經新聞「StartupBeat創科鬥室

生成式人工智能(AI)藝術工具Stable Diffusion,背後的英國初創Stability AI發布開源語言模型StableLM,它由一個名為The Pile數據集訓練出來,可生成文本及代碼,更能下載到電腦運作,減少數據外洩機會。Alpha版本模型分別有30億及70億參數,後續還有150億至650億參數等版本,但跟OpenAI GPT-3的1750億個參數相距甚遠。

StableLM模型現為Alpha版本,分別有30億及70億參數。(GitHub網上圖片)

專攻邊緣運算設計

Stability AI強調,該模型公開透明,專為邊緣運算設計,標榜兼容大部分硬件,適合學術研究或商業用途,惟須受CC BY-SA-4.0許可條款約束。本報測試後發現,英語書信文筆順暢,中文訓練明顯未完成,繁簡字混雜答非所問,有待開發人員改良。

本報測試後發現,中文答非所問,而且繁簡字混雜,模型明顯未完成訓練。(Hugging Face網上圖片)

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們