Don't Miss
開源語言模型StableLM 實測中文訓練未成熟
By 信報財經新聞 on April 21, 2023
原文刊於信報財經新聞「StartupBeat創科鬥室」
生成式人工智能(AI)藝術工具Stable Diffusion,背後的英國初創Stability AI發布開源語言模型StableLM,它由一個名為The Pile數據集訓練出來,可生成文本及代碼,更能下載到電腦運作,減少數據外洩機會。Alpha版本模型分別有30億及70億參數,後續還有150億至650億參數等版本,但跟OpenAI GPT-3的1750億個參數相距甚遠。
專攻邊緣運算設計
Stability AI強調,該模型公開透明,專為邊緣運算設計,標榜兼容大部分硬件,適合學術研究或商業用途,惟須受CC BY-SA-4.0許可條款約束。本報測試後發現,英語書信文筆順暢,中文訓練明顯未完成,繁簡字混雜答非所問,有待開發人員改良。