Don't Miss
AI新定義|開放原碼促進會 制定開源AI標準
By 信報財經新聞 on November 1, 2024
原文刊於信報財經新聞「EJ Tech 創科鬥室」
不少科技巨企盼在市場搶佔一席位,近年推出自家人工智能(AI)開源大模型。開放原碼促進會(Open Source Initiative, OSI)近日公布「開源AI定義」,為開源AI大模型制定全新標準。OSI指真正的開源AI,不僅需要公開訓練數據的詳細資料,還需提供完整的程式碼、訓練設置及模型權重,有助澄清錯誤認知及過度營銷。
在定義中,OSI強調開源AI應在3個核心領域上保持完全透明。首先是訓練資料,因為這不僅決定了AI模型的輸出質素,亦影響其運行的倫理風險。其次,公開完整的設置與程式碼,能讓一眾開發者共同檢視並改善模型,推動開發更透明、開放的技術。最後,訓練設置和權重的公開,則有助維持模型穩定性。
OpenAI建數據集防回答「幻覺」
AI模型回答問題時,有時會輸出錯誤,或未經證實的答案,這胡言亂語的情況被稱為「幻覺」(Hallucinations)。為衡量語言模型在回應事實性問題的表現,OpenAI推出一款SimpleQA開源基準,以建立準確度高、具備多樣化及提升用戶體驗的數據集。