Gemma爭做世一 模型效能完勝Meta
原文刊於信報財經新聞「EJ Tech 創科鬥室」
繼上周發表Gemini 1.5 Pro升級版模型後,谷歌(Google)以相同的研究、技術及基礎架構組件,周三(21日)加推輕量開放式語言模型Gemma(意思指寶石),同時提供兩款模型Gemma 2B(20億參數)及Gemma 7B(70億參數)。谷歌強調,Gemma 7B在推理、數學、程式碼等關鍵基準測試中,效能領先較大的開源模型,例如Meta旗下Llama 2 13B。
容許商用分發 夥拍輝達提速
根據谷歌使用條款,Gemma容許所有組織負責任地商用及分發,除了可在桌面或筆記簿電腦、工作站、物聯網、流動裝置和Google Cloud平台運行,並能部署在機器學習平台Vertex AI及GKE引擎上。此外,谷歌與美國晶片商輝達(Nvidia)合作,讓Gemma模型在圖像處理器(GPU)加速運行,又預告支援新推出的Chat With RTX功能,把電腦本機檔案連接大型語言模型。
輕量級Gemma適合較小任務,例如簡單聊天、內容摘要。回顧早前亮相的Gemini 1.5 Pro,上下文支援100萬個Token(1個Token約等於英文4個字元),相當於讀取一小時影片、11小時錄音、3萬行程式碼或70萬個單字。Gemini Pro 1.5模型視訊輸入能力出色,例如上傳一條7秒短片後,即可辨識片中書架的書名;甚或從一條44分鐘的黑白默片中,捕捉難以察覺的畫面細節。
Gemini生成內容出錯需修正
順道一提,谷歌旗下Duet AI for Google Workspace,亦正式改名為Gemini for Google Workspace,讓客戶以AI模型提高工作效率,例如組織生日派對、起草行銷活動或撰寫商業計劃等。企業有Gemini Business及Gemini Enterprise兩個方案可供選擇,月費分別是20美元及30美元。服務有額外企業級保護,Gemini對話不會用於廣告、AI培訓或資料共享。
新模型技術或存在有不足之處,有人在社交平台X(前稱Twitter)發布截圖,指Gemini模型不符合史實,例如要求繪畫一對1820年的德國夫婦,卻生成印第安男人及印度裔女人,谷歌承認並正修復問題。此外,多位用戶在Reddit論壇報告,ChatGPT近日胡言亂語,更提供明顯失實的答案。OpenAI在狀態頁面顯示,已修復問題及監控情況。