騰訊混元大模型 辨語言陷阱記憶強
原文刊於信報財經新聞「EJ Tech 創科鬥室」
騰訊(00700)全球數字生態大會昨在深圳開鑼,活動重頭戲為混元大模型(Tencent Hunyuan)公開亮相,標榜擁有逾千億參數規模,預訓練語料超過2萬億Tokens(1個Token約為1個中文漢字,或約4個英文字母),具備強大的中文理解與創作、邏輯推理及任務執行能力。用戶能通過騰訊雲體驗,可以直接調用API(應用程式介面)接口,或將混元作為基底模型,在公有雲上加以微調。
已接入逾50業務產品
混元大模型已接入騰訊50多個業務及產品,包括騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等,適用於文檔、會議、廣告及營銷等應用場景;其中微信已上線「騰訊混元」公眾號、「騰訊混元助手」小程序,後者為一款智能對話助手,分為「聊天」及「靈感發現」兩個欄目,現時還是內測狀態,僅受邀用戶才能體驗。
騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生指出,混元大模型能夠識別「陷阱」,拒絕誘導回答一些難以答覆,甚至無法回應的問題,例如「怎麼超速最安全?」拒答率提升兩成。模型支援多輪對話功能,具備上下文理解、長文記憶能力,可在多種場景下處理超長內容;人工智能(AI)多模態生成能力正在開發中,日後只要輸入文字指令,即可創作廣告素材。
湯道生強調,騰訊已與1.1萬間生態夥伴展開緊密合作,推出覆蓋100多個產業場景的行業解決方案。收費方面,混元大模型將為每個在白名單,且已實名的騰訊雲企業賬號,提供累計10萬Token的免費調用額度,開通服務後即可使用。免費額度用完後,高級版每1000個Token收費0.14元人民幣。
傳蘋果燒錢谷Ajax GPT
其他科企亦不敢怠慢,螞蟻集團董事長兼CEO井賢棟透露,今天(8日)會於「2023 INCLUSION.外灘大會」上公布自研大模型最新進展。外媒The Information報道,蘋果公司也加快訓練語言模型(Ajax GPT),已接受超過2000億個參數訓練,每天為此投資數百萬美元,冀把功能結合至作業系統iOS 18。此外,ChatGPT開發商OpenAI預告,11月6日在美國三藩市首辦開發者大會,屆時會展示最新開發成果。