Don't Miss

阿里EMO模型的利與弊（葉文瀚博士）

By 信報財經新聞 on March 7, 2024

本文作者葉文瀚博士，為亞洲行銷科技協會主席，為《信報》撰寫專欄「科網人語」。

阿里巴巴（09988）智能計算研究所上月發布生成式人工智能（Generative AI）模型EMO，引起全球廣泛關注。EMO是一款多語言模型，能夠根據輸入的照片及語音，生成逼真的表情動作，突破以往只能生成靜態影像的限制，為數碼媒體及虛擬內容生成帶來巨大創新。

阿里巴巴智能計算研究所上月發布生成式人工智能模型EMO，引起全球廣泛關注。（法新社資料圖片）

為展示EMO的卓越能力，阿里巴巴特別在軟件代碼託管平台 GitHub分享多條演示影片，包括美企OpenAI旗下模型Sora生成的東京街頭人物片段，旨在彰顯其領先地位。

EMO使用超過250小時涵蓋演講、電影、歌唱表演等多種類型的談話影片加以訓練，令其語音編碼器及面部區域掩模（Mask）能夠確保生成的臉部動作與語音內容匹配。

簡單而言，EMO生成過程分為兩個主要階段：編碼階段和擴散階段。首先在編碼階段，EMO利用參考圖像和動態影格提取特徵，並使用預訓練的語音編碼器處理語音嵌入。在擴散階段，EMO利用面部區域掩模及多幀雜訊，藉此控制面部圖像的生成，確保輸出的短片動作流暢自然及表情豐富。

EMO模型具重要應用價值。在數碼媒體領域，它能令靜態插圖、卡通角色或虛擬人物擁有生動表情和口形動作，為動畫片、遊戲和網絡漫畫等作品製作帶來便利，並提升品質。此外，EMO模型也能應用於虛擬主播、虛擬助手等範疇，令這些數碼角色更逼真及富有情感。

在虛擬內容生成技術上，EMO模型的應用非常廣泛。舉例來說，對於要生成虛擬對話的語音助手或虛擬情景演示的教育應用，EMO模型能為這些場景的虛擬角色賦予生動表情和口形動作，加強用戶體驗的真實感及情感連結。

然而，EMO模型亦帶來潛在風險和挑戰。隨着技術不斷發展，模型生成的影片及聲音可能變得愈來愈真假難分，這或對社會產生不良影響。因此，必須加強監管，以法律規範，確保生成技術合法及符合道德。

更多葉文瀚博士文章：

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI alibaba EMO

Tweet

Pin It

Related Posts

提示工程五大趨勢（車品覺）

提示工程五大趨勢（車品覺）

AI引導｜AI客服夥機械人公院帶路

AI引導｜AI客服夥機械人公院帶路

假AI？｜美電商菲律賓聘真人扮AI

假AI？｜美電商菲律賓聘真人扮AI

AMD｜蘇姿丰透露AMD聚焦三方向

AMD｜蘇姿丰透露AMD聚焦三方向

Latest News

晶片大戰｜輝達疑未向中方客戶披露美新禁令
中美關係陰霾重重，美國要求晶片巨頭輝達(Nvidia)對華出口H20晶片前須獲得許可證，路透引述消息人士透露，輝達在一周前已被告知新出口規定，但該公司沒有提前向一些主要客戶發出警告。

Posted April 16, 2025

0

飛行汽車｜小鵬首架飛行汽車明年量產
小鵬汽車（09868）首架飛行汽車「陸地航母」預計明年正式上市，並啟動大規模交付。

Posted April 16, 2025

0

提示工程五大趨勢（車品覺）
生成式人工智能（GenAI）正在快速發展，其中一個特別重要的領域，叫做提示工程（Prompt Engineering）。

Posted April 16, 2025

0

AI引導｜AI客服夥機械人公院帶路
本地AI方案供應商Innocorn Technology本月初在港島瑪麗醫院部署一款AI虛擬人，當中結合大型語言模型，以語音回答訪客的查詢、快速找到需要前往的位置。

Posted April 16, 2025

0

假AI？｜美電商菲律賓聘真人扮AI
美國電商Nate創辦人兼前行政總裁薩尼格，日前在紐約南區聯邦地區法院被起訴。檢方指控他涉嫌以關於AI業務的虛假陳述招攬投資，詐騙金額超過4000萬美元。

Posted April 16, 2025

0

AMD｜蘇姿丰透露AMD聚焦三方向
美國半導體巨頭超微（AMD）行政總裁蘇姿丰旋風訪台，周一（14日）與台積電董事長魏哲家見面之後，昨應邀出席台灣大學椰林講座的嘉賓，分享AMD轉型為人工智能（AI）領袖之路。

Posted April 16, 2025

0

OpenAI｜GPT-4.1三新模型編程躍進
ChatGPT開發商OpenAI宣布，旗下API（應用程式介面）新增GPT-4.1、GPT-4.1 mini及GPT-4.1 nano三大模型，後兩者是前者的小型版及微型版。

Posted April 16, 2025

0

POPULAR POSTS

Monica｜新平台Monica玩盡多款AI模型

 Shopify｜要求盡用AI節省人手

 AI魔法時代降臨（林國誠）

UALink｜反輝達聯盟推UALink互連標準

 OpenAI｜協助產業建專屬模型

 吉卜力漫畫化掀版權爭議（方保僑）

貿易通｜AI偵破深偽準確率98% 圖像影片換臉變聲無所遁形

 GitHub｜誤封中國斷網19小時

 Meta壟斷案｜正式開審朱克伯格作供

 假AI？｜美電商菲律賓聘真人扮AI

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe