Don't Miss

阿里開源AI模型｜手機適用可圖文影音輸入設男女聲解答

By 信報財經新聞 on March 28, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech」

自中國人工智能（AI）模型DeepSeek面世之後，內地大型語言模型競爭持續激烈。阿里巴巴（09988）昨天在Hugging Face及GitHub等軟件平台，開源首個端對端多模態AI模型Qwen2.5-Omni-7B，可供處理文字、圖像、音訊及視訊在內的輸入，同時產生即時文字及自然語音回應。模型可透過Qwen Chat及阿里雲開源社群ModelScope存取，亦可安裝在手機等邊緣設備上。

多模態AI模型Qwen2.5-Omni-7B，可供處理文字、圖像、音訊及視訊在內的輸入。（YouTube影片擷圖）

懂得導航總結文章內容等

Qwen2.5-Omni-7B以緊湊的7B參數設計，並採用Thinker-Talker等創新架構，可以把文本生成及語音合成分開，最大限度地減少不同模型的干擾，讓開發人員設計靈活、經濟高效的AI代理，尤其是智能語音應用程式。從示範影片可見，新模型內建兩把聲音，分別是女聲的Cherry及男聲的Ethan。用戶以手機配合語音發問時，可總結文章內容、計算手寫方程式、指導下廚、環境導航，甚至分析結他樂譜等。

Qwen2.5-Omni-7B如一位助手，在身邊指導用戶下廚煮麵。（YouTube影片擷圖）

阿里新模型當中的Omni，來自拉丁語單字Omnis，意為全部、一切或全方位。在多模態融合任務OmniBench等評測中，Qwen2.5-Omni以56.1分刷新業界紀錄，遠超Google Gemini-1.5-Pro的42.9分，表現冠絕同類AI模型。

翻查資料，阿里雲在過去幾年，已開源超過200個生成式人工智能（GenAI）模型，讓開發人員修改及重新分發軟件。

Qwen2.5-Omni近人類感官

阿里雲去年9月及今年1月先後發布Qwen2.5及Qwen2.5-Max，在Chatbot Arena表現排名第七，媲美其他頂級自研大型語言模型。他們近日開源Qwen2.5-VL及Qwen2.5-1M，以增強視覺理解及長上下文輸入處理。

簡單而言，Qwen2.5-Omni以接近人類多感官方式，認知世界並與之即時交互，更能透過音訊視訊辨識情緒，在複雜的任務作出明智決策。

美國媒體CNBC報道，阿里巴巴堅定地推行AI策略，例如上月宣布未來3年，向雲端運算及AI智能基建投資530億美元（約4134億港元），超越過去10年在該領域的投入。

至於內地其他科企巨頭方面，百度（09888）上周發布文心大模型4.5及X1，其中大模型4.5是一款多模態基礎模型，可同時理解文字、圖像、聲音與影片內容；文心大模型X1為一款深度思考推理模型，同時具備多模態能力，標榜使用成本僅為DeepSeek- R1的一半。

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI feature Qwen2.5-Omni-7B 開源阿里巴巴

Tweet

Pin It

Related Posts

LLM人格評估｜理大新系統評估大模型人格

LLM人格評估｜理大新系統評估大模型人格

Deel｜平台助企業跨國實時支薪

Deel｜平台助企業跨國實時支薪

法律AI｜商湯夥中大研法律資訊AI

法律AI｜商湯夥中大研法律資訊AI

AI不當回應｜GPT-4.1建議用戶入侵賬號解悶

AI不當回應｜GPT-4.1建議用戶入侵賬號解悶

Latest News

高速網絡釋放電玩潛能（林國誠）
任天堂正式宣布全新一代遊戲主機Switch 2將於6月隆重登場，引發全球遊戲迷熱烈期待。作為繼承Switch王者地位的新世代掌機，Switch 2帶來更強畫質、更流暢操作，以及嶄新的網絡功能，讓遊戲體驗全面升級。

Posted April 25, 2025

0

LLM人格評估｜理大新系統評估大模型人格
香港理工大學工業及系統工程學系助理教授李力恒領導的團隊，近日研發一套名為「語言模型人格評估」的AI驅動系統，能透過語言分析對LLM人格特徵進行量化評估。

Posted April 25, 2025

0

Deel｜平台助企業跨國實時支薪
美國人力資源管理平台Deel發布多款人工智能（AI）驅動的產品套件，旨在改變企業僱用、管理和支付跨國團隊薪酬等工序，有助解決部門獨立運作而導致的低效問題，透過其一站式平台助企業跨國合規營運。

Posted April 25, 2025

0

法律AI｜商湯夥中大研法律資訊AI
本地人工智能（AI）軟件公司商湯（00020）與香港中文大學法律學院簽署合作備忘錄，雙方將基於商湯粵語大模型Sensechat共同開發法律資訊AI模型，並計劃開放予香港公眾使用。

Posted April 25, 2025

0

AI不當回應｜GPT-4.1建議用戶入侵賬號解悶
ChatGPT開發商OpenAI早前推出新一代人工智能（AI）模型GPT-4.1，惟未按慣例同步發布技術報告與安全評估。

Posted April 25, 2025

0

AI出題捱轟｜加州律師試 AI擬訂考題捱轟
美國加州律師公會近日公布，今年2月舉辦的新律師資格考試，引進了經由人工智能（AI）協助撰寫的題目。

Posted April 25, 2025

0

AI代理｜「AI為先企業」授權員工管智能代理重塑工作架構須靈活調配人機比例
微軟日前發表《2025年工作趨勢指數報告》，半數受訪本港企業領導層指出，正利用人工智能代理全面自動化工作流程或業務程序，其中客戶服務、市場推廣及產品開發，為AI投資的首要領域。

Posted April 25, 2025

0

POPULAR POSTS

AI作弊系統｜輟學生誓言欺騙一切 AI作弊系統吸4134萬

 AI編程｜奧巴馬：AI編程勝過七成專家

 應科院｜25年轉移1500項技術

 探索大灣區科技創新（湛家揚博士）

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe

阿里開源AI模型｜手機適用 可圖文影音輸入 設男女聲解答

懂得導航 總結文章內容等

Qwen2.5-Omni近人類感官

支持EJ Tech

Related Posts

Latest News

POPULAR POSTS

成為 EJ Tech 會員

阿里開源AI模型｜手機適用可圖文影音輸入設男女聲解答

懂得導航總結文章內容等