Don't Miss

微軟AI聽3秒錄音扮人聲推語言模型VALL-E 可合成任何說話

By 信報財經新聞 on January 11, 2023

原文刊於信報財經新聞「StartupBeat創科鬥室」

人工智能（AI）發展一日千里，微軟近日針對文本到語音合成（Text-to-Speech, TTS）技術，發表「神經編解碼器語言模型」VALL-E，只要向AI提供3秒鐘錄音，便可以準確模擬當事人的聲音。VALL-E若學會一種特定聲音，就能合成對方任何說話，甚至模仿語氣及說話情景。

新模型跟操控聲波等常見做法不同，VALL-E所具備的語音合成能力，源於Meta Platforms去年10月推出的EnCodec技術，其巧妙之處在於系統能分析一個人的聲音，再利用AI訓練數據計算出到底這句話該如何發聲，再產生相應的音訊編解碼器（Audio Codec）。

能模仿聲線語氣

微軟在VALL-E示範網站上列出數十個AI模型的語音例子。介面左邊的Text為英文段落，Speaker Prompt及Ground Truth兩項，代表原有的人聲錄音。前者只有數秒長度，用作訓練VALL-E系統；後者按照Text字眼原文朗讀。此外，Baseline為傳統TTS合成例子，VALL-E代表以新模型輸出，方便網民聆聽兩者分別。

蘋果電子書增旁白

除了保留說話者的聲線特色及語氣，VALL-E更可模仿錄音樣本的「聲學環境」，例如訓練錄音來自電話時，AI合成出來的語音效果，亦模擬了講電話的感覺。不過，微軟擔心被人濫用技術，甚至用來冒充他人身份，故不設VALL-E代碼供人試用。

話分兩頭，蘋果公司上周也更新Apple Books服務，在部分精選的英文電子書，包括文學、歷史及女性小說，推出AI數碼旁白功能，共有Jackson及Madison男女配音選擇，令有聲讀物的製作及發行更簡單。至於小說以外的電子書，則交由Mitchell及Helena兩把聲音負責。

愛爾蘭網站Research and Markets去年有報告指出，全球有聲讀物的市場規模，到2030年將達到350.5億美元（約2734億港元），複合年均增長率（CAGR）為26.4%。微軟亦對AI前景感到樂觀，新聞媒體Semafor引述知情人士稱，該企傳再投資AI美企OpenAI，金額達100億美元（約780億港元）。

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI Apple Apple Books feature Microsoft Text-to-Speech VALL-E

Tweet

Pin It

Related Posts

機械人時代來臨｜輝達與特斯拉引領人形機械人革命香港如何融入全球競爭？

機械人時代來臨｜輝達與特斯拉引領人形機械人革命香港如何融入全球競爭？

晶片大戰｜南韓明年推780億低息貸款支持晶片產業

晶片大戰｜南韓明年推780億低息貸款支持晶片產業

AI工具｜美八成年輕領袖上班採用AI工具

AI工具｜美八成年輕領袖上班採用AI工具

AI耶穌｜瑞士教堂辦告解已跟千人互動

AI耶穌｜瑞士教堂辦告解已跟千人互動

Latest News

機械人時代來臨｜輝達與特斯拉引領人形機械人革命香港如何融入全球競爭？
在國際市場中，科技巨頭輝達（Nvidia）和特斯拉（Tesla）分別以其通用人工智能驅動的高性能技術與高度實用化的工業機械人，為全球機械人工業樹立了標杆。在人型機械人的未來，香港如何發揮自身優勢融入這場全球變革，EJ Tech 和你探討這個趨勢吧。

Posted November 27, 2024

0

晶片大戰｜南韓明年推780億低息貸款支持晶片產業
南韓財政部公布，當局計劃明年推出14萬億韓圜(約780億港元)的低息貸款，以支持其晶片產業。

Posted November 27, 2024

0

決策者慎防勝利沖昏頭腦（車品覺）
「熱手效應」（Hot-hand Effect）來自1985年美國心理學家吉洛維奇（Thomas Gilovich）的研究，他們分析了美國職業籃球聯賽（NBA）球員連續成功投籃的數據，所謂「熱手」更多是觀察者一種認知偏見的現象。

Posted November 27, 2024

0

房地產科技｜MTR Lab加盟城越拓地產科技
中國專注房地產科技（PropTech）創新的企業聯盟城越UrbanLab昨天宣布，港鐵（00066）全資子公司MTR Lab正式加盟為新成員，雙方將攜手在綠色創新、智慧城市等深度合作。

Posted November 27, 2024

0

念力操控｜Neuralink新試驗念力控制機械臂
億萬富豪馬斯克旗下神經科技公司Neuralink，周二獲准啟動新可行性研究，透過N1植入物及腦機介面，讓志願者以念力控制機械臂。Neuralink發文形容，此舉不僅恢復數碼自由，亦是恢復人身自由重要第一步。

Posted November 27, 2024

0

AI工具｜美八成年輕領袖上班採用AI工具
任何流行的辦公室技術往往吸引年輕人搶先使用。生產力應用程式Google Workspace委託哈里斯民意調查機構，訪問美國1005名年齡介乎22至39歲、主要為領導層的全職工作者，以探討其生成式人工智能（Generative AI）使用情況。

Posted November 27, 2024

0

AI耶穌｜瑞士教堂辦告解已跟千人互動
位於瑞士琉森的彼得禮拜堂（Peter's Chapel），今年8月起破天荒在告解室引進實驗性質的藝術裝置Deus in Machina，並於今天（27日）分享專案成果。這位「人工智能（AI）耶穌」以桌面電腦運算，在熒幕呈現數碼臉孔。

Posted November 27, 2024

0

EJ Tech Video

POPULAR POSTS

Microsoft｜新推迷你電腦開機僅需數秒

 人造鵝肝｜培植過程不再殘忍全球首款港指定餐廳有售

 WIC構建網絡命運共同體（方保僑）

晶片大戰｜輝達AI超級晶片料明下半年上市

 AI趨勢｜Sony旗艦相機攻AI 動物識別力增三成

 AI 驅動的心理健康數據分析（吳壽冠）

樂齡科技展｜GPT機械人粵語伴長者聊天產品歷屆最多

 Planto｜港金融科創AI助銀行營銷提供財務分析信貸決策方案

 晶片大戰｜美擴晶片限制封殺200中企

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe

微軟AI聽3秒錄音扮人聲 推語言模型VALL-E 可合成任何說話

能模仿聲線語氣

蘋果電子書增旁白

支持EJ Tech

Related Posts

Latest News

EJ Tech Video

POPULAR POSTS

成為 EJ Tech 會員

微軟AI聽3秒錄音扮人聲推語言模型VALL-E 可合成任何說話