Don't Miss
All posts tagged "Text-to-Speech"
-
微軟AI聽3秒錄音扮人聲 推語言模型VALL-E 可合成任何說話
微軟近日針對文本到語音合成技術,發表「神經編解碼器語言模型」VALL-E,只要向AI提供3秒鐘錄音,便可以準確模擬當事人的聲音,甚至模仿語氣及說話情景。
- Posted January 11, 2023