Don't Miss
Google新模型|影片生成模型 動作更逼真
By 信報財經新聞 on December 18, 2024
原文刊於信報財經新聞「EJ Tech 創科鬥室」
谷歌(Google)人工智能(AI)研究組織DeepMind,周一(16日)發表新版圖像生成模型Imagen 3,透過圖像生成工具ImageFX向全球100多個國家推出。同時,谷歌加推影片生成模型Veo 2,現可生成最多8秒的720p鏡頭,日後將提升至4K解像度,有望跟OpenAI文字轉短片模型Sora對撼。
Whisk可上傳多張圖像作提詞
Veo 2現已於Google實驗室影片生成工具VideoFX試用,明年將擴展到YouTube Shorts及其他產品,輸出時包含一個隱形的SynthID浮水印,有助將之識別為AI生成內容。DeepMind聲稱,Veo 2可更真實地模擬運動、流體動力學(如將咖啡倒入杯中)、光的屬性(如陰影和反射),更能理解「電影攝影的獨特語言」,比其他模型更少幻覺,例如生成多餘的手指。
此外,谷歌在美國地區推出AI創意工具Whisk,結合Imagen 3模型及Gemini視覺理解和描述功能。用戶毋須再輸入冗長文字,而是針對主題(Subject)、場景(Scene)及風格(Style),上傳多張圖像作為提詞。