You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

Google新模型|影片生成模型 動作更逼真

By on December 18, 2024

原文刊於信報財經新聞「EJ Tech 創科鬥室

谷歌(Google)人工智能(AI)研究組織DeepMind,周一(16日)發表新版圖像生成模型Imagen 3,透過圖像生成工具ImageFX向全球100多個國家推出。同時,谷歌加推影片生成模型Veo 2,現可生成最多8秒的720p鏡頭,日後將提升至4K解像度,有望跟OpenAI文字轉短片模型Sora對撼。

Whisk可上傳多張圖像作提詞

Veo 2現已於Google實驗室影片生成工具VideoFX試用,明年將擴展到YouTube Shorts及其他產品,輸出時包含一個隱形的SynthID浮水印,有助將之識別為AI生成內容。DeepMind聲稱,Veo 2可更真實地模擬運動、流體動力學(如將咖啡倒入杯中)、光的屬性(如陰影和反射),更能理解「電影攝影的獨特語言」,比其他模型更少幻覺,例如生成多餘的手指。

此外,谷歌在美國地區推出AI創意工具Whisk,結合Imagen 3模型及Gemini視覺理解和描述功能。用戶毋須再輸入冗長文字,而是針對主題(Subject)、場景(Scene)及風格(Style),上傳多張圖像作為提詞。

用戶可對主題、場景及風格,在Whisk上傳多張圖像作提詞。(Google網上圖片)

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們