Don't Miss

Google新模型｜影片生成模型動作更逼真

By 信報財經新聞 on December 18, 2024

原文刊於信報財經新聞「EJ Tech 創科鬥室」

谷歌（Google）人工智能（AI）研究組織DeepMind，周一（16日）發表新版圖像生成模型Imagen 3，透過圖像生成工具ImageFX向全球100多個國家推出。同時，谷歌加推影片生成模型Veo 2，現可生成最多8秒的720p鏡頭，日後將提升至4K解像度，有望跟OpenAI文字轉短片模型Sora對撼。

Whisk可上傳多張圖像作提詞

Veo 2現已於Google實驗室影片生成工具VideoFX試用，明年將擴展到YouTube Shorts及其他產品，輸出時包含一個隱形的SynthID浮水印，有助將之識別為AI生成內容。DeepMind聲稱，Veo 2可更真實地模擬運動、流體動力學（如將咖啡倒入杯中）、光的屬性（如陰影和反射），更能理解「電影攝影的獨特語言」，比其他模型更少幻覺，例如生成多餘的手指。

此外，谷歌在美國地區推出AI創意工具Whisk，結合Imagen 3模型及Gemini視覺理解和描述功能。用戶毋須再輸入冗長文字，而是針對主題（Subject）、場景（Scene）及風格（Style），上傳多張圖像作為提詞。

用戶可對主題、場景及風格，在Whisk上傳多張圖像作提詞。（Google網上圖片）

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

DeepMind Gemini Google ImageFX Imagen 3 Veo 2 Whisk

Tweet

Pin It

Related Posts

量子電腦｜谷歌量子專家預計最快5年技術突破

量子電腦｜谷歌量子專家預計最快5年技術突破

與AI共享螢幕｜Gemini Live可「看熒幕」即時答問

與AI共享螢幕｜Gemini Live可「看熒幕」即時答問

AI大戰｜Google推智能健康管理服務

AI大戰｜Google推智能健康管理服務

AGI預測｜DeepMind舵手：AGI最快5年出現

AGI預測｜DeepMind舵手：AGI最快5年出現

Latest News

超級寬頻早着先機（林國誠）
在資訊爆炸、技術快速發展的年代，上網速度已不僅關乎日常娛樂或下載資料，更成為推動人工智能（AI）普及的重要基礎。

Posted March 28, 2025

0

量子電腦｜谷歌量子專家預計最快5年技術突破
谷歌量子人工智能硬件總監凱利（Julian Kelly）接受外媒CNBC訪問時指，現距離技術突破尚有5年時間，料屆時將做到現代電腦無法計算的實際應用。

Posted March 28, 2025

0

JUMPSTARTER｜信標生醫贏阿里環球創業賽
阿里巴巴（09988）創業者基金/滙豐JUMPSTARTER for One Earth環球創業比賽昨天宣布結果，最終由早期癌症檢測液體活檢測試公司Pharus Diagnostics（信標生醫）勝出。

Posted March 28, 2025

0

MCP｜OpenAI採用MCP技術利開發
ChatGPT開發商OpenAI昨天宣布接入開源標準「模型上下文協議」（Model Context Protocol, MCP），進一步推動人工智能（AI）模型與資料來源的整合標準化。

Posted March 28, 2025

0

AI Agent｜微軟推智能代理做研究分析
微軟（Microsoft）於生產力應用程式Microsoft 365 Copilot，推出兩個分別名為Researcher（研究員）及Analyst（分析師）的「深度推理」代理（Agent）。

Posted March 28, 2025

0

吳恩達｜AI應用始能創造價值
人工智能（AI）專家吳恩達近日接受台灣媒體專訪，提到「對於大多數企業而言，真正的價值將存在於應用層面」。

Posted March 28, 2025

0

阿里開源AI模型｜手機適用可圖文影音輸入設男女聲解答
阿里巴巴（09988）昨天在Hugging Face及GitHub等軟件平台，開源首個端對端多模態AI模型Qwen2.5-Omni-7B，可供處理文字、圖像、音訊及視訊在內的輸入，同時產生即時文字及自然語音回應。

Posted March 28, 2025

0

EJ Tech Video

POPULAR POSTS

氛圍編程｜AI代勞零程式碼寫App 用自然語言隨心設計降開發門檻

 理大初創積極貢獻世界科技與創意締造智慧美好未來

 Outlier｜AI訓練員集體起訴數碼血汗工廠表面優差實遭拖糧處理內容不堪入目

 Outlier｜海外聘自由撰稿人以廣東話參與寫作

 科泓科技｜AI聲紋配音保留角色神髓

 本地創科動態｜科大新法減AI量子運算延誤

 AI點餐｜KFC必勝客夥輝達研AI點餐

 ChatGPT新功能｜GPT-4o新增影像生成免費用

 超級寬頻早着先機（林國誠）

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe

Google新模型｜影片生成模型 動作更逼真

Whisk可上傳多張圖像作提詞

支持EJ Tech

Related Posts

Latest News

EJ Tech Video

POPULAR POSTS

成為 EJ Tech 會員

Google新模型｜影片生成模型動作更逼真