“Google的AI視頻創新:Lumiere模型”
Google最近推出了Lumiere AI,這是一種能從自然語言或圖像輸入創造逼真及多樣化視頻的新技術。Lumiere AI是一種時空擴散模型,它通過單次過程合成視頻,這與大多數現有的級聯方法不同。這使得Lumiere AI在時間一致性和運動質量方面表現更佳,並在視頻編輯和生成方面提供更多的靈活性。
Lumiere AI能從文本或圖像輸入生成逼真及風格化的視頻,並根據命令進行編輯。例如,用戶可以提供描述他們想在視頻中看到的內容的文字輸入,例如“公園裡一隻狗追逐球”,Lumiere AI將生成描繪這一場景的視頻。用戶還可以上傳現有的靜態圖像,並添加提示將其轉換為動態視頻。
然而,Lumiere AI仍然有其局限性和挑戰。該模型尚未向公眾開放測試,並且用於訓練它的數據來源尚不清楚。此外,該模型可能面臨技術被錯用以創建虛假或有害視頻的倫理和社會問題。
研究人員承認這些限制和挑戰,並提出了未來改進和擴展Lumiere AI的方向。他們希望他們的工作將激發更多在逼真視頻生成領域的研究和創新。