阿里ai建模:阿里巴巴推出AI圖生視頻模型EMO
Bobshop精選店跨境快訊2024-02-297400
阿里巴巴集團(tuán)智能計(jì)算研究院在近日上線了一款新的AI圖片-音頻-視頻模型技術(shù)EMO,官方稱其為“一種富有表現(xiàn)力的音頻驅(qū)動的肖像視頻生成框架”。
目前,EMO框架上線到GitHub中,相關(guān)論文也在arxiv上公開。
據(jù)悉,用戶只需要提供一張照片和一段任意音頻文件,EMO即可生成會說話唱歌的AI視頻,以及實(shí)現(xiàn)無縫對接的動態(tài)小視頻,最長時間可達(dá)1分30秒左右。
表情非常到位,任意語音、任意語速、任意圖像都可以一一對應(yīng)。
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場。
轉(zhuǎn)載請注明,如有侵權(quán),聯(lián)系刪除。