首頁 > 環球財智 > 正文
直接生成16秒高清視頻 我國自研視頻大模型在京發佈
2024-04-28 10:20:02來源:新華網責編:田蜜

  新華社北京4月27日電:只需一段文字指令就能生成一段逼真視頻,今年初,文生視頻大模型Sora在全球人工智能業內外引發廣泛關注。27日,2024中關村論壇年會上首次發佈我國自研的具“長時長、高一致性、高動態性”特點的文生視頻大模型Vidu。

  記者從會上獲悉,這一視頻大模型由清華大學聯合北京生數科技有限公司共同研發,可根據文本描述直接生成長達16秒、解析度高達1080P的高清視頻內容,不僅能模擬真實物理世界,還擁有豐富想像力。

  清華大學人工智能研究院副院長、生數科技首席科學家朱軍説,當前國內視頻大模型的生成視頻時長大多為4秒左右,Vidu則可實現一次性生成16秒的視頻時長。同時,視頻畫面能保持連貫流暢,隨著鏡頭移動,人物和場景在時間、空間中能保持高一致性。

  在動態性方面,Vidu能生成複雜的動態鏡頭,不再局限于簡單的推、拉、移等固定鏡頭,而是能在一段畫面裏實現遠景、近景、中景、特寫等不同鏡頭的切換,包括能直接生成長鏡頭、追焦、轉場等效果。

  “Vidu能模擬真實物理世界,生成細節複雜且符合物理規律的場景,例如合理的光影效果、細膩的人物表情等,還能創造出具有深度和複雜性的超現實主義內容。”朱軍介紹,由於採用“一步到位”的生成方式,視頻片段從頭到尾連續生成,沒有明顯的插幀現象。

  此外,Vidu還可生成如熊貓、龍等形象。

  據悉,Vidu的技術突破源於團隊在機器學習和多模態大模型方面的長期積累,其核心技術架構由團隊早在2022年就提出並持續開展自主研發。“作為一款通用視覺模型,我們相信,Vidu未來能支持生成更加多樣化、更長時長的視頻內容,探索不同的生成任務,其靈活架構也將相容更廣泛的模態,進一步拓展多模態通用能力的邊界。”朱軍説。(記者 魏夢佳)

最新推薦
新聞
文娛
體育
環創
城市
國際在線版權與信息産品內容銷售的聲明

1、“國際在線”由中國國際廣播電臺主辦。經中國國際廣播電臺授權,國廣國際在線網絡(北京)有限公司獨家負責“國際在線”網站的市場經營。

2、凡本網註明“來源:國際在線”的所有信息內容,未經書面授權,任何單位及個人不得轉載、摘編、複製或利用其他方式使用。

3、“國際在線”自有版權信息(包括但不限于“國際在線專稿”、“國際在線消息”、“國際在線XX消息”“國際在線報道”“國際在線XX報道”等信息內容,但明確標注為第三方版權的內容除外)均由國廣國際在線網絡(北京)有限公司統一管理和銷售。

已取得國廣國際在線網絡(北京)有限公司使用授權的被授權人,應嚴格在授權範圍內使用,不得超範圍使用,使用時應註明“來源:國際在線”。違反上述聲明者,本網將追究其相關法律責任。

任何未與國廣國際在線網絡(北京)有限公司簽訂相關協議或未取得授權書的公司、媒體、網站和個人均無權銷售、使用“國際在線”網站的自有版權信息産品。否則,國廣國際在線網絡(北京)有限公司將採取法律手段維護合法權益,因此産生的損失及為此所花費的全部費用(包括但不限于律師費、訴訟費、差旅費、公證費等)全部由侵權方承擔。

4、凡本網註明“來源:XXX(非國際在線)”的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,豐富網絡文化,此類稿件並不代表本網贊同其觀點和對其真實性負責。

5、如因作品內容、版權和其他問題需要與本網聯繫的,請在該事由發生之日起30日內進行。