首页 新闻 政务 图片 要闻 聚焦 县域 专题 文娱 科教 旅游 财经 论坛 招聘 数字报 新媒体 返回
首页 >> 国内新闻 >> 正文

直接生成16秒高清视频 我国自研视频大模型在京发布

来源:新华网 时间:2024-04-27 21:39

  新华社北京4月27日电(记者魏梦佳)只需一段文字指令就能生成一段逼真视频,今年初,文生视频大模型Sora在全球人工智能业内外引发广泛关注。27日,2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。

  记者从会上获悉,这一视频大模型由清华大学联合北京生数科技有限公司共同研发,可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容,不仅能模拟真实物理世界,还拥有丰富想象力。

  清华大学人工智能研究院副院长、生数科技首席科学家朱军说,当前国内视频大模型的生成视频时长大多为4秒左右,Vidu则可实现一次性生成16秒的视频时长。同时,视频画面能保持连贯流畅,随着镜头移动,人物和场景在时间、空间中能保持高一致性。

  在动态性方面,Vidu能生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换,包括能直接生成长镜头、追焦、转场等效果。

  “Vidu能模拟真实物理世界,生成细节复杂且符合物理规律的场景,例如合理的光影效果、细腻的人物表情等,还能创造出具有深度和复杂性的超现实主义内容。”朱军介绍,由于采用“一步到位”的生成方式,视频片段从头到尾连续生成,没有明显的插帧现象。

  此外,Vidu还可生成如熊猫、龙等形象。

  据悉,Vidu的技术突破源于团队在机器学习和多模态大模型方面的长期积累,其核心技术架构由团队早在2022年就提出并持续开展自主研发。“作为一款通用视觉模型,我们相信,Vidu未来能支持生成更加多样化、更长时长的视频内容,探索不同的生成任务,其灵活架构也将兼容更广泛的模态,进一步拓展多模态通用能力的边界。”朱军说。


编辑:trsadmin

上一篇: 权威访谈丨中国是全球知识产权活动的重要贡献者——专访世界知识产权组织中国办事处主任刘华
下一篇: 共青团中央“青年实干家计划”助力青年战略人才培养

咸宁网版权与免责声明:
  ① 凡本网注明"来源:咸宁网"的所有作品,版权均属于咸宁网,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明"来源:咸宁网"。违反上述声明者,本网将追究其相关法律责任。
  ② 凡本网注明"来源:xxx(非咸宁网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
  ③ 如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。

新媒体

  • 打好组合拳,跑出加速度!​咸宁工业经济奋战开
    打好组合拳,跑出加速度!​咸宁工业经济奋战开门红
  • 喜讯!咸宁多了一个“中国天然氧吧”
    喜讯!咸宁多了一个“中国天然氧吧”
  • 投资26亿元!嘉鱼县官桥八组把大学办到家门口
    投资26亿元!嘉鱼县官桥八组把大学办到家门口
  • 咸宁一地入选中国美丽休闲乡村
    咸宁一地入选中国美丽休闲乡村
  • 省级名单揭晓,咸宁这户家庭上榜!
    省级名单揭晓,咸宁这户家庭上榜!