yao 发表于 6-4 14:07

“一句话生成视频”AI 爆火

“一句话生成视频”AI 爆火

由清华和智源研究院出品的模型 CogVideo,“一脉相承”于文本-图像生成模型 CogView2,这个系列的 AI 模型只支持中文输入,输出的4秒视频帧数在32张左右。该模型一共有90亿参数,基于预训练文本-图像模型 CogView2 打造,一共分为两个模块。第一部分先基于CogView2,通过文本生成几帧图像,这时候合成视频的帧率还很低;第二部分则会基于双向注意力模型对生成的几帧图像进行插帧,来生成帧率更高的完整视频。
页: [1]
查看完整版本: “一句话生成视频”AI 爆火

博一网
www.bo-yi.com
点击查看放大的二维码
订阅号:jc68com
点击查看放大的二维码
服务号:jc68-1
点击查看放大的二维码
移动端二维码
腾讯微博
腾讯微博
新浪微博
新浪微博