• 微信
展开全部内容 ▾

谁是视频之王,国内外AI视频生成模型大对比

作者:AI日报时间:2025-05-09 阅读数:89 +人阅读

早期视频生成多采用GAN架构,算是继承了图像生成的思路:一个生成器不断尝试合成逼真帧,一个判别器则力求区分真实与合成,两者博弈推动整体质量提升。然而,标准GAN在长序列生成中普遍面临帧间运动不连贯和图像抖动等问题。为此,视频生成模型将视频生成过程拆分为“内容”与“运动”两条潜在子空间,分别生成静态语义与动态变化,通过对子空间的独立建模显著改善了运动连贯性和多样性。紧随其后,视频生成模型TGAN提出“双生成器”架构:时间生成器( )产出帧级潜在序列,图像生成器(Image )将这些潜在码映射为图像帧,从而提高了长序列的时序一致性与语义稳定性。

当前位置:首页 >> 技术应用
查看更多