展开全部内容 ▾

可灵AI开启视频生成2.0时代全球用户数已突破2200万

作者：AI日报时间：2025-04-16 阅读数：105 +人阅读

本报讯（记者袁传玺）4月15日，可灵AI举行“灵感成真”2.0模型发布会，宣布基座模型再次升级，面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。

数据显示，自去年6月份发布以来，可灵AI已累计完成超20次迭代，截至目前，全球用户规模突破2200万。来自世界各地的超1.5万开发者和企业客户，将可灵的API应用于不同的行业场景中。

据悉，可灵2.0模型在动态质量、语义响应、画面美学等维度，保持全球领先；可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。

快手高级副总裁、社区科学线负责人盖坤介绍，两款模型在团队内部的多项胜负率评测中，均稳居业内第一。例如在文生视频领域，可灵2.0对比谷歌Veo2的胜负比为205%，对比Sora的胜负比达367%，在文字相关性、画面质量、动态质量等维度上显著超越对手。

作为全球首个用户可用的DiT视频生成模型，截至目前，可灵AI全球用户规模已突破2200万，累计生成1.68亿个视频及3.44亿张图片素材。自去年6月上线至今的10个月时间里，可灵AI的月活用户数量增长25倍。

一直以来，可灵AI致力于提升模型基础质量和模型效果，并引入更多创新功能，以满足用户的多样化需求。在本次2.0模型的迭代中，可灵AI正式发布AI视频生成的全新交互理念Multi-modal （MVL），让用户能够结合图像参考、视频片段等多模态信息，将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意，直接高效地传达给AI。

基于MVL理念，可灵AI正式推出多模态编辑功能。“从今天起，大家可以在可灵AI的平台上体验我们的多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式作为输入，生成符合自己想法的创意视频。”盖坤介绍，MMW（多模态描述子）将不只局限于图片和视频，也可以引入其它模态的信息，例如声音、运动轨迹等，让用户实现更加丰富的表达。

可灵AI开启视频生成2.0时代全球用户数已突破2200万