生数科技朱军:视频模型下一步是高可控,中国视频大模型引领全球
- 0次浏览 发布时间:2025-03-31 15:50:00
“在大语言模型领域,DeepSeek在提升效率上有独特的认知,而效率的优化的理念在视频模型领域已经扎根,因此大概率不会出现这种一下子‘遥遥领先’的模型,我们期待视频模型更可控、更好用、每个人都能用到。”清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军告诉新京报贝壳财经记者。
3月27日至31日,2025中关村论坛年会举行。在去年的中关村论坛上,朱军发布了对标Sora的首个国产自研视频大模型Vidu,受到了广泛关注。而2025中关村论坛上,朱军在主题演讲中发布了业内首个高可控视频大模型Vidu Q1,并在会后接受了新京报贝壳财经记者的采访。

朱军在2025中关村论坛上发表演讲 新京报贝壳财经记者 罗亦丹 摄
Q代表“质量” 高可控背后是基础模型能力提升
本次回归中关村论坛,朱军带来了更为强大的 Vidu Q1模型,他告诉记者,Q代表“Quality(质量)”,即高质量、高可控,这本身实际上是基础模型能力的提升,“目前阶段投入基础模型的收益还是最大的,加上基础模型之上的一些技术创新,从后端可以更好地实现高一致性和高可控的结果。”
贝壳财经记者通过视频演示发现,Vidu Q1模型在位置、运动布局、音频等多个领域实现了可控升级。以多主体细节可控为例,在语义指令的基础上,通过融入参考图的视觉指令,Vidu Q1支持对所有动作行为(出场、退场、坐立姿态、行动路线)进行精准调整,从而用更低的抽卡率实现更高质量的可控生成。
朱军介绍,Vidu在商业化方面一直是C端与B端并重,不过目前C端由于面向全球,增长速度很快,因此视频模型的技术突破可以更好地服务广大用户。而B端则面向国内市场,目前已经看到了对MaaS(模型即服务)的广泛需求,今年也会继续同步推进两种业务。
“去年,Vidu在中关村论坛开幕前一周时实现了技术突破,因此也被邀请来到这样一个高端平台上进行展示。而今年是论坛一周年,也是Vidu大模型的一周年,因此也想在这里传达一些进展。”朱军告诉新京报贝壳财经记者。
视频模型最重要的是效率 中国视频模型引领全球
朱军表示,目前大语言模型领域有能力非常领先的头部公司,但视频模型领域完全不同,“现在可以认为中国的视频模型在全球,于很多方面是处于引领地位的。”
“另外,视频模型的商业化路径会更快,大家对视频模型的消费和需求非常广阔,所以视频和文字的赛道不一样。目前头部的视频大模型各自都有特色、差异化的商业化的路径,并没有像语言模型处于红海状态。”朱军说。
在他看来,视频大模型的发展,更重要的还要看团队能否持续创新,行业上公司的密度还比较稀疏,大概率不会出现一家独大的情况。
另外,新京报贝壳财经记者注意到,今年以来DeepSeek引领起了大模型的开源浪潮,阿里云也推出了开源版本的视频模型。对此,朱军回应称,DeepSeek最打动用户的点还是效果好、效率高,“我们认为从视频模型的角度来说,用户最关心的还是质量和效率。”
记者联系邮箱:luoyidan@xjbnews.com
新京报贝壳财经记者 罗亦丹
编辑 寇德娜
校对 王心
相关文章
-
可灵AI与Lovart达成深度合作 助力构建创意视频生产新路径
文/杭莹近日,可灵AI与Lovart达成深度合作,Lovart通过调用可灵API,将其作为核心引擎嵌入视频生成流程,支持在单次任务中自动生成超过一分钟的完整视频内容,可覆盖广告营销、Vlog等多类场景,显著提升内容创作效率。据悉,可灵AI目前已为超过1万家企业客户提供API服务,广泛应用于广告营销、
2025-06-16 07:21:00 -
浙江一婚席吃掉50万,主家嫌太贵及采购曝光让自己丢脸不结款,律师:恶意拖欠可起诉
据浙江嘉兴电视台《小新说事》,王师傅在桐乡宏源路上做猪肉生意,跟菜场的老板们都很熟悉,4月份有个钱老板找来,说女儿结婚,叫王师傅去菜场采办各种食材。王师傅说,这钱老板女儿的酒席排场非常大,吃喝三天,一共搞了多达252桌,每桌28道菜,需要的蔬菜、海鲜、肉类羊肉、调料等等,都是厨师写的菜单,他再根据菜
2025-06-15 15:09:00 -
央视直播的第一场“苏超”,齐鲁壹点记者带你看看有多火
齐鲁晚报·齐鲁壹点记者 胡玲玲 郭辰昊 江苏报道这个周末,“苏超”重燃战火。6月14日,齐鲁晚报·齐鲁壹点记者来到淮安市体育中心体育场,现场直击淮安队主场对阵南京队的比赛,这是央视频拿下“苏超”转播权后进行的首场直播比赛之一。最终赛果定格在1-1,双方战平。“麻辣鹅”大战“盐水鸭”鹅鸭比翼,谁能向天
2025-06-14 17:55:00 -
夸克发布高考志愿大模型,可输出完整高考志愿报告
【夸克发布高考志愿大模型,可输出完整高考志愿报告】6月12日,夸克发布2025年高考志愿填报产品,推出“高考深度搜索”“志愿报告”“智能选志愿”三大核心功能。产品依托于国内自研高考志愿大模型和专业的高考知识库,实现了从复杂问题询问到志愿报告输出的完整辅助决策流程。其中,“志愿报告”是可以生成完整报告
2025-06-12 12:39:00 -
6月11日(星期三)CCTV11节目预告
上午(00:00 - 12:00)00:09梦中的那片海第21集未开始往期视频01:00典藏-2025-65未开始往期视频01:31再见未开始06:06CCTV空中剧院-2025-87地方戏版 戏韵满堂未开始往期视频07:22宝贝亮相吧-2025-21未开始08:37典藏-2025-65未开始往期视
2025-06-11 03:47:00