商汤科技Vimi：首个“可控”人物视频生成大模型来了（含申请通道）

「少问自己为什么

多问别人凭什么」

这自我反思的独到观点，

可不是我说的，

而是…Vimi 的兵马俑表情包文案…

这不，这两天，2024 世界人工智能大会，在上海举办的如火如荼。开馆第 1 天，商汤科技就推出了面向 C 端的，全球首个可控的人物类 AI 视频生成产品-Vimi相机！

To C ? 可控？听起来很厉害的样子，

快来跟着我一起扒一扒：

Vimi是商汤科技推出的可控人物视频生成大模型，专为视频创作者设计。通过动作视频、动画、声音和文字等多种驱动元素，Vimi能够生成与目标动作一致的人物视频。它不仅能精准控制人物表情和肢体动作，还能生成合理的头发、服饰和背景，支持光影变化。Vimi突破了传统AI视频生成的限制，能够稳定生成分钟级的单镜头人物视频，画面效果自然流畅。

Vimi

Vimi是商汤科技推出的可控人物视频生成大模型，通过动作视频、动画、声音和文字等多种驱动元素，Vimi能够生成与目标动作一致的人物视频。它不仅能精准控制人物表情和肢体动作，还能生成合理的头发、服饰和背景，支持光影变化。Vimi突破了传统AI视频生成的限制，能够稳定生成分钟级的单镜头人物视频，画面效果自然流畅。无论是娱乐创作还是专业视频制作，Vimi都是您的理想选择。

概述

首个“可控”人物视频生成大模型面向C端用户，支持多种娱乐互动场景基于商汤日日新大模型构建

主要功能

生成长达1分钟的单镜头人物类视频画面效果稳定，无劣化或失真支持聊天、唱歌、舞动等多样化娱乐互动场景

技术特点

通过1张照片，生成目标动作一致的人物视频实现精准的人物表情控制和自然肢体变化控制支持动作视频、动画、声音、文字等元素驱动

应用场景

广告、电影制作等行业提供便捷服务

行业认可

入选WAIC展会最高荣誉“镇馆之宝”

来看看Vimi官方视频效果如何：

了解了下官方介绍, Vimi主要有两大功能：

1.一张照片生成写真视频

就目前市面技术而言, 让照片动起来，

已经不再是什么新鲜事儿了

但是，Kimi官方表示, 它能持续生成，

效果相对稳定的，一分钟单镜头人物视频！

并且能精细化控制表情和动作，

这，就比较厉害了!

来看看写真的效果，

Kimi能通过动作、视频、动画、声音、文字等

多种驱动元素，来驱动人物类照片

能控制人物的表情和肢体动作，

生成合理的头发服饰背景和光影的变化

2.个性动态表情包

提供一张简单的自拍照，

它就能整出一堆有趣的表情包，

唱歌、跳舞、说晚安！都不在话下，

盲猜，这个性化的定制，能引爆年轻人的刚需..

让自己喜欢的名人动起来，也是可以的…

实操体验

来，打开下面的链接：

https://vme-int.softsugar.com/questionnaire/

你会看到这行文字：Vimi产品体验申请

进入填写申请信息，等待短信通知，你还等什么？

犹豫，就会像这几天的可灵，跟几十万人一起排队！

可灵大模型

可灵大模型是快手AI团队自研的一款视频生成大模型，采用类似Sora的技术路线，能够生成符合物理规律的大幅度运动视频，模拟真实世界的特性。支持生成长达2分钟的30fps的超长视频，分辨率高达1080p，且支持多种宽高比。2024年6月，快手正式推出了可灵大模型，并在快影App开放邀测体验。

AI贴吧网

商汤科技Vimi：首个“可控”人物视频生成大模型来了（含申请通道）

概述

主要功能

技术特点

应用场景

行业认可

发表回复取消回复

概述

主要功能

技术特点

应用场景

行业认可

发表回复 取消回复

发表回复取消回复