可灵AI确实推出了全新的数字人功能

612 阅读 0 评论 0 点赞

可灵AI确实推出了全新的数字人功能，只需一张图片和一段音频或文字，就能生成表现力不错的数字人视频。这对于很多需要视频内容但制作预算或能力有限的个人和中小企业来说，是个值得了解的工具。

下面是一个简要的表格，帮你快速了解它的核心功能：

方面	详情
核心功能	通过一张角色图片和一段文字或音频，生成数字人视频
视频规格	最高支持 1080p 分辨率、48FPS 帧率，最长 1分钟
核心技术特点	多模态理解与视频生成模型深度融合，实现口型精准同步与情绪、动作的精细控制
支持角色与语言	支持多种角色类型，以及中文、英文、日文、韩文等多语种输出
成本价格	结合会员优惠，最低至 0.12元/秒
适用场景	广告、电商、教育等多种场景
当前状态	已启动公测，正逐步开放使用

技术与体验

可灵AI的数字人功能背后是多模态理解与视频生成模型的深度融合。
这意味着模型不仅能“看懂”你提供的图片（人物的相貌、大致姿态），“听懂”或“读懂”你输入的文字或音频，还能将这些信息融合理解，并生成一个口型、表情、动作都能与之精准匹配的动态视频。

适用场景与成本

这个功能尤其适合以下场景：

在成本方面，依据会员等级和用量，最低可至0.12元/秒，这一定程度上降低了数字人视频的制作门槛。

尝试前的提醒

数字人技术目前仍在快速发展中，实际体验时可能需要关注：

目前该功能已启动公测并在逐步开放中，你可以关注可灵AI的官方网站或官方渠道了解具体的申请试用方式。