AI资讯

音频同步与视频编辑!腾讯混元开源一致性视频生成工具HunyuanCustom

2025-05-09

腾讯开源的一致性视频生成工具 “HunyuanCustom”,该模型不仅能生成生动的视频内容,还能实现音频与口型的同步。这一创新技术的发布,标志着在深度伪造视频领域的一次重要进步。

一图生成,深度伪造不再遥远

HunyuanCustom 的最大亮点在于用户只需提供一张图像,就能创造出深度伪造风格的视频。这一功能可以简化视频制作流程,用户不再需要多张图片作为参考,极大地提升了视频内容生成的便利性。

HunyuanCustom 不仅限于简单的视频生成。该模型还具备处理多种场景的能力,包括单一角色的模拟和虚拟试穿。用户可以将单个角色与不同的物体结合,创造出丰富多样的场景。这一特性将为游戏开发、虚拟试衣等领域带来新的可能性。

QQ_1746760828673.png

音频同步,提升沉浸感

在音频方面,HunyuanCustom 利用了复杂的 LatentSync 系统,实现了音频与口型的精准同步。这一技术的实现,使得视频中的角色在说话时,其嘴部动作与发出的声音完美匹配,从而提升了观众的沉浸感和真实性。

虽然目前尚未推出英文示例,但已有的展示效果表明,该技术的表现相当优秀,未来有望在更多语言中得到应用。

视频编辑,拓展应用边界

HunyuanCustom 还具备强大的视频编辑功能。通过视频到视频(V2V)编辑,用户可以智能地替换现有视频中的部分内容,仅需一张参考图像即可完成。这一功能为用户提供了更多创意空间,使得视频编辑过程更加简便高效。

在演示中,可以看到系统如何通过遮罩技术,仅对目标对象进行替换,而不影响周围环境,达到了良好的整合效果。这一特性将吸引大量创作者探索其在内容制作中的应用。

HunyuanCustom 的推出,为深度伪造技术的应用开辟了新的视野。尽管在某些方面仍有提升空间,但其独特的功能和应用潜力无疑将推动视频制作的创新。随着这一技术的进一步发展,我们期待在创意产业中见证更多精彩的作品。

官网:https://aivideo.hunyuan.tencent.com/