(资料图片仅供参考)
当越发普及的云视频会议,遇见方兴未艾的虚拟数字人,两者将会擦出怎样的火花?
近日,在东莞举行的华为开发者大会2023(Cloud)上,华为云媒体服务产品部部长吕阳明在大会主题演讲中带来盘古基础大模型赋能的MetaStudio数字内容生产线,并展示了数字人在云会议中的应用场景。演讲现场,来自不同地区的参会者通过华为云会议实时连线,并在会中将摄像头画面快速切换到自己的数字人形象。在交流过程中,数字人展现出语音与口型出色的匹配能力,成为会场的一大亮点。
为什么需要数字人形象来替我们开会呢?答案是显而易见的。如今通过云视频会议,可以随时随地进行高效的沟通协作。但这种“即时性”,很多时候也意味着我们的形象,或者身后的背景还不适合出现在镜头前。而使用数字人形象参加会议能够最大程度保护用户隐私,减少入会的形象负担,同时,生动有趣的形象也满足了用户的个性化诉求。此外,在网络研讨会等企业直播和课程录制场景,或者参加耗时较长的会议,数字人可以代替真人主讲人,一直保持一个稳定、专业的形象,更可靠更高质量地完成培训或课件的录制。
此次华为云会议将数字人和视频会议结合,在时延、口型准确性等方面优势明显。用户可以在会议中一键生成自己的数字人形象,也可以在会议前通过上传照片提前生成自己的数字人。通过云端推理和实时驱动,会中的数字人能够根据参会者的语音来驱动对应的口型,时延小于100ms,口型驱动准确率达到95%,主观Mos分大于4.5,做到了音唇同步,唇形精准。值得一提的是,通过算力上云,数字人会议实现了跨端一致体验,用户使用低性能的会议终端,也能拥有优秀的体验。而在安全性方面,华为云会议采取了一系列技术和流程管控方面的措施来规避仿冒、侵权等风险,保证数字人功能被合理使用。
关键词: