首页>卫生防疫 > >正文

视频创作不难 虚拟人替你出镜!讯飞星火V2.0多模态升级


(相关资料图)

谁说大模型都是冰冷的代码?其实,它也可以塑造“血肉之躯”。在8月15日讯飞星火认知大模型V2.0升级发布会上,我们见识了虚拟主播介绍世外桃源“桃花潭”的美景,也亲眼目睹了虚拟外教与刘聪院长“狂飙”口语的炫酷。而这些应用场景,都源于星火V2.0在多模态能力上的提升,让视频内容生产与英语学习效率大幅提升。

中金研报曾指出,如果虚拟角色在大模型等技术助力下,能够实现与用户实时智能互动,用户将获得更具真实感的体验,继而激活一个巨大体量的市场。何况,科大讯飞依托星火多模态技术,率先将其用于视频内容生产。根据中国电子信息产业发展研究院发布的数据,预计2023年中国超高清视频产业规模将达到4万亿。同时视频产业是一条涵盖生产、分发、消费等上下游的长链条产业,仅生产环节的市场规模就从2016年的19亿飙升至2022年的3860.7亿元,年均复合增长率达到222.34%。

基于视频生产环节巨大的商业机会,讯飞星火认知大模型以多模态技术实现“虚拟主播”出镜,不但极大提升了视频内容质感和新颖度,还能化身“景点导游”、”室内导览”以及“银行客服”等身份,在旅游、展览、金融等各行各业发挥巨大价值。据悉,科大讯飞虚拟人服务已在各行各业遍地开花,并与新华社、央视动画、中信银行、中国平安等公司建立了合作,在北京冬奥会、成都大学生运动会等世界性体育赛事,讯飞虚拟人技术都进行了精彩呈现。

为了极致简化使用难度,科大讯飞在星火V2.0发布会上,重磅升级了讯飞智作2.0一站式AIGC内容创作平台。用户只要录制一段真人出镜的3-10分钟视频,再将视频放到讯飞智作2.0平台进行训练,即可生成1:1还原的真人虚拟数字分身。同时也可以选择不同风格的配音,让虚拟人具有多情感演绎能力,结合内容本身的喜怒哀乐来控制语气、语调和停顿,让用户看到“有血有肉”的温情演绎。

标签:

相关阅读