未来数字人可能免费?人人都需要数字分身

未来数字人可能免费?人人都需要数字分身

风起AIGC

AIGC已经成为我们这个时代新的商业分水岭,引领着内容和创意的“寒武纪大爆发”。无论是前沿科技产业还是整个经济社会格局,都将因此产生巨大的变化。为了让创业者更好地拥抱这个时代,创业黑马将以中国AIGC第一服务平台为己任,通过走访多位业内知名企业家、投资人、专家学者和创业实践者,从软硬件平台视角、投资人视角、行业应用视角等维度进行系列报道,共话大模型时代新机会,展现产业新力量。本篇为第11篇。

本期的分享嘉宾是倒映有声联合创始人何培成。倒映有声作为国内数字人领域的明星企业,是以技术为核心的科技创新公司和无人驱动数字分身技术解决方案提供商。通过自研的神经渲染技术,从语义到声音图片,再到连续帧视频画面,实现了多姿态的数字分成IP生成,最终实现了无人驱动数字分身的行业技术的突破,并且致力于成为全球领先的AI数字人的神经渲染引擎。联合创始人何培成拥有12年企业级的营销经验,也是一个连续创业者投资人,曾任36氪创投公司营销副总裁。在投资、企业服务、战略性营销方面有丰富的实战经验。

在6月15日的黑马AIGC主题系列直播第二季第六期中,嘉宾围绕《基于神经渲染技术的AI数字人如何商业变现》主题进行了深度论述,就基于数字人驱动引擎技术的AIGC场景和应用等问题进行探讨。

以下为本次直播实录整理:

介绍一下AIGC的背景。1956年就有了最早的AI作曲;2007年,纽约大学AI研究员训练专写小说的神经网络,形成6,000万字纯AI小说;2017年对抗式网络生成;2023年生成式AIGC正式发布。

可以看出发展速度越来越快,现在几乎是以月、周、天的频率快速迭代。

AIGC的发展历经从PGC、UGC到AI协助UGC,再到全栈AIGC。

PGC是以单人或多人专业体验来做,主要特征是专业团队制作、门槛较高、周期较长、品质较高、缺乏用户参与;UGC是规模化双向体验,主要特征是提供开放工具、用户可部分参与内容创作、质量方差大,像短视频、游戏等都是代表。目前还没到全栈AIGC的阶段,还是AI协助UGC生产,这个阶段是辅助创作者生产,特征是降低了生产门槛、提升创作效率、实现全民开发,视频、音频、数字人等都是典型AI协作。

全栈AIGC势不可挡,只是没有那么快。它的赛道和市场非常大,应用场景也快速变化。主要有几点,第一内容消费需求增加;第二消费纬度越来越丰富;第三创作者经济实现井喷;第四元宇宙的自增长性非常强,对新的内容生产方式提出要求,推动AIGC顺势发展。

2023年,将有20%的内容被生成式AI所创建,至2025年,预计生成式AI产生的数据将占所有数据的10%。数字化身作为元宇宙入口,将成为虚拟世界发展的最先落地点。2025年,虚拟数字人及相关产业将达到2700亿级。到2030年中国AIGC市场规模预计可达到170亿人民币。

数字虚拟人的行业发展会渗透各行各业,无论金融、通信、政务、医疗教育等行业,都有机会实现数字人交互。我们目前合作了几家游戏厂商,做游戏NPC交互、资讯播报等,可以实现虚拟明星在这个场景当中的变现。

这个行业会受政策支持和人力替代方案的推动,目前虚拟人在2G和IP上大量落地,但市场处于教育阶段。未来,2B客群逐步扩大,每个企业都会拥有自己的数字人和数字分身,创始人可以用自己的数字人做公司品牌、IP影响等。同时虚拟化身下沉到2C,AIGC将成为虚拟数字人大规模生产的底层方式。

政策方面,国家在推动数字人产业与数字经济发展规划。从最早21年12月份,国务院发布的《十四五数字经济发展规划》里面提到的,国家在大力支持人工智能的算法框架等基础技术的自主创新推广应用,包括国信合作、鼓励优先采用安全可信的软件等等。随着赛道发展越来越成熟,应用越来越广阔,国家在大力推动这些政策,辅助行业快速发展。还有相关政策,包括指导用户科学认证、理性使用深层次的人工智能方式、内容版权、数据版权等等,以及数字人是否损害他人形象、名誉、声音、肖像权等等,都是非常重要的环节。

在这个赛道,各个行业怎么应用?

第一,融媒体在AI替代方案存在巨大空间,包括芒果TV的智能虚拟人、快手AI辅助创作等,可以实现数字人24小时直播。它的逻辑是第一抓取模型;第二快速清洗,例如每日经济新闻形成8~10秒甚至10~20秒甚至30秒内的快速资讯,用数字人去生成出,从内容到清洗到编辑,再到审核和播出,形成完整的AIGC闭环。央媒、央广云是我们典型的客户,大力推进融媒体智能化建设,让用户第一时间获取信息。

第二个是AI播报和AI主播应用逐渐渗透,将实现人工成本进一步降低。预计到2025年,融媒体的智能化将突破30亿元规模。

第三,游戏和营销场景可以成为AI驱动的切入点,例如游戏厂商可以配合自研的AI生成语音,随着AI配音的生动化情绪化,以文本驱动的音画视频内容逐渐拓宽场景;在游戏和影视作为配音的高要求领域,目前已经成为AIGC落地的一大场景。

第四,随着技术进步,企业通过与虚拟IP和自制虚拟形象两大路径,实现虚拟场景的营销,带动品牌和企业完成数字化转型。

在应用层面,AIGC作为高效低成本的解决方案,将逐步替代传统路径。例如从人力打磨3D模型到AI自动建模,制作周期可以从几个月压缩到小时为单位。现在有很多创业公司,借助AI生成的所需的建模绑定,到训练模型,再到内容制作,再到渲染能力大大缩短。

倒映有声是国家认定的高新技术企业,最早提出首创无人驱动数字分身整套技术,一直聚焦在AI驱动。除了做数字人之外,这几年也将部分数字人公司技术公司借给第三方公司,让他们去做应用场景开发。

在自研神经渲染引擎方面,我们的团队主要来自于百度最早的技术研究院,有百度地图、小米、喜马拉雅等都做了底层声音技术。ETTS(有感情的语音合成)是我们最早提出的,区别于市面上机械式的声音。

我们在国内的情感声音语料库是最全的,一站式引擎包括整个语音信息可以直接编辑音视频的内容。整个制作成本非常低,可以实现从TTSA(基于文本实时生成语音和视频)到ETTS(有感情的语音合成)到NLU (自然语言理解)的多层旋转,是一体化的驱动。

倒映有声的客户大多是Target B端客户和行业合作方等,尤其政府类客户会支持私有化部署,B端客户一般是按量计费或者按年月整包支持私有云和公有云。针对没有集成能力的客户,会提供可视化数字分身定制,只需要提供10分钟数据就可以完成声音和形象的定制。对于优秀的主播或个人博主,也会帮他打造数字分身入驻我们平台,给第三方的客户去提供服务。

我们的三架马车,第一是核心技术引擎,第二是我们的应用,第三和IP相结合。举个例子,根据世卫组织2023研发部的近视报告,中国青少年近视发病率高达67%,40岁以上人群的干眼症发病率超过30%,眼部疾病成为威胁我国居民身体健康的重要问题之一。处于医疗健康领域的陶勇医生是我们的客户,他是北京朝阳医院的眼科医生教授,自己也在做眼科公益基金。现在他在腾讯的微信视频号上播放量非常大,单条视频都是数字分身来做的。他的团队有十几个人,快速借助数字分身来生产内容。

根据世卫组织在2023年发布,近几年来咖啡文化在天津兴起,据不完全统计,全天津市拥有咖啡馆的数量超过了4500多家,相比于其他城市这样规模数量的咖啡厅算是处于中上水平。可以说城市的经济发展很好,那么融媒体也会很发达,我们也做了很多医疗领域的医生、短视频博主、游戏厂商的智能NPC交互、教育场景的AI数字人老师、券商领域的AI分析师等多个场景合作。

倒映有声帮助魔鬼猫打造“魔鬼猫和创始人”AI+IP的分身数字人,打通品牌方+魔鬼猫+倒映有声合作,引入多方流量支持。用这种技术复活传IP,做新的商业化变现。

数字人究竟帮助客户解决了哪些问题?创造了哪些价值?第一,它并不是一个噱头;第二它毋庸置疑的做到了,大幅提升效率,降低企业用工成本,快速完成大量内容的生成。

处于这样的时代,创业者应该保持好奇、拥抱变化、参与应用。比如我会经常思考,不同行业跟数字人以及AIGC这些生产力工具有没有关系,怎么去应用它?能否为自身的商业带来变化,能否提升效率、降低成本?未来不论是元宇宙或虚拟世界,未来每个组织、甚至每个个体,都将会拥有自己的数字人或者数字分身。AI的革命已经到来,我认为它带来


比丘资源网 » 未来数字人可能免费?人人都需要数字分身

发表回复

提供最优质的资源集合

立即查看 了解详情