①2024年对于生成式AI行业而言,是充满变革与突破的一年。 ②面向2025年,生成式AI行业又会发生哪些新变化?行业将有哪些看点?我们让几个AI大模型回答了这个问题。
财联社8月25日讯(记者 刘淮西) 一排排手机上全是数字人直播带货,这样的场景在今年愈发多见。数字人代替真人俨然成为了直播电商的新趋势。
据《中国AI数字人市场现状与机会分析2022》报告预计,到2023年中国AI数字人市场规模将达102.4亿元。
本期《元宇宙之约》我们对话了硅基智能创始人兼CEO司马华鹏。硅基智能作为数字人赛道的引领者,在司马华鹏的带领下打造了一系列的理论体系和行动计划,用他自己的话说“我们不追风口,我们造风口”。
他把数字人称为硅基劳动力,是“硅基生命”的一种形态,有别于人类的“碳基生命”。硅基智能计划2025年为全球打造1亿硅基劳动力,司马华鹏还提出人工智能倡导“科技平权”,硅基劳动力将引领服务、教育、医疗等各领域的平权。
“我们有大量的数字虚拟人形象,比如数字教师就可用于教育平权……硅基智能AI数字人技术通过复刻顶尖名师,实现全民皆可享受名师面对面、一对一教学,真正让教育普惠。”
行动方面,今年5月份,硅基智能发布了“炎帝大模型”,可以自动生成短视频、数字人直播、数字永生、数字文娱等方面内容。基于AICG技术,硅基智能和薇娅旗下的谦寻控股合资成立了谦语智能,主打电商领域的数字人直播带货。
司马华鹏还为硅基智能立下了两大目标:2024年成为第一家收入达到100亿的AI创业公司,2025年实现利润达到100亿的AI头部企业。
目前来看,司马华鹏的理论体系和行动计划是成功的。2017年成立至今,硅基智能已经获得腾讯、招银国际、国新央企、松海资本、红杉资本、奇虎中财等9轮融资,估值近10亿美元;同时拥有80余项授权专利,公司的数字人直播已达到每日5万场的常态化规模。
虽然在直播领域做的风生水起,但司马华鹏却表示,直播带货并非数字人的最终应用场景;硅基智能的数字人的最终目标场景是在影视行业,未来将运用AIGC数字人技术,将一部部小说搬上荧屏,可以理解为用AIGC生成电影;在数字永生方面,未来也会是很大的市场。
以下为对话内容:
2025年为全球提供1亿硅基劳动力
你多次提到数字人是硅基生命,该如何理解硅基生命?
司马华鹏:硅基劳动力就是硅基生命的一种形态,它们开源开放、集体进步、没有情绪,可以快速复制,近乎无限供给,一定会成为人类数字化生存与发展的重要支撑力。
硅基生命、硅基劳动力、硅基文明背后有很多核心要素。碳基生命以DNA编码,争夺的核心资源是石油、粮食、土地。而硅基生命以文本编码,以算力、财力、电力为核心的新生命形态。硅基智能的使命是通过AI技术和产品创新,使人工智能成为日常生活的一部分,推动时代进步,帮助人类解决实际问题。
你提出“造出1亿硅基劳动力为人类服务”,这个1亿是如何定量的?目前的数量是多少?如何保证完成这个目标?
司马华鹏:1亿是我们给自己定下的目标,在过去5年多的AI商业化落地探索中,硅基智能已经创造了百万“硅基劳动力”,投入服务了十多个行业,上万家企业。我们在今年1月通过了中国信通院47项基础能力评测,是拥有权威认证的数字人厂商之一。今年3月份,硅基数字人成为国内首个入驻抖音“群峰服务市场”的数字人产品,在抖音的官方后台就能选择我们的数字人服务。4月份抖音官方的直播间也在使用我们的AI数字人产品,这些都是市场和客户筛选之后的选择。
目前我们的产品已经有成熟且广泛的商业化场景落地,服务了包括工商银行、中国银行等多家大型金融机构,移动、电信、联通三大运营商,以及华为云平台、江苏广电等数字产业ToB\ToG 的生态伙伴。
接下来我们扩展市场的速度也会加快,尤其在发布了炎帝大模型后,这个1亿硅基劳动力的目标进程也将缩短。
之前你的创业主要是在安全领域,是如何发现数字人这个商业赛道的?
司马华鹏:在我们创业初期,一位联合创始人经历了母亲的离世,他母亲不会打字,但在微信上留下了很多语音、照片和视频,他问我有没有办法把他母亲克隆出来,还想再见到母亲的音容笑貌。这让我下定决心要想办法来完成他的心愿,萌发了朝数字人方向创业的想法。这就是硅基智能做数字人的起源。
有了这次经历,我们深感人类的寿命都是有限的,但克隆出来的硅基生命是无限的,能无限的去传递思想和知识,这就更加坚定了我们的创业之路,开辟了数字人的新赛道。
硅基智能提出了很多形而上的名词,比如“科技平权”等,为何要把创业上升到哲学理论的高度?
司马华鹏:在工业革命的上半场,是通过科技带动机器生产,进而不断发展生产力,这样一来普通人也可以接触到、购买到过去贵族专用的各种商品了。
从这个角度说来,我们现在就处于下半场,比如很常见的服务平权,很多行业目前还很难实现。我们始终坚信,科技平权是人类文明发展中很重要的一个诉求,所以一直致力于科技平权下的知识平权。
我们有大量的数字人形象,比如数字教师就可用于教育平权,教育资源普遍存在分配不均的情况,顶尖名师和优质教育资源往往只能服务于社会极少部分人群,不同城市之间,不同阶层间教育资源严重不均。硅基智能通过AIGC数字人技术复刻顶尖名师,实现全民皆可享受名师面对面、一对一教学,真正让教育普惠。
再比如数字医生可用于医疗平权,我国优质医生资源集中于大城市、大医院,边远基层地区的名医资源不足。硅基智能将名医数字化、先进医疗知识数字化,在医疗知识普及、远程问诊、虚拟私人医生等领域产生积极影响,促进各区域各级医疗机构同质化水平的不断提升,让优质医疗惠及百姓。
直播带货并非数字人最终落地应用
今年数字人直播带货为什么能够火爆?它会是一个终极的商业模式吗?
司马华鹏:数字人直播能够火爆的根本原因在于,AI数字人已经有能力为直播行业带来90%以上的降本增效,省去了拍摄和剪辑,无需服装、道具、灯光等设备,实现直播全流程自动化。同时大大降低了人力成本,也不用再担心主播流动率高,不稳定了,数字人主播不会疲倦,可以超长时间连续直播,也不存在离职风险。
在炎帝大模型的加持下,硅基智能的AIGC数字人技术已经完成更新迭代,研发出支持电商直播的数字人,这些数字人可以根据脚本调整情绪,可以根据现场情况调整策略,目前硅基智能已经达到了日常直播5万场的常态化状态,到2025年我们的目标是为全球提供1亿硅基劳动力。
在当下直播是最能体现硅基劳动力价值的应用场景之一,但远非数字人产品商业落地的终点。我们已经跟40多个行业几万家企业合作,在各个领域已经有非常成熟的应用场景,比如直播带货、知识创作、金融服务、乡村振兴、本地生活直播、电商直播、短视频生成,接下来还会大力布局电影电视剧领域,做更多内容生成和数字永生的相关业务。
在未来,数字人心理咨询师、数字人医生、数字人老年陪伴官、数字演员等许许多多的职业场景都在等待数字人劳动力去填补,几乎所有的商业场景都将可能被颠覆。
刚开始你们如何拓展数字人直播的客户,如何让大家普遍接受这种虚拟形象?
司马华鹏:最开始非常艰难,我们把各行业所有大V联系了一遍,免费给他们做数字分身,但吃了非常多的闭门羹。但现在很多大V回头来找我们,这说明数字人这个新东西从出生到今天终于被大家接受认可了。
整个过程有三个时间节点。第一个节点就是2022年10月底,刘润的年度演讲《进化的力量》,重磅推荐了我们的数字人,他表示这项技术在未来会很有价值,并且大方的分享他自己的短视频口播内容已经“不是本人”。
第二个节点就是,疫情放开后抖音在今年年初开放了本地生活中的数字人直播,这就给整个行业撕开了一道口子。
第三个节点就是ChatGPT的火爆,让大家意识到大模型时代的到来,使得整个AI被大家所信任。
除了直播带货外,公司在其他数字人应用场景上做了哪些准备?
司马华鹏:研发方面,实际上我们有两个团队,分别做3D虚拟形象和2D超写实数字人,我们也有自己的3D虚拟偶像,叫爱夏。但是3D虚拟形象制作成本十分昂贵,几十万甚至上百万做一个。
在创业过程中,我们发现随着数据积累越多,2D超写实数字人的制作成本和时间逐步下降,原先我们克隆一个数字人需要30分钟,后来降到10分钟,又降到5分钟、1分钟,甚至现在我们有一张照片就可以很快把形象克隆出来。成本下降也非常厉害,现在我们克隆一个数字人已经降到几千块钱,把你的声音和形象数据发给我们就可以了。这其实是一个老百姓能接受的价格和时间。所以2D超写实数字人是我们率先发力的点,比如推广到直播带货行业等。
业务方面,我们有四个方向,分别是知识生产、电商直播、数字永生和数字文娱。
数字文娱方向,我们现在在用AI拍短剧、拍电影,我们还和另外一个公司合作做明星偶像的数字分身,比如王一博的数字分身,可以和粉丝之间建立起智能情感连接。
数字孪生方向,全国去年大概接近1000万人去世,很多家属都希望保留他们的数字形象,可以跟后代继续保持情感连接。数字孪生业务我们还在等待一个爆点,比如我们可以免费帮失独家庭克隆他们小孩的数字分身,比如我们把抗战老英雄的数字分身克隆出来,有很多类似的点都可能会引爆行业。
从商业角度来说,数字孪生业务的成本还很高,克隆成本没达到老百姓的市场接受价格,所以还需等待时日。
两个百亿目标
请介绍一下炎帝大模型,它和其他大模型主要区别在哪里?
司马华鹏:不同于传统的ChatGPT类通用大模型,炎帝大模型是一个多模态的行业脑。我们核心的赛道是NLP,跟ChatGPT在一个赛道里面。我们在NLP的核心能力上,在知识的表达层,在这一层我们是领跑者,而ChatGPT在知识的创作和推理上是领跑者。打一个很好的比喻,ChatGPT是莫言,能写小说,炎帝大模型是姜文、巩俐,能表演。
每个行业都需要拥有自己的大模型,而大模型的发展趋势正朝着行业脑、多模态和中交互的方向发展。
传统大模型是基于公有领域的知识进行训练,行业脑则是基于特定行业的私有领域知识训练。事实上,通用大模型的竞争早已结束,现已进入了行业大模型竞争的阶段。
多模态是指大模型同时兼备生成多种内容形式的能力,包括文本生成、声音生成、图像/视频生成。用户只需告诉炎帝大模型直播间的要求,一个数字人的直播间就能迅速搭建完成。主播、中控和运营的角色都由AI扮演,并且可以自动获取竞争对手直播间内的信息。当直播间观众数量下降时,数字人将执行各种选择器、任务器和反馈器的任务,数字人主播对应生成一系列响应,比如生成降价促销的直播话术等。
中交互是指一对多的交互方式,与资源密集型的一对一强交互和短视频的弱交互不同;一对多的中交互生成的内容被越多的用户消费时,总体成本并没有变化,但交互所带来的产出更高,整体效率即大大的被提升。
你们和谦寻控股合作成立合资公司,分别占股多少?双方为何要合作?
司马华鹏:杭州谦语智能科技有限公司,硅基智能和谦寻控股各占股50%,我们出AIGC技术,他们出运营能力,希望一起把数字人直播带货做大做强。
做好数字人直播带货要有六个构成要素:技术、运营、供应链、IP、金融和账号。我们现在是每个要素上都在找盟友,谦寻控股是我们十分优秀的合作方之一。
打个比方,我们是技术能力强,能造车,但是你要开好车需要去驾校培训,你想跑出租需要找到滴滴这样的公司。
目前硅基智能处于什么发展阶段,有多少员工?营收情况如何?
司马华鹏:目前我们员工有500人左右。我们除了是一个AI科技公司外,也有100多个销售,有300到500家代理商,希望在数字人商业模式爆发的时候,能够迅速承接市场需求。
公司目前营收数据不方便对外透露,但我为硅基智能立下了两大目标:2024年成为第一家收入达到100亿的AI创业公司,2025年实现利润达到100亿的AI头部企业。