①国网内部整合,国电南瑞间接控股股东国网电科院拟变为直接控股股东; ②国家电网不仅仍是国电南瑞的最终控股股东,也是其第一大客户。
《安安访谈录》是界面财联社执行总裁徐安安出品的一档深度访谈类栏目。从投资角度对话1000位行业领军人物,覆盖传媒创新、VC/PE、信息服务、金融科技、交易体系、战略新兴等方向。
科创板日报《连线创始人/CEO》是由《安安访谈录》出品的针对创新创业型未上市企业创始人的访谈栏目,以企业创始人/CEO的访谈为一手信源,让成长中的创业公司走入公众和市场视野,并发掘最新技术和产业趋势。
本期访谈人物:
天壤创始人兼首席执行官 薛贵荣
“在一些基础工作被AI替代的同时,也会衍生诸如人工智能培训师等新兴行业。当前中国版ChatGPT要实现追赶,最大的挑战在于追赶时间差。”
▍个人介绍
天壤创始人兼首席执行官,人工智能与大数据领域科学家,国家科技部云计算专家组成员,原阿里妈妈首席数据科学家。首批全国优秀博士论文奖获得者,国内第一位在全球搜索领域顶级会议ACM SIGIR上发表论文的科学家,全球迁移学习领域开创者和深度强化学习顶尖专家。薛贵荣博士曾在世界顶级会议NIPS、ICML、SIGKDD、SIGIR、WWW与世界顶级刊物ACM TOIS、ACM TIST等发表论文70余篇,拥有专利十余项,论文引用达9000+。
▍第一标签
国内深度强化学习领域开拓者
▍公司简介
天壤成立于2016年,是专注于通用智能研究(AGI)的创新企业,致力于解决人工智能的可用性和易用性问题,实现以最小成本、最快速度赋能业务场景,让智能像水电煤一样便捷。
目前,已经广泛地服务于城市运行、交通治理、金融保险、商业零售、生物科技等场景。希望为人类社会的可持续发展带来突破性进展,让社会更便捷、更聪明、更智慧。
大模型近几年持续火热,薛贵荣认为,ChatGPT能够脱颖而出的根本原因是强化学习技术的创新和高质量数据积累的叠加效应。
“先预训练一个大模型,然后用强化学习去‘教导’模型,让模型生产出足够多的新数据,进行‘自学习’。就像一个小孩对应一个教导老师,不仅学习知识,还学习方法,解决问题的能力就可以持续提升。这才能代表真正的人工智能。”
薛贵荣指出,现如今的所有界面可能都会被重构,最终将变成人类通过AI和数字世界进行自然语言交流,可以直接向机器发送指令,解决问题。
在2016年创立天壤之前,薛贵荣曾就职于阿里巴巴,先后任职阿里妈妈大数据中心负责人、阿里妈妈首席数据科学家等职务,负责研发了阿里搜索引擎等平台。
作为上海交通大学计算机系副教授,薛贵荣的研究方向主要为机器学习、信息检索、互联网营销、大规模数据分析和分布式计算,在世界顶级会议NIPS等发表论文70余篇,拥有专利十余项。
谈及当下ChatGPT所引领的人工智能热潮,薛贵荣认为未来两年,会看到AI应用的极度爆发,人工智能技术将广泛、深刻地改变各行各业,并将带来人机交互方式的巨大变革,所有的应用和平台要基于ChatGPT框架重新开发。
“在一些基础工作被AI替代的同时,也会衍生诸如人工智能培训师等新兴行业。当前中国版ChatGPT要实现追赶,最大的挑战在于追赶时间差。”薛贵荣说。
01
——————————
做中国版ChatGPT 算法创新和高质量的数据缺一不可
对于ChatGPT热潮背后的推动力,薛贵荣认为,首先是算力的提升,其次是算法的跃迁。Transformer把自然语言模型的上下文之间关系的学习能力,提升了新的台阶。
“过去基于卷积的神经网络依赖大量数据,通过一层一层网络的学习,掌握如何把一个概念与另一个概念相关联。但这种方式传递过程中往往容易产生信息的丢失。Transformer模型出现后,针对某两个概念,机器可以更迅速、准确地建立关系的连接。这种方式更接近于我们人类解决问题的方式,可以考虑更复杂的事情。
同时,ChatGPT引入了强化学习机制,加速推动了通用人工智能的发展。
“在过去,标数据是一个很困难的事儿,特别是标这么大的规模。如今的ChatGPT基于大模型学到的知识,并通过人类的反馈进行训练优化。通过人的指导,不断告诉AI,这么回答是错的、这么回答是很有条理的。让AI尽可能地掌握与人类进行沟通的‘技能’,以保证AI能够像人类一样思考和回答问题,并和人类保持相似的价值观。”
随着ChatGPT带动人工智能产业成长,引起新一轮全球科技竞赛。中国的ChatGPT究竟该如何追赶?薛贵荣表示,国内厂商要不惜代价地迎头追赶,现在最重要的是追赶时间差。ChatGPT的智能化程度指数级增长且与日俱增。其最终的迭代信息差和发展高度决定了我国与国外的平均智商差。
“大模型近几年持续火热,ChatGPT能够脱颖而出的根本原因是强化学习技术的创新和高质量数据积累的叠加效应。第一,只有基于深度强化学习体系,模型才会有更好的反馈机制和价值判断标准,才能掌握更多优质数据和答案,才更逼近人类智能。第二,只有对语料数据的抓取足够充分,实现规模、深度、广度的全覆盖,才能提升高质量数据密度,训练出好的大模型。要实现中国的ChatGPT大模型,这两点缺一不可,而国内厂商目前在这两方面的探索还有较大提升空间。”
在模型方面,自然语言处理的两大路线分别为谷歌BERT和OpenAI的GPT系列,两者一直处于竞争状态。此前,BERT模型的表现更好,也导致国内企业大多追随的是谷歌BERT路线,国内的模型面临技术路线的调整。
02
——————————
每个人都将拥有AI大脑
作为国家科技部云计算专家组成员,薛贵荣是国内第一位在全球搜索领域顶级会议ACM SIGIR上发表论文的科学家。之后,也曾加入阿里巴巴,负责研发阿里全网搜索引擎。
2016年离开阿里创立天壤后,薛贵荣坚定了通用人工智能的探索道路。“让每个人都有一个AI大脑,是我们一直以来所坚持的方向,也是我们最大的目标。”
迄今,薛贵荣带领团队先后在AI围棋、交通、生物科技等领域开展探索,研发了AI围棋TRGo、蛋白质结构预测系统TRFold,以及国内首个城市级交通调度系统TRTraffic、蛋白质设计TRDesign等多个大模型。
薛贵荣向《科创板日报》记者坦言,在创业过程中曾面临中文版ChatGPT一样的难题,即有标注的数据量不够。如果没有高质量的数据,很难把技术做深。为此,天壤很早地就在实践中引入了基于强化学习的数据增强机制。
“我们做强化学习在国内是非常早的。2016年我们做AI围棋的时候,用两个机器人对抗的方法来生成大量的棋谱数据,并通过优胜劣汰的方式迭代优化模型。那时候我们就发现用强化学习对模型的效果提升作用非常巨大,这个发现对当时的我们来说非常震撼,也证明我们找对了路子。”
薛贵荣认为,生成高质量数据的能力是天壤的优势。
“后来这套方法论我们在智能交通领域进行应用。路上的信号灯基本上都是靠人力调控,调地好坏没有很客观的评价标准。同时信号灯又涉及上下游路口联调,流量24小时都在动态变化,要获取训练数据非常复杂。我们搭建交通模拟器来生成数据,通过强化学习不断的进行模型的学习和数据生成,从而获得高质量的交通信号灯调控模型。
薛贵荣透露,在做蛋白质研究时,同样采用了强化学习来进行数据增强。“先用模型预测结果,然后再把预测好的数据投喂给模型训练,用数据增强的方式让模型质量有了大幅度的提升。经过几个大的复杂场景的实践,我们研究大模型训练的路线越来越通用,也形成了统一的思路。”
“先预训练一个大模型,然后用强化学习去‘教导’模型,让模型生产出足够多的新数据,进行‘自学习’。就像一个小孩对应一个教导老师,不仅学习知识,还学习方法,解决问题的能力就可以持续提升。这才能代表真正的人工智能。”薛贵荣总结。
从科学家变成创业者,薛贵荣直言这条路上确实荆棘重重。
“创业的关键,还是要有核心技术,并且靠核心技术能够带动商业。我觉得在国内,创业的门槛要足够高,才能有机会。”
03
——————————
“这两年AI应用会极度爆发,冲击所有行业”
对未来人工智能的发展,薛贵荣表达了乐观的态度。
“这两年AI应用会爆发,而且会极度爆发。我觉得对所有的行业都会有冲击。首当其冲是客服会被颠覆,普通的律师、财务、人力等工作可能也会被替代。以后,人类要学会和机器一起工作,这是竞争力所在。机器将承担绝大部分基础性的工作,人类主要做好‘指导’的角色,并把精力投入到更有创造性的事情上。”
在替代一些基础工作的同时,AI也将催生新的行业,比如人工智能培训师。
“AI生产内容的组织方式很重要。比如,让AI提取财报的核心数据,需要依赖人类给他指令,告诉它重点是什么。将来会'提问题'是一项很重要的能力。你问的问题越有挑战,越能持续帮助AI训练,升级AI应用,AI回答问题也将更加准确、全面。这在未来几年会是一个很大的行业。”
ChatGPT所引领的这波人工智能热潮,也会带来人机交互方式的巨大变革,所有的应用和平台要基于ChatGPT框架重新开发。
“ChatGPT的成功不仅仅是新一代聊天机器人的突破,更是人工智能对整个信息产业带来的革命,将带来全要素生产率的极速提升。基于ChatGPT的全新的交互接口,所有的应用、平台、软件将全部重新开发,代替以往Windows视窗作业系统。”
薛贵荣进一步解释,“现如今的所有界面可能都会被重构,最终将变成人类通过AI和数字世界进行自然语言交流。可以直接向机器发送指令,解决问题。人和数字世界的通道彻底被打通,AI将变得更加实用。你可以直接跟AI交流,来完成一个客户email的回复,完成一个广告策划的文案,也可以完成会议的关键内容整理,获取财报的关键数据。他会变成你个人的一个AI助手。越多的交流,他就会越能明白你的意图,帮你解决各类问题。”
除了工作场景,行业和企业级的应用,也将被完全颠覆。“不再是传统的交互方式,而是直接给AI下指令:把招聘需求、大量文稿翻译,面试和财务报告的整理等等。”
当然,这背后都需要大模型的支撑。薛贵荣认为,未来模型会进一步细分,除了通用模型外,还会衍生针对不同细分领域的行业模型,以及企业内部模型、个人模型等等。
“总之ChatGPT让我们看到大模型有希望实现通用人工智能。未来针对某个场景有Best Model(最佳模型),每个行业、每个企业都需要有一个ChatGPT,再结合个人模型。其中,个人模型里会包括你的基础信息、喜好偏向等,便于AI更准确地为你提供个性化服务。”