历经八年的坚守、耐心与长期主义,这家在北上广深四大一线城市均布局无人驾驶Robotaxi的企业,终于迎来了美股上市,成为年内美股自动驾驶领域最大IPO。
为贯彻落实上海市委、市政府《关于全面推进上海城市数字化转型的意见》精神,推动“经济、生活、治理”全面数字化转型,引导全社会共建共治共享数字城市,在上海市城市数字化转型领导小组办公室、上海市经济和信息化委员会的指导下,上海市城市数字化转型应用促进中心(上海市智慧城市建设促进中心)策划推出《数智说》系列人物对话,与媒体平台财联社共同合作,邀请上海城市数字化转型方面具有杰出影响力的专家大咖和领军先锋,从经济、生活、治理三大领域,阐述上海城市数字化转型最新成果,展现城市数字化建设者们的前瞻性视野与可行性经验,并对上海建设国际数字之都的未来图景进行展望,推动数字化转型,赋能城市焕发新活力。
本期访谈人物:
复旦大学计算机科学技术学院教授、博士生导师 薛向阳
“科技迭代的速度越来越快,我们铆足了劲往前去追,希望可以摸索出一些出路。作为科研工作者,我感到非常激动;同时,我还有一种紧迫感,在如此的历史机遇面前,我希望自己能够不负时代,有所作为,为社会发展带来更多创新技术。“
ChatGPT的横空出世让人工智能再次成为热词,社会各界对它的探讨与思考也逐渐走向了更深层次:眼下的人工智能已发展到了什么程度?再一次突破技术瓶颈还需哪些条件?在人工智能浪潮中,我国又处于怎样的地位?
要回答这些问题,不妨去最前沿的科学研究领域看一看。复旦大学类脑人工智能科学与技术研究院副院长薛向阳教授长期浸润于人工智能的科研一线,对人工智能有着大量的科研成果及产业化经验,日前,《科创板日报》记者与薛向阳教授进行了对话探讨。
据介绍,早在上世纪70年代后期,复旦大学就开启了人工智能两个重要方向的研究,即计算机视觉和自然语言处理,目前已形成了一支颇具规模的AI研究团队。薛向阳教授领导的计算机视觉团队开发了计算机视觉算法库,包含了图像字符检测与识别、行人重识别、单目三维目标检测等性能领先的算法模型,显著提升了检测识别精度。此外,该AI研究团队还自主开发了基于深度神经网络的自然语言处理算法库,最近开源了大型语言模型MOSS,大大降低了自然语言处理技术的应用门槛……
从完成特定任务的小模型,到多任务大模型
“回顾我的学术生涯,激动二字是我最大的感触。”薛向阳称,这种激动之情,是算法的快速迭代发展所带来的,“你很难再找到另一个行业,可以在短短十多年内,发生如此高频的迭代进化,而且,这种迭代进化还极大推动了社会经济的发展,引发了深刻的产业变革”。
薛向阳介绍称,在过去短短十几年的时间里,计算科学发生了“翻天覆地”的变化,“由于数据的爆发式增长、CPU/GPU计算能力的大幅提高、硬件的快速迭代和深度学习算法的发展成熟,计算科学领域取得了显著的成就——其实,仔细算起来,深度学习算法也就发展了不到十年的时间”。
对此,作为科研工作者,薛教授最直接的感受是课题研究的方式变了。
“过去我们做研究,是一个任务、一个模型、一批数据,各个课题小组根据任务‘单兵作战’;现在有了大模型,它可以实现通用化,不再需要那么多单个的任务小组了。但是,大模型需要算力,动辄需要几百上千个高性能GPU卡,这又让学术研究的门槛提高了很多。”薛向阳表示。
更进一步来说,薛向阳认为,随着大模型在日常生活中的逐渐渗透,未来的人才培养方式也会发生改变:相较于考试“得分”,学生的创造力及创新能力会显得更加重要。
更值得一提的是,在这股技术浪潮面前,薛向阳坦言,中国还有自身独特的优势。
“首先,中国具有多应用场景的优势,在由应用所驱动的研究领域,我们已经处于全球领先水平;其次,在原创性的基础研究方面,虽然目前国内还有短板,但再有一段时间,想必也会有所突破。”薛向阳称,从全球范围来看,在人工智能研究领域取得重大突破的,有不少杰出的华人科学家。
因此,作为科研工作者,薛向阳既感觉到自己面对着巨大的机会窗口,可作为的空间广阔,又明显感到自己责任在肩:“科技迭代的速度越来越快,我们铆足了劲往前去追,也希望可以摸索出一些出路。作为科研工作者,我感到非常激动;同时,我还有一种紧迫感,在如此的历史机遇面前,希望自己能够不负时代,有所作为,为社会发展带来更多创新技术。”
脑科学研究的突破,将继续促进算法的迭代
在进行科研攻关的过程中,薛向阳把自己的视线瞄向了脑科学。
据悉,人工智能的技术路线大致可分为两条:一条以ChatGPT为代表,依靠海量数据和强大算力,通过对深度学习算法的不断迭代,更好地建立起输入和输出之间非线性映射关系,这一类构建大模型方法可以称之为功能类脑;另一条则是结构类脑的大模型构建方法,通过模拟仿真人脑规模的神经网络,称之为数字孪生大脑,在此基础上研究感知、学习、记忆、决策等认知功能。目前,复旦类脑智能科学与技术研究院在冯建峰院长领导下,有一支跨学科研究团队正在开展这方面的探索研究。
薛向阳称,他认为,第二条技术路线如果走通,可能会带来比ChatGPT更具颠覆性的变革。
他进一步解释称,这一方面是因为深度学习算法具有一定的“先天限制”。比如,模型训练依赖人工对数据进行标注;模型反映复杂关联关系,缺乏透明性,对预测结果缺少合理解释;模型易受对抗样本攻击,对应用场景稳定性要求极高等等。
另一方面,基于数字孪生大脑开展其认知功能的研究,是类脑智能研究的一个新的探索方向。
“人脑有860亿个神经元,每个神经元可能连接到1000~10000个其他神经元,神经信号经由这些连接所形成的神经环路进行信息的接受、传递和处理,其复杂程度是Chatgpt4的上百倍,而大脑能耗大致是15~30瓦。”薛向阳激动表示,如果有一天,计算机可以像人脑一样进行计算,不仅耗能低,而且计算效率惊人,那么这又会为人类社会带来什么呢?
实际上,人脑的强大特性已给到科学家们对于人工智能的新启发,这也是人工神经元、类脑智能算法的基础。
早在1943年,心理学家McCulloch和数学家Pitts参考了生物神经元的结构,发表了抽象的神经元模型MCP。以此为开端,学界接连提出了人工神经网络ANN和深度卷积神经网络CNN,最后实现了0到9的简单字符识别,在其基础上构建出了各种各样的深度神经网络模型,成为今天我们所见到的各种大模型的肇始。
不过,薛向阳表示,所谓“知其然,知其所以然”,要学习人脑是如何对信息进行接受、传递和处理的,首先就要了解人脑的工作原理。但一直以来,碍于科学技术水平有限,人类对于人脑的研究始终有限。
在复旦大学,得益于各类项目支持,科研人员们把对人脑的研究往前推进了一大步:其类脑人工智能科学与技术研究院是国内高校最早成立的脑科学与类脑前沿交叉研究机构之一,现在,通过数字孪生、核磁共振等技术,该研究院已完成了对人类的大脑全数字化仿生,进而在计算机上复刻出一个数字大脑。
“我们可以去了解大脑的结构,反解大脑结构,构建数字孪生大脑。脑科学家们可以基于该研究成果进行脑疾病发病机制的研究;后期,甚至可以接入一个机器人,将数字孪生脑植到机器人上……”薛向阳解释称,打开想象力,基于数字孪生脑,他们可以做的工作还有很多很多。
同时,薛向阳也坦言称,这是一个庞大的工程,涉及认知神经科学、计算生物学、计算精神病学、人工智能算法、类脑智能技术与转化等前沿基础和应用研究,需要打通芯片、算法等软硬件方面的各项合作。最近,复旦大学大数据研究院在院长邬江兴院士领导下,正在探索用晶上系统实现全脑仿真,以其进一步提高芯片集成度和降低功耗,从而持续提升类脑智能系统的效能。