“大模型这条赛道从业者很多但并不意味着没有机会,因为仍有很多领域的大模型甚至还没有完成定义。在迈向 AGI 时代的过程中,我们希望人能更好地利用工具,而不是被工具利用。”
本期访谈人物:
上海闪马智能科技有限公司创始人、董事长兼CEO 彭垚
“大模型这条赛道从业者很多但并不意味着没有机会,因为仍有很多领域的大模型甚至还没有完成定义。在迈向 AGI 时代的过程中,我们希望人能更好地利用工具,而不是被工具利用。”
▍个人介绍
彭垚,上海闪马智能科技有限公司创始人、董事长兼CEO,九三学社成员、高级工程师,上海市浙江青年企业家协会理事会副会长、浙江省青企协常务理事、浙大上海高研院&闪马智能“城市空间智能管理联合创新中心”副主任,拥有十余年云计算、AI研究和智能产品创新经验。曾任七牛云人工智能实验室创始人、七牛云产品技术合伙人、复旦-七牛深度学习实验室副主任、IBM全球系统科技实验室产品研发主管及建设银行总行专家代表。2019年4月创立闪马智能。
▍第一标签
AI前沿研究与商业落地引领者
驱动智能交通落地
▍公司简介
上海闪马智能科技有限公司成立于2019年4月,是一家聚焦城市空间管理的人工智能公司。基于自主研发的ATOM深度学习平台和VisionMind一体化感控平台,闪马智能建立了成熟的AI工业化体系,双平台融合支持,实现算法模型快速迭代及各类应用场景快速迁移,形成可用于智慧交通、智慧建造和智慧能源等行业的智能产品和业务闭环,并在全国广泛落地。公司与顶级高校、科研院所以及众多生态伙伴企业深入开展产学研合作,共同践行创新驱动发展战略。
ChatGPT的出现突破了AI进化的边界,也让国内掀起了一场百模大战。
对于当下GPT大模型的热潮,闪马智能创始人、董事长兼CEO彭垚保持了较为理性的态度。“我们不是专业做自然语言处理的,也没必要去秀一下肌肉。即使要做大模型,也是针对自身业务来开展,我们是一家比较务实的公司。”
事实上,闪马智能从2020年起就开展了针对交通场景的百亿级参数大模型训练,也参与了国家重点项目。“我们现在的研究方向是怎么把大模型做小,把大模型在交通等领域的部署应用做起来。”
据了解,闪马智能的核心能力在于“视频智能分析”,围绕ATOM AI生产力平台,构建了从标注到训练到测试到落地的全链路自动生产体系,可支撑千卡级大模型训练及各类场景微调模型的稳定运行。
在2023世界人工智能大会(WAIC 2023)期间,闪马智能与上海嘉丰车路数字技术 有限公司(下称“嘉丰车路”)联合主办的“大模型生产与产业落地合作论坛”,在上海世博展览馆举行。
在接受媒体采访时,彭垚表示:“大模型这条赛道从业者很多但并不意味着没有机会,因为仍有很多领域的大模型甚至还没有完成定义。在迈向 AGI 时代的过程中,我们希望人能更好地利用工具,而不是被工具利用。”
彭垚说,“本质上,科技要回归至解决社会的每一个问题之上。先看看社会到底需要什么,哪些问题要科技手段来解决。希望通过人工智能的算法,发现不同城市空间中的变化,真正帮助大家提升效益。我们团队推崇工程师文化,以问题为驱动,而不是单纯追求技术。”
在论坛上,中国电信上海公司、中国科学院虚拟经济与数据科学研究中心、浙江大学上海高等研究院、罗克韦尔自动化中国、Unity中国、有孚网络、沐曦以及闪马智能等正式启动ATOM产业生态。
彭垚介绍,ATOM产业生态将以ATOM AI生产力平台为纽带,围绕AGI时代背景,展开技术创新、模型生产、产业应用和算力资源上的充分合作与沟通,并以此为契机,参与和推动新一轮人工智能的发展浪潮。
自2016年起,彭垚连续创业,7年内成功培育并壮大了两家行业独角兽企业。2016年,彭垚与好友共同创立闪马智能前身的七牛云人工智能实验室,组建深度学习团队,从七牛云离开后,彭垚于2019年4月创立闪马智能。
彭垚告诉《科创板日报》记者,决定创立闪马智能,最初源于这是他真正想干的事。
“原先我在七牛云做人工智能实验室,也负责七牛云的云平台。云计算更偏工具化,目的是帮助更多人来开发应用。而人工智能是生产力类的工具,我的内心更希望利用人工智能这样的技术,来帮助城市各个环节提升效率和效益,真正解决核心问题。”
而支撑彭垚创业的底气,来自于其掌握的视频检测多目标跟踪等能力,在业内处于领先地位,这些技术在交通行业有巨大的应用潜力。
“当时,业内对于每条道路、每辆车的实际行驶情况,是否有事故或者特殊行为发生,没有办法真正感知到。虽然也有一些人在做,但采用的是传统算法,识别率不太高。所以我们的想法是,怎么通过人工智能来感知这些事情,对交通进行疏导优化,降低事故发生率。”
经过多年发展,闪马智能业务已覆盖全国近400个城市区县,在多个核心城市树立了标杆案例,近年来更是保持每年快速地成长。
“我们能够发现城市空间里各种事故。然后,找到最近的救援力量,第一时间把这些车拖离现场,既救助人,又能快速地完成交通疏导。同时,通过城市里的摄像头去发现严重影响交通安全或者交通秩序的行为。此外,利用人工智能和数据分析,还可以对未来的交通情况进行预测,事先就做出一些措施,提前疏导道路的拥堵。”
当前,汽车市场加速向智能网联化转型,智能网联汽车步入快速发展的新阶段。深圳、上海嘉定等地均开辟了自动驾驶示范体验区。不少业界观点认为,聪明的车和智慧的路进行协同,已成为国内自动驾驶产业落地的关键。
车路协同将车与车、车与路的信息相连通。其中,车可以将拥堵信息、实时路况等,传给交通控制中心;交通控制中心又可以将实时更新的信号灯数据、车流量信息、绿波信号、事故信息等,传给路上行驶的汽车。
在上海嘉定、深圳等示范区,闪马智能均有参与车路协同的试点应用。而在WAIC2023期间,中科闪马智能有限公司正式揭牌,由闪马智能和嘉丰车路共建的联合创新实验室也正式成立。
中国科学院虚拟经济与数据科学研究中心特聘研究员张影飞表示:“中科闪马智能有限公司具有三大优势:第一,强强联合、资源整合;第二,技术融合、拓展应用;第三,聚力发力、 突破难点。期待与闪马智能共同推动自主可控的国产技术发展与创新。”
闪马智能与嘉丰车路共建的联合创新实验室将结合双方优势,在车路协同、智慧停车、高可信网络安全技术、ATOM AI 生产力平台和面向大语言模型训练平台应用领域,展开全面战略合作与联合创新。
“我们做整个路测的雷达视频的感知,把路测感知到的情况在180毫秒以内发送到车上。同时,为车辆提供的超视距感知,大大提高系统进行驾驶决策的效率和准确率。通常而言,车的视距是有限的,只能看前方200-300米的位置。超视距则能让汽车感知到前面500米的车祸,对道路情况进行预判和避让。” 彭垚透露。
通过车与车、车与路之间的实时通讯,就可以尽量避免拥堵,尽量减少驾驶员急刹车等危险操作。只要合理控制行驶路线及速度,就能实现出行效率和安全的双重保障。
“打个比方,就类似于轨道交通里的信号控制,车与车之间多少距离,这个站点要不要停,有一整套信号最优化的方式去控制它。而在车路协同网中,通过车与车、车与路之间的通讯,也能让整个道路的秩序非常井然。”
迄今,闪马智能的应用已经从智能交通,延伸到能源、建筑、制造等多个行业。目前,闪马智能的业务覆盖了全国近400个城市区县,也从最初交通领域,拓展到智慧建造和智慧能源等行业。
“我们的技术核心可以理解为发现空间中各种变化的事物。像交通属于高速变化的场景,而生产环境则属于人员行为分析,让生产制造的过程更为高效。”
彭垚以新能源场站的巡检为例。“像太阳能风能的场站,原来运维至少要七八个人,通过人工智能视频分析,借助机器人巡检,场站平时实现了无人化管理。一旦出现事故,系统会自动告警,然后再派人去处理。
ChatGPT的横空出世,拉开了大语言模型产业和生成式AI产业蓬勃发展的序幕,闪马智能从2020年起就开展了针对交通场景的百亿级参数大模型训练。
彭垚认为,Transformer架构确实对计算机视觉的优化有所提升。“Transformer其实就是一个暴力架构,100亿参数就相当于100亿个方程式,通过这种暴力解肯定能解出很多东西来。”
但彭垚也直言,相比自然语言处理,Transformer架构对于计算机视觉的提升没有那么大。
“确实是有精度提升,但性价比不高。相当于花很大的算力识别一个东西。虽然识别率略有提升,但由于所需的算力很大,无法将其放在车路协同的边缘侧盒子里。而且驾驶场景需要的响应时间非常短,大模型的参数量那么大,计算起来太慢了。所以现在我们的研究在于怎么把大模型做小,把大模型的应用部署做起来。”
2022年,闪马智能与清华大学、上海交大、浙江大学等联合承担了科技部下一代人工智能国家重点项目,其中就涉及大小模型的研究项目。“什么情况下用大模型训练,什么情况下把大模型缩小变成小模型,放到手机里或者边缘端设备里。”
彭垚表示,这涉及到能耗、算法、算力等各方面的平衡。“算力芯片要强,但也不能能耗太高。所以最难的还是算法的优化。如何让大模型在小模型的场景下也能保持准确度,这是我们一直试图解决的。目前我们已经做到在一定的视距范围内,构建与大模型一样准的小模型。”
对话1000位行业领军人物:安安访谈录