①通过简短的文本描述,Sora可以生成1080P、720P、360P三种分辨率的视频,时长可达10秒; ②泄露者疑似部分参与Sora内测的艺术家,他们还发出了一封控诉信。
《科创板日报》7月18日讯(记者 徐杰 张洋洋) 今年7月2日,2024世界人工智能大会暨人工智能全球治理高级别会议前夕,国务院总理李强来到江苏苏州调研,其中一站就是思必驰科技股份有限公司(下称“思必驰”)。
在这次调研中,作为思必驰创始人的高始兴和俞凯,向总理汇报了公司在人工智能软件、芯片等方面研发进展,思必驰DFM-2语言大模型人机对话技术在汽车、家电等行业的产业化落地情况。
思必驰是国内对话式人工智能领域代表企业,坐落在苏州独墅湖科教创新区。在办公区一楼,思必驰陈列了智能汽车语音交互方案上车的车型:哪吒GT、比亚迪秦Plus、哈弗二代大狗等。
图/《科创板日报》记者摄
这家公司把语音对话技术应用到了工区日常,公司电梯也配上了语音交互系统,通过声音,员工即可控制电梯按钮来上下楼。
图/《科创板日报》记者摄
在AI圈,思必驰一直是广受关注的一家公司。
被关注的原因在于,思必驰于2007在英国剑桥创立,切入赛道正是AI语音对话,如果放置今日的叙事语境下,这是离当前ChatGPT应用最近的AI企业之一。
2008年,高始兴和俞凯正式回国创业,将思必驰落户在苏州。而彼时国内人工智能领域鲜有人涉足,即便是AI头号玩家的百度,也晚于思必驰3年才入局。
与此同时,高始兴和俞凯两位创始人剑桥大学学霸的身份,也让思必驰在创投圈的名声增色不少。
在后来16年的创业过程中,思必驰共收获了7轮融资,总计超10亿元,投资方不乏北汽、美的、佳都、中信、元禾、苏创投、深创投等知名机构。
但AI新贵当初有多耀眼,后来的争议就有多激烈。
尤其是大模型如火如荼的当下,去年5月思必驰折戟科创板IPO,更让这家AI公司在这轮AI热潮中略显落寞。
今年3月和7月,《科创板日报》记者两度见到了思必驰创始人、CEO高始兴,后者有着山东人典型的敢言和直爽。
当问及公司上市被否,高始兴没有掩饰自己的情绪,他说这是他被现实鞭打的“最厉害的一次”,而后也云淡风轻说出,“创业嘛,正常”,“没有像其他人想的那样受打击想不开”,“回来该开会就开会”。
在剑桥大学求学时,高始兴读的是商学院硕士。他与俞凯搭档创立思必驰,俞凯是剑桥大学工程系博士,负责技术研发,高始兴则承担着商业化。
高始兴没有把自己很严格的区分为是“技术派”还是“现实派”,进入AI2.0时代,他坦言AI应用落地的长周期和不容易,但其也认为AI业才刚开始,行业格局还未定,还有太多机会可以挖掘。
7月2日傍晚, 思必驰创始人高始兴、俞凯在公司前合影(左俞凯,右高始兴)图/高始兴朋友圈
▍“上市计划一直在进行,2025年将同步新动向”
《科创板日报》:先聊聊上市吧,当时IPO上会被否,知道消息后你是什么感受?
高始兴:比较特殊。刚被否的时候,我真没像别人想的那样受打击,我的心还是很强大的。那个时候就是觉得很不爽,为什么会被否了。但是我回来该开会就开会,是受打击,但没像别人想的那样,好几个朋友,他们说你别想不开啊,其实我想的挺开的,正常。
《科创板日报》:但其实后来你们还融到资了,今年1月份,首期两个亿。不过两亿对于你们其实是不够的,有新的融资计划吗?
高始兴:肯定不够,还会继续推进。其实在这种情况下(上市被否),还能够融到资,我还挺欣慰的,上市被否对于我们其实很被动,一般被否之后企业的生存境地就比较危险。
《科创板日报》:后来了解被否的原因是?
高始兴:核心还是当时存在亏损。好在,思必驰的技术还是很扎实的,团队也有韧性,我们用连续五年时间来证明了思必驰的收入增长、亏损持续收窄,证明了思必驰是一个能够实现长期稳定发展的企业。上市只是企业长远发展中的一个路标,并不是终点,我相信我们会走过这个阶段,往更远更大的未来前进。
《科创板日报》:现在有最新的上市计划吗?
高始兴:上市计划一直在进行,预计明年,也就是2025年会有新动向同步给大家。
《科创板日报》:详细介绍一下公司在人工智能软件、芯片方面的最新布局?
高始兴:在技术层面,我们在2023年7月发布了自研的行业语言大模型DFM-2,并先后通过《生成式人工智能服务管理暂行办法》备案以及《中国境内深度合成服务算法》备案,思必驰也成为江苏省首个完成“双备案”的企业。
基于该大模型的超自然语音合成、AI多语种等多项技术也相继助推了业务进展,同时,思必驰DFM-2大模型已成功入驻国家超算互联网平台,一方面将推动算力、算法与DFM-2大模型等人工智能要素相融合,助力DFM-2大模型获得算力底座保障,提高模型训练效率和泛化应用能力,推动大模型在各场景领域的广泛快速应用。
当前,思必驰的整体业务依旧坚持“云+芯”的战略布局,相关软硬件产品方案均基于思必驰DFM-2大模型进行了全面升级,在智能汽车、智能家居、消费电子、数字政企以及科研等领域,已经有了实际落地应用。
《科创板日报》:DFM-2百亿模型,现在模型有无更新?目前应用落地的情况怎么样?
高始兴:思必驰的DFM-2大模型的核心进展主要是在两个方面:一个是跨模态能力的持续输出;另一个是面向To B领域的大模型落地。
在跨模态能力方面,我们结合语音、语言的跨模态大模型技术在持续推进,也在和上海交大实验室合作研究一系列其他的图形图像大模型,比如上面提到的思必驰-上海交大智能人机交互联合实验室、苏州实验室共同发布的首个针对化学科学的百亿级专业化大模型ChemDFM,这也是一个跨模态的大模型技术应用。
在面向To B领域的大模型落地方面,我们主要通过可靠性优先的技术架构,来推进大模型智能体系统的落地。目前,思必驰的大模型方案在智能汽车、智能家居、消费电子、数字政企、科研等多个方面有了落地应用。
举例来讲,在智能汽车领域,思必驰的中枢大模型方案已在北汽、哪吒等多个项目实施落地,并有近十家车企在对接中。
截至目前,思必驰已合作60多家汽车品牌,其中包括国内知名车企如比亚迪、长城汽车、北汽、吉利汽车、上汽通用五菱、哪吒汽车、极氪汽车等,也包括海外高端汽车品牌如梅赛德斯-奔驰、奥迪、保时捷、捷豹路虎等。量产车型已超过160款,累计“上车”量超过1000万。
《科创板日报》:现在大模型对你们业务增长大概能有多少?
高始兴:我们今年至少实现40%的增长,以to B市场为主。思必驰业务以汽车、家电的智能化为主,其次是面向政企和金融智能化,大模型来了以后,大逻辑是端的智能化,汽车、家电的智能化势能起来了,现在刚进入爆发期,汽车的新一代人机对话现在渗透率20%-30%之间,家电的高阶智能化,现在也就10%左右。
所以说,未来空间还很大,需求非常猛,这是思必驰的核心驱动力。
《科创板日报》:汽车还是一个合适的方向?
高始兴:对,另外在家电领域,早期其实我们做过智能音箱,刚开始觉得手机是家居的入口,后来发现不对,然后又觉得音箱是入口,但也不对。我觉得未来在AI时代,车联网物联网是非常有潜力的。
未来三五年左右,每个人都会有一个在云端的智能助手,当然也会结合本地端的小模型,但核心是在云端的,用户在哪个地方,它会迁移到不同的硬件物理端上。当年我们在融资的时候,我们就说个人助手这个故事,当然没人看得懂,到现在也不是所有人都看得懂,但我认为一定会发生。
所以你看苹果造车,之前投入多少美元,但现在他造车停了。苹果造手机,因为手机的普及量非常大,卖完手机以后会抓到大量的用户,然后自成一个生态,像苹果那样的封闭生态,这个逻辑(占领空间)是成立的,但造车很难,因为车你是造的再好也卖不太多,跟手机出货量完全不是一个量级,抓不到用户,所以苹果造车的逻辑就不存在了。如果未来每个人都有一个云端个人助理,谁掌握助理,谁占领的空间多,我觉得谁就会形成未来大的生态。
《科创板日报》:你觉得哪种类型的公司可能会做成这件事?个人助手的苹果公司
高始兴:这个问题现在确实很难说,从逻辑上谁占领的终端多成功性更大,比如在手机端,物联网终端。思必驰其实正在做这个事情,我们在物联网提供人机对话助手,那么思必驰就也有这个可能性,在手机端做助手的,也有可能是手机公司,有可能是别的大模型公司。
▍“AI创业有情怀,但也向现实单膝跪地,至少一条腿是站着的”
《科创板日报》:其实你们大模型能力做的蛮早的
高始兴:确实,我们的联合创始人俞凯在剑桥读博士的时候,就一直是做人机对话这方面的研究。当时他还创立了一家公司,叫VocallQ,后来就被美国苹果收购了。但是做的早没用,那个时候虽然你技术早,有理论,但那只是其中一个因素,你还得大力出奇迹,说白了你得有财力、人力的投入,要有各种持续的支持。你还得考虑大环境,市场应用需求的旺盛,也是一个不可忽视的重要因素。
《科创板日报》:现在大模型行业大家大致划分出两种派别,一派是以月之暗面创始人杨植麟为代表的技术派,也叫理想主义;另一派是朱啸虎的现实主义,你是哪一派?
高始兴:首先技术还得有理想主义,但是面对现实的时候,我觉得还得是实用主义,你公司还得活着。
朱啸虎从投资的角度我觉得无可厚非,包括企业经营的角度也无可厚非,你首先得找到落地的应用场景,然后有企业的发。从他的角度有可能觉得,大模型确实大力出奇迹,但是投入资本太大。第二个,找应用场景确实不是那么简单,你让他陪跑,我觉得资本确实不愿意,我觉得他代表了大多数资本的立场。
我个人没什么严格的派别之分,从思必驰的角度来看,假设我们只是为了上市,我只是假设,我可以分分钟就有利润,不做研发了,马上利润就会多很多,但是这样企业就没有持久力了。
技术创业者或者技术驱动的公司,我觉得还是有一定情怀的,虽然也要向现实单膝跪地,但至少我一条腿是站着的。杨植麟也无可厚非,年轻的创业者,我是非常支持的,但也要警惕被残酷的现实鞭打。
《科创板日报》:你被现实鞭打过吗?
高始兴:我被鞭打的太多了(大笑),去年5月9号就鞭打了一回(当天上交所公布了思必驰科创板IPO上会被否的信息),受鞭打很多,但是我觉得那是最大的一次。
我们创业有18年了,我觉得创业者到最后,其实你会悟到,这就是创业该有的样子,不要指望人生一帆风顺,你做不到的,只有经历这些,当你满身伤疤了以后,才能成为一个将军,这才是正常的。
要想得开,创业者或者企业家,就是以企业为家,你得负责,但是有时候你负责的话,你只有人在,你才能负责,这是一个,还有一个是认知,就是创始人,创始团队,高管,经过这么多年后,根本上你对创业的认知,对企业不同发展阶段的认知,认知对了以后,有很多问题解起来好解,很优秀的公司或者什么,他的公司管理者认知必须到位。
《科创板日报》:不同人有不同的烦恼,被否有被否的烦恼,人家上市了也有上市的烦恼,这可能不亚于被否的烦恼
高始兴:是。我觉得认知是一件很难的,人是凡胎肉体,你会面对着很多压力情绪,甚至虚荣,所以你要怎么看这些事情,对吧?这个认知很关键。
《科创板日报》:你在AI行业从业这么多年,你认为这个行业现在跟你2007年刚创立思必驰时候相比,前后两个时期有什么不同?
高始兴:毫无疑问我觉得变化还是巨大,有几点比较重要。我们成立于2007年英国剑桥,但你看2008年我们刚回国的时候,都是拿着锤子找钉子,而且当时的锤子还不硬,那时候人工智能语音领域也只有科大讯飞一家上市公司。整体看那个时候人工智能技术还是相对比较弱的一些命令词识别,应用场景也很窄的。但是随着整个深度学习技术,包括现在大模型技术,它不叫迭代了,我觉得是革命性的。所以我认为现在的变化第一个是,技术变革速度非常快。
第二个是整个技术能力形成了一个循环,比如说思必驰的人机对话技术需要落到端上,其他产业也一样,要落到端上去,端大量的数据要上云,云有算力支撑,然后再去训练,形成新的模型,升级新的技术,而且我还会不断的拓展技术边界,所以它形成了技术能力的循环。当然这个循环也是因为产业链的成熟完善,包括像4G/5G技术、算力基础设施、端的智能化等。
最大的还是在客户和用户侧需求和认知的反向推动。2022年底,ChatGPT慢慢热起来之后,对C端用户,你看连我父母都知道大模型,原来他们连我们公司的技术都搞不明白的。
也就是说用户对人机交互人机对话语言模型都熟悉了以后,反而会对 b端的市场推进更容易,这同时也就发现,我们的产业迭代也到了一个阶段,端的智能化端的革命,从原来纯粹硬件的创新到联网化的功能创新。从大的逻辑上来看,AI现在是到了一个爆发期,毋庸置疑,跟我刚回国的时候完全不一样。
思必驰AISpeech中的AI算是走在了这个行业的前列,在这个阶段,思必驰也经历了一系列的探索,在经历了转型后逐步找到了更适合自己的发展之路。近两年,AI行业已经在生产、生活、政务、医疗等生产生活的各个方面都有了实际的应用,并且成为新质生产力的重要驱动力。同时,AI行业也在加速竞争,AI的全球治理和国际合作成为新的挑战和机遇领域。
这不仅对思必驰而已,对整个国内的AI行业来说,都是一种机遇和挑战,所以我们要更好的修炼内功做好核心技术的创新研发;用更好的嗅觉去挖掘市场需求和用户需求,打造更完美的方;更开放的视野看待整个产业链的发展,联动上下游产业形成合力,增强国内AI产业的凝聚力和全球影响力。
《科创板日报》:思必驰创立有17年,市场会把你们与AI四小龙归类为AI1.0时代的公司,并与现在刚起步就突飞猛进的AI2.0时代的AI大模型企业做对比,这种比较,你会有压力吗?
高始兴:这种归类我认为也有一定道理,因为上一代的公司,它成立的时间久了的话,当新的技术、新的市场机会来临的时候,它抓住的机会相对来说会难一点。因为成立时间久了,它的文化和体系已经形成了,它有原本的赛道,原本的产品和解决方案和客户,所以你让它转型确实有一定挑战。
大家说上一代AI公司不行,核心的感观是觉得它们业绩不好,投了的都赔了,投资人赚不到钱,这是这个行业的特点。大模型起来了以后,新的大模型公司相对又比较锐利,还会觉得上一代公司有可能跟不上,也没什么资金。
但是我觉得这里面又分两面来看,AI还是技术驱动的,思必驰也好,AI四小龙也好,其实我们对大模型技术也跟踪的很早,所谓上一代的AI公司很多是有技术储备、有客户、有大模型根基的。像讯飞也好,思必驰也好,包括百度,你看科大讯飞够老吧,它做大模型一样很快,你能说它不行吗?讯飞它是有场景的,思必驰也是有场景客户的,新的大模型公司很难找场景客户,它们的优势就是很多新的东西容易被追捧,这也是对的,它们可以毫无羁绊去做一个新的C端产品或者什么的。你再过几年看看,现在这些早期的大模型企业,如果收入跑不起来,融资估值有可能搞不好会倒挂,被现实鞭打一下就知道了。
当年这些上一代的AI公司,你只是看得见的有思必驰,四小龙,那些看不见的不知道倒下来多少,我们也是一路走过来的,只不过看到都是光环,其实倒下的都不知道,先烈有的是。
我觉得核心看大的逻辑,就是你这个技术,如果这个市场由技术驱动,你这个公司有没有技术驱动力,是不是在跟踪前沿技术。第二个技术未来服务的场景,有没有这种场景的根基。这两个大的逻辑在,那就OK,当然还有没有现金流也很重要,能不能持续走深走远,这才是最大的逻辑。
《科创板日报》:公司如果老是做技术的话,面临的技术的创新的压力还是蛮大的?
高始兴:AI也分赛道,传统的图像视觉,安防市场已经到了瓶颈期了,那么现在我们这个市场,端的智能化,包括物联网端、车联网端的智能化,才刚刚进入爆发期,市场在上升期,未来三年我保证双增长40%没问题,营收增长40%,利润增长40%。如果到了瓶颈期,毫无疑问会存在,要么就转型,我从B端转成C端,要么就产业链整合。核心还是最终看市场,市场在哪个阶段。
▍“AI行业才刚开始,格局未定,机会还非常多”
《科创板日报》:你觉得今年大模型行业还会有什么新叙事?
高始兴:国外可能大家都只会看OpenAI,国内的话,我觉得一些创新的内容生成的面向C端的有可能一些亮眼的东西,文生图、文生视频等,有可能像这样的,但B端就是闷声发大财,亮眼你也看不到,它不显眼。
《科创板日报》:今年大家更多想着往应用上面走,业界也有一个声音,认为今年是大模型应用落地元年,你怎么看这个说法?
高始兴:10个亿规模是元年,1000万也是元年,就看你怎么定义。的确是个元年,刚开始,但周期会蛮长的,大模型落地是一个巨大的挑战,并不是你有个大模型就可以了。
比如说在车里,汽车有各种噪声环境,各种方言、风速、发动机的噪声,各种摄像头,包括不同的位置,我们去接入大模型,需要融合成一个整体的人机对话的解决方案,同时我还得适配不同的车型系统硬件配置,周期会蛮长,B端和G端现在虽然能赚钱,但周期很长,也没那么简单。
《科创板日报》:AI服务千行百业,哪些行业你认为是最适合思必驰的?
高始兴:各行各业都难,AI落地到每个行业,各种Know-How,解决方案,包括它的产业链条,还是要围绕一个行业或几个行业,肯定做不到通杀。
《科创板日报》:现在新能源汽车是占你们业务比重比较大的一块吗?
高始兴:汽车增速是最快的,但比重不是最大,比重占第二,AIoT物联网这块是最大的。
《科创板日报》:很多人把你们和科大讯飞做对比,你自己怎么看?
高始兴:讯飞是一家非常了不起的公司,我们是2007年在英国创业,2008年回国,AI热起来是2014年之后,我们创业在行业的冬天,讯飞上市是寒冬,一个公司创始团队带领公司走向初春,暖春和夏天,穿越周期,让公司活着,对得起股东、对得起员工,这样的话对产业发展都发挥贡献,我觉得是非常了不起的。但我们跟讯飞还是有一定的区别,就是我觉得主要业务端,讯飞最大的业务还是在教育领域、以及to G和 to C场景,思必驰目前还是to B场景为主。
《科创板日报》:你说科大讯飞是一家伟大的公司,作为思必驰的创始人,你觉得现在你们要成为伟大的公司,还缺一些什么东西?
高始兴:这缺上市了(大笑)。
《科创板日报》:上市重要,但也不是说非常那么必要
高始兴:上市不是必要,但的确很重要。意味着成为了更大的公众公司。成为公众公司以后,品牌号召力,你的业务能力包括在国际市场开拓业务,还是不一样的。
从成为一家伟大的公司而言,首先要看是不是在坚持初心。当年我和俞凯,我们在留学时,我们住在一个宿舍里,那时的Nuance是全球最大的语音识别公司。俞凯是语音方面的专家,他就觉得,思必驰一定要做一个事情,把Nuance干掉,或者说我们能做Nuance,让世界能听到来自中国的声音,那时候真有情怀,我们两个都是老党员,大学就入党,真是有情怀的,这个要坚持。
但是还有一个,就是对管理行业的认知。因为你毕竟是做企业,做商业,你再有情怀,情怀不当饭吃,初心也不当饭吃,初心在关键时刻让你有个底盘在,但是底有多高,取决于你对行业认知,对企业不同发展阶段管理的认知,我觉得这是两个关键。
当然还有一些其他的,比如市场在变化,我们面对的人工智能市场进入高速发展期,毫无疑问的,我们团队需要去提升。
我觉得我们创业团队的底盘在,创业初心坚持上,没有变化。你想卖掉公司找工作,拿高薪什么的,当然这太容易了,但你要坚持创业是很苦逼,甚至有时候傻逼的事儿,你苦逼的坚持了18年,那是为什么。我自己有时候给我自己点赞,没人点赞的时候我自己点赞,没人拥抱我自己给自己一个拥抱,对吧?底盘在,会保证你不走偏,让你继续走下去,跌倒还能爬起来,但是跌倒之后能走得多快,还在于对行业的认知,对管理的认知,团队不断提升。
《科创板日报》:人工智能行业经过这么多年,是否属于一个成熟的行业?
高始兴:人工智能啊?你说人工智能吗?
《科创板日报》:对
高始兴:不是,不是,才刚开始,现在需要革命的地方太多了。比如刚才说的,我们现在有大量的客户,大量沉淀的数据怎么去挖掘,太多了,包括我们现在每个端都有一个云端助理远远还没实现,路还很长,你放心场景一定会非常大。
当通用人工智能在 C端B端落到每个产业的时候,那才是成熟,但那个时候我觉得世界会发生天翻地覆变化。你想,去年才号称是第四次工业革命,怎么让你一句话就给我聊成熟了,怎么可能。
《科创板日报》:我是说这个行业的市场格局
高始兴:格局也还早。你想啊,C端你看有什么应用跑出来了吗,没见到。B端,也没有跑出大的(公司),才刚开始。太多B端了,我们中国多少行业,不光是汽车、家电、金融政务,电力、运营商、康养,三百六十行,太多了,我完全不同意说行业市场格局已成熟,人工智能距离成熟产业还早呢,机会非常多。
《科创板日报》:你觉得AGI(通用人工智能)什么时候会实现?
高始兴:就10年左右,最晚不会超过15年。随着大模型产业链形成,就像PC互联网转到手机为主的移动互联网,大模型产业链未来也会发生转移,现在远远没动,一些核心功能还没实现。
《科创板日报》:你认为当下AI大模型行业的状态是什么?
高始兴:AI大模型现在是全球科技竞争的新高地,从国内来看,整个AI行业十分活跃,通用大模型、行业大模型、端侧大模型如雨后春笋般涌现,大模型产业的应用落地也进一步提速。
我们看到了几个现象的出现:
一个是产业中对大模型的需求更加旺盛,从出行、生活、政务到医疗等等,在服务数字化的过程中,大模型已经是十分明确的刚需了;
第二,AI企业在商业化和应用的过程中在不断创新,垂直领域大模型不断涌现,做专做精专注场景化应用的价值更加凸显;
第三,整个社会对大模型的接受程度很高,这也得益于ChatGPT的影响力,现在的年轻人、职场人借助AI辅助工作、学习和生活已经十分常见,大众对AI的任何和接受度大大提升,这为AI带来了很好的前景。
但是我们也看到了面临的挑战,例如,随着AI大模型规模呈现指数级增长,大模型训练所依赖的高性能AI芯片、训练数据、主流大模型架构等等问题的局限性依旧是大模型领域从业者需要考虑的实际问题。