财联社
财经通讯社
打开APP
恒生聚源总经理吴震操:“AI时代:从“面向数据计算”转为“面向计算的数据”|AI领先者心声・2025
大模型时代的信息系统,正在从“面向数据的计算”转向“面向计算的数据”。对于传统数据库进行AI改造是充分发挥大模型能力最关键的因素之一。

《科创板日报》1月15日讯(记者 黄心怡)ChatGPT横空出世以来,AI已渗透至经济、社会与生活的方方面面。刚刚过去的2024年,中外AI及大模型在技术与产业落地上取得了令人瞩目的进展。新的2025年,AI必将继续成为推动各行业变革的关键力量。

在2025新年来临之际,财联社携手旗下《科创板日报》,推出“AI领先者心声・2025”新年特别报道。邀请中外人工智能领军者与行业精英一同回顾过去一年AI领域突破与创新;同时,展望新岁,深入探讨AI及其产业应用在未来的机遇与挑战。

恒生聚源总经理吴震操向《科创板日报》记者表示:

大模型时代的信息系统,正在从“面向数据的计算”转向“面向计算的数据”。对于传统数据库进行AI改造是充分发挥大模型能力最关键的因素之一。

传统的信息系统建设是“面向数据的计算”,即围绕“实体建模的数据库”建立业务系统。而在数智化时代,数据管理方式应当转变为“面向计算的数据”,即围绕大模型的推理和生成能力来增强企业的数据系统,让大模型根植于业务流和数据流之中,成为真正的企业大脑,实现数智化转型。

吴震操AI领先者心声・2025全文如下:

2024年,国内大模型在垂直领域不断拓展,行业应用逐渐深化。大模型对于公域和私域数据的需求也逐日剧增。然而,传统信息化系统的数据管理方式已经无法满足大模型在搜索和推理上的要求。

企业在信息化过程中,通过对现实世界的实体建模,形成实体关系的结构化数据库。而企业的业务系统则是围绕着这些数据库进行建设,通过对于数据库的操作完成业务流程。在大模型时代到来之后,大量需要NL2SQL等手段让大模型能够直接读取和操作企业内的关系型数据库。但是大模型在使用关系型数据库时面临诸多问题:表的结构设计未携带足够的语义信息,导致大模型无法将“自然语言语义”和“数据库语义”联系起来;不同业务系统之间,同类型的数据经常存在格式不一致、单位不统一、数据量纲不对齐等问题,极大地提升了NL2SQL任务的复杂度;当在大模型中输入数据中维度信息缺失或者错误时,无法实现NL2SQL的精确查询等等;

恒生聚源作为金融行业数智化的先行者,基于过去二十多年积累的全量金融市场数据,创新设计了行业领先的AI应用数据库“AIDB”。不同于典型的关系型数据库,它去除了常量表,库表结构基于“指标、主体、维度“三元组的设计,打破了金融数据应用和消费的技术壁垒,实现”直查“方式访问金融指标数据,让数据在大模型应用场景下的获取与分析更加便捷高效。

目前,AIDB可以提供2000+高质量的核心金融指标数据,涉及权益、债券、基金、指数、财务等业务,可提供时间跨度20年的数据。AIDB作为数据库基座,一方面支撑起合作方精准的NL2API以及NL2SQL服务,提升大模型对实时金融知识回答的精度与广度:NL2API应用准确率超过90%,自然语言提问全链路端到端准确率超过96%。另一方面,AIDB数据的三元组结构,可以快速转化为LLM训练所需的问答对结构高质量训练样本,用以支持领域大模型的微调。AIDB与恒生聚源另一款大模型应用产品WarrenQ相结合,实现了真正“语控万数”的能力。

展望2025年,大模型正在成为企业的知识库入口,同时AI智能体开始广泛地与企业的业务系统进行交互,逐渐进化成为企业大脑。这就需要提供与之相匹配的高质量的、可被AI直接消费的业务数据。即围绕着大模型的推理能力,建立面向AI计算的新型数据库。数字化建设开始从“面向数据的计算“转向”面向计算的数据“时代。

AI领先者心声·2025
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
商务合作
专栏
相关阅读
评论
发送