①上海监管局近日对天风证券资产管理有限公司开出罚单,因从事资产证券化业务过程中存在4项违规情形,被出具警示函; ②开年以来,已有3家券商因资产证券化业务违规受到处罚,相关罚单有所增多。
财联社2月24日讯(记者 林坚)DeepSeek已渐成国内券商的标配。这款唯一一个被海外市场接入的国内大模型,在过去的几周内就有近40家券商成为接入或者本地化部署的对象。不难发现,以DeepSeek等一系列大模型为代表,正在深刻改变证券业的格局以及未来。
2023年8月31日,11家大型语言模型成功通过《生成式人工智能服务管理暂行办法》的备案程序,这标志着大语言模型在监管框架和应用模式方面达到了一个重要的成熟阶段,并且开始进入大规模推广的时期。大模型企业级应用全面井喷,但整体仍是方兴未艾,还有哪些细节与痛点?近期,银河证券信息技术部数据与智能应用模块负责人刘永旗与财联社记者进行了一次深度对话,聚焦大模型企业级应用,尤其是DeepSeek带来的变革。
刘永旗表示,整体而言,DeepSeek的出现激发了证券行业内广泛的使用热情,企业用户需求激增,应用场景不断扩展,持续增强计算能力并实现有效资源利用至关重要。券商需要融合各种尺寸和类型的模型,将推理型大型模型应用于需要复杂推理的领域,同时在简单问答场景中使用通用型大型模型。“通过这种方式,我们可以让不同模型发挥其独特优势,协同工作以提升整体的AI性能。在提高业务成效的同时,我们还需兼顾性能考量,确保技术的真正落地应用,并实现规模效应,从而达到降低成本和提高效率的目的。”
刘永旗表示,银河证券积极拥抱AI时代潮流,在大模型兴起之初,便深入探索GLM、DeepSeekV1等开源大模型的应用场景,并逐步引入通义千问7B-72B及VL等不同规模的大语言模型和多模态大模型。
今年2月初,银河证券上线了DeepSeek-R1-Distill-Qwen-32B版本,并于2月17日正式推出DeepSeek-R1“全尺寸”模型。通过构建企业内“特性+尺寸”双维模型库,银河证券实现了轻量化部署与复杂任务处理的双重需求。此外,公司已将DeepSeek-R1系列大模型及通义千问模型深度适配优化,双模型体系已成功应用到公司自研投顾平台G-Winstar(问TA系统),构建了覆盖投顾服务全链条的智能中枢。
看点一:算力军备竞赛与模型“组合战法”涌动
2024年12月26日,中国AI行业迎来历史性时刻:深度求索(DeepSeek)发布的MoE(混合专家)大模型DeepSeek-V3以6710亿参数规模,在多项评测中超越MetaLlama-3.1、阿里Qwen2.5等国际主流模型,性能直逼GPT-4o与Claude-3.5-Sonnet。更令人瞩目的是,其客户端仅用7天便突破1亿用户,刷新ChatGPT、TikTok等国际产品的增长纪录。这场由技术突破引发的行业地震,正在重构全球AI竞争版图。
在刘永旗的观点里,DeepSeek的“破圈”效应已引发全球产业链重构,这已成为不争的事实。
刘永旗认为,DeepSeek的影响力超过2022年ChatGPT的面世。一方面,云服务争夺战已经打响。微软Azure、亚马逊Bedrock等国际云巨头争相接入DeepSeek模型,华为云、阿里云则推出“千卡集群+DeepSeek适配”的国产化方案;另一方面,硬件生态绑定正在建构。英伟达NIM平台将其列为推荐推理框架,AMDMI300XGPU针对其优化性能,英特尔更实现酷睿处理器离线运行,这意味着未来AIPC可能标配“中国芯+中国脑”。
聚焦到金融业场景,DeepSeek应用呈现爆发趋势。刘永旗表示,已有至少37家国内券商部署DeepSeek-R1本地化方案。已某券商投研部透露,其行业报告生成效率从8小时缩短至20分钟,并实现宏观数据与产业链图谱的自动关联。
从成本与推理能力上,刘永旗分析称,DeepSeek-R1在模型训练与模型算法等方面实现了创新,并显著降低了成本。尤其在推理能力上,DeepSeek-R1表现突出,对于券商应用提供了重要价值。
从应用效果方面,刘永旗称,通过创新的模型架构和工程优化,DeepSeek大幅降低了训练和推理成本,DeepSeek-R1的整体训练成本比OpenAI少了一个数量级以上。在模型性能方面,DeepSeek-V3作为MoE模型,在多项测评中超越主流开源模型,性能媲美顶尖闭源模型。DeepSeek-R1在后训练阶段大规模使用强化学习技术,极大提升了模型推理能力,在数学、代码、自然语言推理等任务上比肩OpenAI o1正式版。其蒸馏出的6个小模型在多项能力上实现了对标OpenAI o1-mini的效果,拓展了多场景应用潜力。
看点二:证券业算力、模型、数据和场景全面革新
目前,证券行业已在投资顾问、投资银行、投资研究、客户服务、风险控制以及信息技术等多个领域实现了大模型的具体应用。刘永旗告诉记者,大模型的企业级应用主要涉及算力、模型、数据和场景这四个方面,而DeepSeek在这四个方面对证券行业产生了显著影响。
首先是算力方面。国内大模型参数规模从最初的100多亿逐渐扩展700多亿,此前主流模型仍在千亿以下。然而,DeepSeek-R1的全尺寸参数规模已达到6000多亿。随着模型效果提升与尺寸增大,算力需求迅猛增长。叠加证券行业对于安全以及合规的高要求,证券公司不得不在本地化部署的限制下支持激增的应用需求,赋能业务发展。
再者是模型方面。刘永旗谈到,目前国内主流大模型要么部分开源,要么不开源,而DeepSeek不仅效果出色,而且全部开源。这一特点将刺激更多的商业模型开源,为企业级应用带来更多选择,使得企业能够根据不同的业务场景适配更多的模型,从而更好地满足多样化的业务需求。
还有数据方面。目前业界成熟的方案是通过将数据转化为知识库,再利用RAG(检索增强生成)的方式赋能业务场景。DeepSeek在此基础上以其强大的数据分析能力和推理归因能力,为证券行业提供了更为便捷和高效的应用途径,有助于企业更好地挖掘数据价值,提升业务决策的准确性和效率。
第四是场景方面。通用大模型通常需要精心设计的提示词来引导其思考和输出,以达到可上线的业务效果。而DeepSeek-R1在推理过程中,会先根据输入的内容进行思考,然后再生成回答。在实际落地过程中,仅需要简单的提示词就能达到很好的效果,大大降低了企业级应用的门槛,加速了业务创新。此外,DeepSeek-R1在复杂推理方面相较于通用模型具有明显优势,能够结合结构化和非结构化数据,在投顾、投研、投资等业务中探索更复杂的场景,突破了简单知识库问答的限制,进一步拓展了业务场景的广度和深度。
这些影响已经具化到了银河证券的探索中,尤其是公司所构建的覆盖投顾服务全链条的智能中枢。
一方面,基于大模型的深度推理分析能力、智能知识调用能力与自我修正机制,结合银河证券自身沉淀的专业数据库、业务数据库与研究资源库,实现客户数据深度挖掘与精准画像,推动投顾服务与产品的精准推送,协助投资顾问快速生成多形式的客户综合金融解决方案,满足投资者“千人千面”的财富管理需求,给予客户更高效、更定制化的投资体验。
另一方面,深度融合自研投顾平台G-Winstar(问TA),基于大模型的复杂任务处理能力与推理能力,将DeepSeek等大模型能力应用于投顾展业的全链条。依据中国银河证券多年来的投顾展业经验,在服务的事前、事中、事后分阶段场景中逐步嵌入专家经验,实现多场景深度对接,确保大模型“答得有用、答得更好”。真正帮助一线投顾灵活地应对多样化展业场景需求。此功能上线,将大幅提升投资顾问专业服务质效。
看点三:哪些应用痛点还需关注?
基于和刘永旗的采访对话,以及通过近两周的沟通与调研,财联社记者注意到,目前证券业对大模型应用有几个关注的痛点与难点。
构建高质量知识库是券商面临的一个重要课题,大模型的强大能力高度依赖高质量、权威的数据支持,这要求券商内部的知识库体系和数据治理流程面向大模型的应用场景进行优化和调整。此外,部分标准化数据仍需外部补充,除了采购成本外,企业还需要解决外部数据的整合与管理问题。
高成本部署是券商面临的另一个痛点,完整参数模型需要强大的硬件支持,这不仅意味着额外采购高性能服务器,还需要经过严格的项目论证和审批流程。与此同时,大模型技术正处于快速演进阶段,在应用效果、建设成本、技术路线方面都在持续变化,这种节奏差异对于大模型技术布局提出了新的挑战。
合规与业务限制也是券商需要面对的挑战。对客户提供内容生成式服务存在明显障碍,直接面向客户的智能投顾需要备案,目前仅限内部助手型应用。
技术与业务协同方面也面临挑战,一方面,业务侧对新兴技术接受度不一,部分头部投研人员因早期参考性不足,对模型输出持谨慎态度,需要通过输出模型生成的思考过程增强可信度。另一方面,各业务条线需求分散且差异较大,定制化开发难度高,而大模型技术迭代日新月异,技术侧在满足需求的同时还需及时跟进业界最新进展提升服务能力。为此,需要搭建企业级大模型平台,统筹考虑全公司技术路线和场景建设,提供平台化通用能力支持,减少定制化成本。
可以看到,随着AI技术的不断进步和应用场景的不断拓展,证券行业在AI领域的探索和实践将为整个金融行业的发展提供有益的借鉴和参考,助力金融行业在数字化转型的道路上迈出更加坚实的步伐。
银河证券方面也表示,将进一步以AI作为放大专业价值的杠杆,以科技作为承载专业与服务温度的桥梁,在AI与投顾服务的深度融合中,以智能化的普惠金融服务为目标,积极推进前沿科技创新,始终“以客户为中心”,书写现代投行高质量发展的新时代答卷。