盘中宝

重大进展，谷歌发布新一代AI模型，OpenAI、谷歌在大模型能力上持续突破，机构称新一轮多模态大模型浪潮有望开启，这家企业旗下大模型涵盖音频、图像、视频等多模态能力，另一企业多模态预训练大模型已完成数据收集和清理，目前进入实验性训练阶段。

财联社资讯获悉，近日，谷歌宣布推出Gemini1.5。Gemini1.5建立在谷歌基础模型开发和基础设施的研究与工程创新的基础上，包括通过新的专家混合(MoE)架构使Gemini1.5的训练和服务更加高效。谷歌现在推出的是用于早期测试的Gemini1.5的第一个版本——Gemini1.5Pro。它是一种中型多模态模型，针对多种任务的扩展进行了优化，其性能水平与谷歌迄今为止最大的模型1.0Ultra类似，并引入了长上下文理解方面的突破性实验特征。

一、AI领域进展不断

2月16日凌晨，OpenAI在官网发布了创新性文生视频模型——Sora。从OpenAI在官网展示的Sora生成视频的效果来看，其在生成视频质量、分辨率、文本语义还原、视频动作一致性、可控性、细节、色彩等方面均表现得很出色。特别是可以生成最长1分钟的视频，超过Gen-2、SVD-XT、Pika等主流产品。

除OpenAI及谷歌在大模型能力上持续突破外，英伟达Nvidia近期发布了一款名为“ChatwithRTX”的工具，该工具专为GeForceRTX30系列和40系列显卡的所有者设计，让他们能够在WindowsPC上脱机运行AI聊天机器人，类似离线版ChatGPT。这款ChatwithRTX工具允许用户根据个人需求定制GenAI模型，其功能类似于OpenAI的ChatGPT。用户可以将该工具与文档、文件和笔记相连接，进而进行查询。

二、多模态大模型的新一轮浪潮有望开启

开源证券认为，当前AI技术已迅速越过文生文和Chatbot阶段，大举进入视频生成领域。从Pika、Gemini1.0到Sora和Gemini1.5，支持AI视频生成的AI多模态模型不断突破，特别是Sora能够理解和模拟现实世界的模型基础，有望成为实现AGI的重要突破节点。

浙商证券刘雯蜀进一步分析指出，2024年国内外厂商有望发布更加复杂的多模态大模型，实现文本、语音、图像以及音视频等多模态数据的复杂处理和交互。OpenAI发布Sora模型，有望开启多模态大模型的新一轮浪潮。

三、相关上市公司：万兴科技、易点天下、昆仑万维

万兴科技旗下“天幕”大模型是以视频创意类AI技术为核心的多媒体大模型，涵盖音频、图像、视频等多模态能力，将支撑公司在影视、广告、动画等内容创作领域的应用升级与拓展。

易点天下AIGC产品KreadoAI是公司对外的AI类产品，该产品包含了多模态模型的融合，包括文本生成、图生图、文本生成视频、语音生成、声纹克隆、数字人生成等，也包括了文字到广告创意图片及视频的生成能力。

昆仑万维的多模态预训练大模型已完成数据收集和清理，目前进入实验性训练阶段，后续将继续紧密跟踪国际前沿技术进展。

①周五异动！量子科技方向人气爆棚，券商预计市场空间有望超过8000亿美元，相关公司梳理； ②L2+高阶智能辅助驾驶迈入规模化应用阶段！汽车“智能化”趋势已来，业内这家公司持续大涨； ③ AI算力芯片快速迭代，多个环节公司均有望持续受益，栏目火速梳理上市公司。

龙头公司发布首个支持长文本、长图文、长语音大模型，机构称多模态大模型新一轮浪潮有望开启，这家企业自研的多模态垂类模型具备视频理解能力，相关解决方案已向知名客户交付，另一企业旗下大模型即将正式公测。

该省低空细分场景今日正式首飞，机构称“顶层设计+许可证+应用端突破”三重催化下低空经济前景广阔，未来或形成万亿级产业规模，这家企业中标了低空飞行服务平台项目，另一企业已开展低空游览等业务。

几乎所有传统产品都在全力拥抱“AI”，或将成为打开需求的关键技术突破，行业品牌出海+高端化进展如火如荼。这家公司细分产品全球出货量市占率稳居世界第二。

一季度出货量同比增超80%，该细分产品正处于从1-N快速增长渗透阶段，国内市场已连续4年同比增速超100%，机构称2024年有望成为行业放量元年，这家企业向多个客户供货，另一企业产品在相关领域用量或将提升5~10倍。