多模态模型

电报财联社 10月01日 16:02

16:02 报告显示：中国具身智能产业市场规模2035年有望突破万亿元

财联社10月1日电，国务院发展研究中心撰写并于日前在京发布的《中国发展报告2025》显示，当前中国具身智能产业发展处于起步期，在具身智能大模型研发和产品制造方面具有较好基础，市场规模有望在2030年达到4000亿元、在2035年突破万亿元，并将引领带动交通物流、工业制造、商业服务等多个应用领域新质生产力进一步跃升。报告指出，中国既有视觉、语言、动作等多模态模型研发能力，又能够生产用于具身智能体的伺服系统、传感器、末端执行器等主要零部件，而且具备成本优势。报告建议优先聚焦共性难题开展关键技术攻关，根据产品成熟度分类拓展应用场景，在实践反馈中补齐安全短板，及时研究制定应对就业和伦理等问题的前瞻性措施，推动产业高质量发展和高水平安全良性互动。

阅读 3357497

多模态模型

电报财联社 09月19日 12:41

12:41 全球首个深度推理+多模态大模型“紫东太初”4.0发布

《科创板日报》19日讯，全球首个“深度推理+多模态”大模型——“紫东太初”4.0今日在武汉发布。《科创板日报》了解，中科曙光等生态伙伴依托中国首个AI计算开放架构为“紫东太初”4.0提供图文多模态模型训推、大语言模型训推等全链路智能算力支持。（记者 黄心怡）

阅读 3188947

多模态模型

电报财联社 09月16日 11:58

11:58 Kimi K2官方高速版API开启限时5折特惠

《科创板日报》16日讯，据Kimi开放平台消息，Kimi K2官方高速版API开启为期一个月的5折特惠。kimi-k2-turbo-preview是Kimi K2模型的高速版，模型参数与kimi-k2-0905一致，已提升至256K上下文。Kimi K2高速版的输出速度达60~100Token/s，是普通版的6倍左右。

阅读 2647325

多模态模型

科创板日报张真 09月01日 12:40

3D打印火出圈了？一众网友秀“成果” 幕后推手竟是这款AI模型

①在最新AI排行榜单中，Nano-banana以1362的分数位列第一，大幅领先于flux和GPT。
②据测试，Nano-banana能够同时驾驭多达13个图片素材，并将其全部融为一张图。
③华泰证券认为，从大模型到多模态已是商业化的必由之路，多模态大模型和应用发展的奇点将至。

阅读 1010876

多模态模型

电报财联社 07月10日 13:53

13:53 三星：今年将大幅提升Galaxy AI产品数量

《科创板日报》10日讯，三星电子移动通信部门总裁卢泰文表示，公司计划年内将搭载“Galaxy AI”功能的移动产品数量从去年的2亿部增至4亿部以上。他预测，现阶段以APP和触控为基础的智能手机将逐步向基于自主智能体和多模态模型的AI设备演进，并朝着更加个性化的方向发展。

阅读 2813672

多模态模型

电报财联社 05月17日 12:35

12:35 天津：加强核心算法技术研发

财联社5月17日电，天津市人民政府办公厅印发《天津市促进人工智能创新发展行动方案（2025-2027年）》。其中提出，加强核心算法技术研发。推动前沿基础理论研究，支持自然语言处理、机器视觉、深度学习、感知算法、大模型训练架构等基础算法研究，加强国产开源社区建设。巩固脑机交互技术优势，推动脑机交互与人机共融技术研发应用。推动应用技术研究，支持多模态模型、垂类模型、轻量化模型研发应用，鼓励开源模型的二次开发。支持人机协同、无人驾驶、车路协同、无人机群体智能、虚拟现实（VR）／增强现实（AR）、区块链等场景应用技术的研发。

阅读 3248402

多模态模型

科创板日报宋子乔 05月13日 15:23

字节迭代多模态大模型媲美谷歌新品智能体能力更强、推理成本更低

①其性能可达到与Gemini 2.5 Pro相当的水平；
②具备更强的通用多模态理解和推理能力；
③已在火山引擎上开放API供用户体验。

阅读 822339

多模态模型

电报界面新闻 04月29日 19:53

19:53 腾讯宣布重构混元大模型研发体系加大AI投入

财联社4月29日电，腾讯对其混元大模型研发体系进行了全面重组，主要围绕算力、算法和数据三大核心板块刷新团队部署，加码研发投入。此次调整后，腾讯成立了两个新的部门：大语言模型部和多模态模型部，分别负责探索大语言模型和多模态大模型的前沿技术，持续迭代基础模型，提升模型能力。同时进一步加强大模型数据能力和平台底座建设，其中数据平台部专注大模型数据全流程管理与建设，机器学习平台部则聚焦机器学习与大数据融合平台建设，为AI模型训练推理、大数据业务提供全面高效的PaaS平台底座，共同支撑腾讯混元大模型技术研发。

阅读 2718653

多模态模型

电报财联社 04月24日 12:46

12:46 智谱旗下多款大模型产品降价其中GLM-4-Plus降价九成

《科创板日报》24日讯，智谱宣布对旗下多款大模型产品进行价格调整， 其中，GLM-4-Plus降价90%，从50元/百万tokens降至5元/百万tokens（相当于每亿tokens 500元），较行业价格低92%。（记者 李明明）

阅读 2790775

多模态模型

电报财联社 04月15日 09:48

09:48 月之暗面Kimi发布新模型Kimina-Prover Preview

《科创板日报》15日讯，今日，月之暗面 Kimi 与 Numina 团队合作开发的数学定理证明模型 Kimina-Prover 推出预览版。据介绍，该模型在数学定理证明基准测试 MiniF2F上取得了80.7%的成绩，超过此前最佳水平 (SOTA)模型10.6%，创下新高。

阅读 2613052

多模态模型

电报财联社 04月12日 21:46

21:46 OpenAI：GPT-4本月底退役由4o完全替代

财联社4月12日电，OpenAI在其网站上表示，从4月30日起，GPT-4将被GPT-4o“完全替代”，但GPT-4将继续通过API提供使用。OpenAI称，“在面对面的评估中，它（4o）在写作、编码、STEM等方面持续超过GPT-4。”据美媒The Verge 10日报道，OpenAI下周将揭晓一系列新的AI模型，其中将包括GPT-4.1， 这将是4o多模态模型的改进版。OpenAI同时还将推出更小的GPT-4.1 mini和nano版本，以及o3“推理”模型和新的名为o4-mini的推理模型。

阅读 3441208

多模态模型

电报财联社 04月10日 11:13

11:13 Kimi开源多模态模型Kimi-VL、Kimi-VL-Thinking

《科创板日报》10日讯，今日，月之暗面Kimi开源轻量级视觉语言模型Kimi-VL和Kimi-VL-Thinking，新模型采用MoE架构，支持128K上下文，激活仅约30亿参数；多模态推理能力在多个基准测试中，超过10倍大小的大模型。

阅读 2703300

多模态模型

科创板日报宋子乔 03月28日 09:25

多模态又考验算力了！ChatGPT文生图功能太火爆奥尔特曼：GPU“冒烟了”

①OpenAI将暂时对ChatGPT生成图片的功能引入一些速率限制；
②让AI生成更精确、更高清的图像依赖于GPU的大规模并行计算；
③OpenAI因新功能面临的问题，折射了AI多模态技术发展中的资源与需求平衡难题。

阅读 684655

多模态模型

电报财联社 03月03日 09:01

09:01 智谱预告今年将全系列开源

《科创板日报》3日讯，《科创板日报》记者今日获悉，2025年将是国内大模型独角兽智谱的开源年，其很快会发布全新大模型（包括基座模型、推理模型、多模态模型、Agent等），并将其开源。（记者 李明明）

阅读 2610687

多模态模型

电报财联社 02月26日 09:29

09:29 文生视频概念股开盘走强当虹科技涨超10%

财联社2月26日电，当虹科技涨超10%，万兴科技、开普云、华策影视、因赛集团、虹软科技、中广天择、华扬联众等跟涨。消息面上，阿里巴巴于昨日晚间全面开源旗下视频生成模型万相2.1模型，视频生成、图像生成两大能力均获得提升。

阅读 2605928

多模态模型

电报澎湃新闻 02月21日 13:28

13:28 阿里云魔搭社区：首发阶跃星辰最新开源两款多模态模型已上架超4万个开源模型

财联社2月21日电，在2月21日开幕的全球开发者大会（GDC）上，阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型，包括基于300亿参数、全球参数量最大的开源视频生成模型Step-Video-T2V，以及业界首款产品级开源语音交互模型Step-Audio。截至目前，魔搭社区已上架超过4万个开源模型，涵盖LLM、对话、语音、文生图、图生视频等多个领域，是中国最大的AI模型社区。

阅读 3198357

多模态模型

电报财联社 02月18日 21:13

21:13 李彦宏：文心大模型4.5系列将开源是最强大的文心大模型

财联社2月18日电，在百度财报后的电话会上，百度董事长李彦宏透露，文心大模型4.5将开源，4.5将是百度有史以来最强大的大模型。他表示，开源4.5系列的决策源自于对技术领先地位的信心，开源将进一步促进文心大模型的广泛应用，并在更多场景中扩大其影响力，“但我想强调的是，无论开源闭源，基础模型只有在大规模解决现实问题时，才具备真实价值”。未来，百度将加速推动文心大模型的性能升级与成本降低。

阅读 2896432

多模态模型

电报财联社 02月10日 13:13

13:13 豆包：视频生成模型“VideoWorld”可仅靠视觉认知世界现已开源

视频生成实验模型“VideoWorld”由豆包大模型团队与北京交通大学、中国科学技术大学联合提出。不同于Sora 、DALL-E 、Midjourney等主流多模态模型，VideoWorld在业界首次实现无需依赖语言模型，即可认知世界。 目前，该项目代码与模型已开源。

阅读 2927094

多模态模型

电报财联社 02月05日 12:37

12:37 DeepSeek系列模型上线华为昇腾社区

《科创板日报》5日讯，DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区，支持一键获取DeepSeek系列模型，支持昇腾硬件平台上开箱即用，推理快速部署。（记者 黄心怡）

阅读 3100724

多模态模型

电报财联社 09月19日 14:10

14:10 通义万相大模型发布文生视频能力

《科创板日报》19日讯，在云栖大会期间，通义万相大模型发布文生视频能力。同时，通义千问新一代开源模型Qwen2.5发布，涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型，总计上架100多个模型。（记者 黄心怡）

阅读 3767627