56分钟前
来自 财联社
《科创板日报》4日讯,中国大模型创业公司阶跃星辰继开源 Step 3.5 Flash 模型后,又开源了这款 Agent 基座模型的预训练权重(Base)、中训练权重(Midtrain)以及配套的 Steptron 训练框架。《科创板日报》记者获悉,Step 3.5 Flash 采用稀疏 MoE 架构,总参数 1960 亿,但推理时仅激活约 110 亿参数,单请求代码任务下推理速度最高可达 350 TPS。该模型专为智能体(Agent)场景设计,在复杂推理和长链任务中表现出色,官方称其推理深度可媲美部分顶级闭源模型。截至目前,这款模型在 Hugging Face 上下载量已超 30 万次,并登上 OpenRouter Trending 第一名。而在知名开源项目 OpenClaw(被中国网友称为“小龙虾”)上,该模型排名已升至前二。(记者 黄心怡)