①据字节跳动采购部消息,为满足快速增长的AI数据标注需求,抖音集团内容质量与数据服务平台拟寻找标注供应商,尤其是垂类资源丰富的供应商(如医疗、法律、教育等)。 ②山西证券指出,随着首个国家层面的系统性规划文件出台,数据标注产业有望迎来快速发展。
马斯克宣布Grok 3发布,Grok-3和Grok-3 mini在多方面的测试得分上都超过或媲美Gemini、DeepSeek和ChatGPT等对手。据悉,Grok 3接受了合成数据的训练,可以对其进行审查以实现逻辑一致性。
当下,人工智能范式正经历从“以模型为中心”向“以数据为中心”的转变。作为人工智能基础设施的“三驾马车”之一,数据是构建和优化AIGC模型的基石,也常被誉为人工智能领域的“燃料”。马斯克表示,现实世界中用于训练AI模型的数据几乎已经耗尽,合成数据是未来的解决方案。市场分析指出,合成数据作为一种大模型训练的“可再生能源”,具备获取成本低、质量高以及避免隐私侵犯的优点。目前,合成数据正在AIGC时代展现出巨大的价值潜力,被广泛应用于人工智能领域的各行各业,展现“人工智能+”的赋能作用。
据财联社主题库显示,相关上市公司中:
利亚德表示,动作大模型可助力智能体等完成合成数据、推理等融合计算,数据增强需要基于稳定的特征,公司已在尝试不同动作的合成方法,推理性能的提升也在优化。
星环科技表示,公司有研究和使用合成数据,同时在探索相关解决方案。公司的大数据开发工具TDS可按客户实际需求组合成数据开发、 数据治理、 数据运营套件,满足企业用户需求。