①DeepSeek击碎“AI必须烧钱”滤镜,引发算力芯片、半导体设备制造商、能源股集体跳水; ②周一市场运行的核心逻辑:投资者开始对长期算力需求感到担忧; ③部分华尔街分析师坚持认为,模型效率的提升,更容易引发需求的井喷,从而引发对算力的更大需求,而不是降低。
《科创板日报》1月13日讯 素有“人工智能基石”之称的数据标注产业迎来政策支持。
今日,国家发展改革委等四部门发布《关于促进数据标注产业高质量发展的实施意见》(简称《意见》)。其中提出,到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%。
《意见》强调,培育一批数据标注龙头企业,鼓励通过资源整合、并购重组等方式做大做强,推动数据标注企业规模化、标准化、集约化发展。支持和鼓励科技创新型数据标注企业承担基础研究、技术攻关、产业应用等重点任务,提高产业链协同创新水平。
数据标注,也被称为数据标定、数据注释,是指对文本、图像、语音、视频等待标注数据进行归类、整理、编辑、纠错、标记和批注等操作,为机器学习和人工智能算法提供训练样本。
由于数据的质量和数量直接影响大模型的智能水平,因此数据标注也被视作人工智能的基石。在AI应用需求飞速提升的背景下,对数据标注的智能化要求也水涨船高。比如,在开展关键技术攻关方面,《意见》列举出三项数据标注领域的关键技术。
跨领域跨模态语义对齐:通过设计模型,使得来自不同领域、不同模态的输入能够在一个公共表示空间中表达。
4D标注:在传统的 3D 标注基础上,增加了时间维度的标注方式。例如在自动驾驶领域用于标注车辆、行人、交通标志等物体在不同时刻的位置和运动状态,帮助自动驾驶系统理解道路场景的动态变化。
大模型标注:为训练大型人工智能模型而对数据进行标记、注释等处理的过程。
如今,从自动驾驶到智能助手,几乎所有领域都需要大量数据训练以构建人工智能模型的精确判断。在挖掘数据标注需求方面,《意见》指出,要加大企业数据开发利用,围绕医疗健康、人力资源、数字贸易、自动驾驶、低空经济等场景,以业务创新拉动数据标注需求。
东北证券今日研报指出,近期国内外算力均迎利好在海外大厂的带动和国内厂商的推进下,国内以豆包、腾讯、360等为代表的AI应用会迎来大爆发,建议关注上游数据处理相关机会。
据《科创板日报》不完全统计,数据标注相关A股上市公司有: