数据是人工智能的“粮食”,数据集的质量直接决定着大模型训练效果的上限。针对大规模行业数据集稀缺的问题,应构建高价值共享数据集机制、加大在数据清洗与数据标注领域的关键技术研发及加强高素质数据处理人才的培养。
《科创板日报》1月15日讯(记者 黄心怡) ChatGPT横空出世以来,AI已渗透至经济、社会与生活的方方面面。刚刚过去的2024年,中外AI及大模型在技术与产业落地上取得了令人瞩目的进展。新的2025年,AI必将继续成为推动各行业变革的关键力量。
在2025新年来临之际,财联社携手旗下《科创板日报》,推出“AI领先者心声・2025”新年特别报道。邀请中外人工智能领军者与行业精英一同回顾过去一年AI领域突破与创新;同时,展望新岁,深入探讨AI及其产业应用在未来的机遇与挑战。
库帕思CEO黄海清向《科创板日报》记者表示:
数据是人工智能的“粮食”,数据集的质量直接决定着大模型训练效果的上限。经由与众多企业机构的合作,我们看到垂类大模型的发展场景越细化,对数据质量的要求便越高,若数据存在噪声、缺失、错误等质量问题,将直接影响算法的训练效果及准确性。
高质量语料库的建设,离不开政府、企业、高校、科研机构以及社会各界的携手合作。故而,针对大规模行业数据集稀缺的问题,构建高价值共享数据集机制、加大在数据清洗与数据标注领域的关键技术研发及加强高素质数据处理人才的培养,将成为各行各业在未来人工智能垂类应用领域的“核心竞争力”。