中商情报网讯:数据标注是对未经处理的语音、图片、文本、视频等数据进行转义、打点、拉线、拉框等操作,将这些数据标注为电脑可以识别的信息,然后上传到数据库,以供人工智能使用。随着人工智能技术的不断进步和应用场景的拓展,数据标注产业将迎来更加广阔的发展空间和市场机遇。
一、数据标注的定义
数据标注,也被称为数据标定、数据注释,是指对文本、图像、语音、视频等待标注数据进行归类、整理、编辑、纠错、标记和批注等操作,为机器学习和人工智能算法提供训练样本。由于数据的质量和数量直接影响大模型的智能水平,因此数据标注也被视作人工智能的基石。数据标注的方法和类型多种多样,包括但不限于以下几种:
资料来源:中商产业研究院整理
二、数据标注行业发展政策
数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业。培育壮大数据标注产业对于提升数据供给质量,推动人工智能创新发展具有重要支撑作用。为促进数据标注产业高质量发展,发展改革委等四部门发布了《关于促进数据标注产业高质量发展的实施意见》,提出到2027年,数据标注产业规模大幅跃升,培育一批具有影响力的科技型数据标注企业,形成相对完善的数据标注产业生态。
资料来源:中商产业研究院整理