四川首批8个人工智能高质量数据集正式发布

9月24日,在2024年“数据要素×”大赛四川分赛总决赛活动上,四川省首批8个人工智能高质量数据集正式发布。
此次发布旨在贯彻落实省委、省政府关于推进人工智能1号创新工程的决策部署,满足模型训练和优化数据需求,加快培育本土龙头企业和大模型集群,近期省发展改革委(省数据局)、省大数据中心组织开展了高质量数据集征集工作。经过现场调研和综合评估,遴选出四川省首批8个人工智能高质量数据集。
据介绍,高质量数据集是经过清洗、标注等数据处理后,在格式、质量等方面符合相关要求,以文本、图像、音频视频多模态呈现,可直接用于开发和训练人工智能模型的数据集,包含行业通识和行业专识数据集。
四川省首批人工智能高质量数据集充分利用四川省海量数据资源、严格按照国家有关标准和要求打造,包括文本75.69TB、图像20.35PB、音频22.83TB、视频1.2PB、3D模型62TB,可用于医药研制、商贸流通、公共安全、能源调度等各类应用场景,对推动四川省人工智能产业进一步建圈强链,加快进入全国人工智能第一方阵具有重要推动作用。
下一步,省发展改革委(省数据局)将持续支持和鼓励行业企业、数商和社会资本,整合公共数据、企业数据等各类数据资源,建设更多具有四川特色、符合国家标准要求的行业高质量数据集,并分批次予以发布。
    © 版权声明

    相关文章