智启高质量数据集元年,紫光云加速数据价值释放

2025 年,无疑成为高质量数据集建设的元年,诸多政策出台影响其发展。2024 年 12 月,《关于促进数据产业高质量发展的指导意见》首次提出“高质量数据集”,支持企业开发高质量数据集。2025 年 2 月,高质量数据集建设工作启动会在京组织召开,推进落实“人工智能 +”行动,加快推动形成一批标志性成果,赋能行业高质量发展。2025 年 5 月,《数字中国建设 2025 年行动方案》提出“积极开展人工智能高质量数据集建设,建设交通、医疗、金融等行业高质量数据集”。2025 年 6 月,多地高质量数据集试点先行先试工作展开,高质量数据集进入加速期。
紫光云全栈工具与服务
助力高质量数据集建设
高质量数据集建设涵盖“数据需求、数据规划、数据采集、数据预处理、数据标注、模型验证”6 阶段,各阶段需按序开展并支持跨阶段反馈迭代。紫光云凭借其知识平台 + 数据平台 + 模型平台,覆盖高质量数据集建设所需技术工具集。在实施过程中,紫光云能够结合具体 AI 场景需求,有效支撑人工智能 + 业务开展,促进数据共享、提升数据质量、保障数据安全。
紫光云的高质量数据集建设实施方案具有鲜明特色。数据平台方面,紫光云打通纵向、横向、内外的数据通道,实现政府公共数据、行业数据和社会数据的汇聚,打造从数据资产管理、集成管理、计算存储、运营管理、质量管理的全流程端到端的数据链治理能力和安全能力,打破“信息孤岛”,形成数据资产,提高数据资源集中化、有序化水平。
知识平台方面,紫光云打破行业数据落地大模型的两大鸿沟,“数据到知识”和“知识的更新权限”,凭借知识采集引擎、知识加工引擎、知识更新管理、知识管理体系四大能力,让模型轻松使用私域数据,实现从一体化知识采集到加工到更新的全生命周期管理能力。
模型平台方面,涵盖数据预处理、模型搭建、训练优化、评估验证等全流程,助力高质量数据集高效开发。此外,紫光云还提供数据工程服务,包括高质量数据集制备服务以及申报支撑服务。
医疗行业高质量数据集建设
驱动行业创新升级
在医疗行业,紫光云助力高质量数据集建设,驱动行业创新升级。数据已成为人工智能行业应用落地的核心“护城河”。在算法趋同、算力普惠的背景下,高质量、高价值密度的数据资源构建起企业差异化竞争力。垂直领域的数据壁垒通过业务场景闭环持续积累,形成模型性能的代际优势。“数据 — 算法 — 应用”相互强化的生态闭环的形成,将构建难以复制的战略壁垒。

紫光云以客户需求为出发点,与客户共建共营医疗行业高质量数据集,通过搭建算力服务平台、数据平台、模型平台、知识平台,实现从“原始业务数据到高质量数据集到行业知识图谱到场景化 AI 应用”的完整闭环,真正实现了“算力闭环 + 数据闭环 + 应用闭环”。
紫光云具备完备的医学知识库制作能力,从采集到加工到生成,具有 70 + 种知识加工能力;具备模型训练语料库制备能力;具备医学知识图谱构建能力。实现了全市医疗数据汇聚和全市各级公立医疗卫生机构的互联互通,汇聚就诊记录、检验检查报告、体检报告、疫苗接种、妇幼保健、各类卫生健康等数据,建设了千亿级医疗高质量数据集。
紫光云将多年智慧城市数据运营、数字化服务的经验延伸到大模型私域落地领域,积极推动数据要素领域创新,将云南曲靖十年公共数据运营权落地。秉承“易用云、好用数、全赋智”理念,紫光云提供数据要素和大模型全流程解决方案,以云数智全栈能力助力政企数字化转型,加速释放新质生产力。在数字经济时代,紫光云正以创新科技为笔,书写高质量数据集建设的新篇章,为各行业的数字化转型注入强劲动力,推动经济社会高质量发展迈向新台阶。






版权声明
本文仅作者转发或者创作,不代表旺旺头条立场。
如有侵权请联系站长删除
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。