津滨网讯(记者 王晨露)日前,在“2024天津数据基础设施建设主题峰会”上,天津市数据局发布了天津市第二批行业高质量数据集名单(共100个),滨海新区数据局推荐的10家单位22个行业高质量数据集,全部入选天津市第二批行业高质量数据集。
此次入选的22个行业高质量数据集涵盖了工业制造、人工智能、医疗健康、教育、城市治理、现代农业、文化旅游、交通运输等行业领域,类型包括文本、音频、图形图像、视频等多种模态,数据集可以按照特定标准,依次开展数据采集、数据清洗、数据归类和数据标注等智能化处理,具备较为完善的更新和安全维护机制,是新区在重点领域行业数据集建设的特色和成果。
据悉,今年6月,天津市数据局公开发布天津市第一批行业高质量数据集,新区一共9家企业11个数据集成功入选,其中,基于隐私计算技术政务流通数据集、恒达文博文旅•科普基础数据集等多个数据集为国内首次公开发布,恒达文博文旅•科普基础数据集规模超300TB,具有5种以上模态数据,已支撑训练了基于ChatGLM等先进架构的大语言模型,具有极高的数据应用价值。
下一步,区数据局将积极配合市级部门,依托产业、科技、人才等优势,持续支持鼓励行业企业、数商和社会资本,整合通用、政用、商用数据资源,加速提升数据供给能力,开发更多细分领域行业数据集,更好发挥“数据要素×”效应,驱动数字经济高质量发展,服务新时代“四宜”美丽“滨城”建设。