发布时间:2025-06-01 11:00:58 来源:AI视频贴吧
AI行业顶级盛会2024北京智源大会开幕,发布“北京人工智能数据运营平台”,有助于构筑重要的数据基础,支持多种数据标注和汇聚形式。
6月14日,AI行业顶级盛会2024北京智源大会正式拉开帷幕。作为大会的重要组成部分,智源大会“人工智能+数据新基建”论坛同步召开。大会现场发布了“北京人工智能数据运营平台”(包括平台上线、重磅数据集开源和数据工具FlagData3.0),并启动了“行业数据集—场景应用创新计划”,为千行百业大模型落地构筑重要的数据基础。
“北京人工智能数据运营平台”是在国家发展改革委、国家数据局指导下,由市发展改革委主导,在市委网信办、市科委、市经信局、海淀区**、中国网络空间安全协会人工智能安全治理专委会等单位支持下,由智源研究院牵头与京能数产等单位共建推动成立开放型数据运营平台。
平台在实现数据的汇聚管理、处理与加工等功能基础上,能够提供多种模态的数据标注功能,支持多种数据汇聚和使用形式。目前平台已汇聚超过700万亿字节的通用数据集和4.33万亿字节的行业数据集,未来还将不断扩充数据规模,为大模型行业发展提供坚实的数据支撑。
“这次开源的行业数据集,几乎每一项都远超全球已经开源的该行业数据集总和,是全球最大的多行业中英双语数据集。”智源研究院副院长兼总工程师林咏华说,目前数据集包含医疗、教育、法律、新闻等18类行业数据,未来将进一步扩展到30类左右。
目前,数据运营平台支持开源开放、积分共享、数算一体3种数据运营模式。“开源开放”模式允许用户在遵守使用协议的前提下自由下载使用;“积分共享”模式面向数据工作组内的成员,根据数据贡献实行积分制,即成员单位贡献数据,按照计分标准获取相应积分,同时获得共享数据的权益;“数算一体”模式针对高价值数据,仅在平台上进行数据加工、训练使用,保证数据不出安全域。
据介绍,依托数据运营平台,海淀区会同智源研究院等单位积极推动政务、社会与企业数据开放共享,打破数据孤岛。同时探索建设北京数据基础制度先行区,统筹布局算力与数据存储基础设施,为数据资源创新应用提供技术与制度保障。
未来,海淀区将以加速构建具有全球影响力的人工智能创新策源地和产业高地为目标,通过整合包括数据要素和应用场景等多方资源,推动人工智能技术迭代发展与落地应用,以高质量数据要素驱动人工智能技术创新突破,为实现科技强国贡献力量。
未来将扩充数据规模,推动数据基础制度建设,加速人工智能技术创新与应用,为科技强国贡献力量。
热门推荐
2024北京智源大会AI行业盛典:人工智能数据运营平台发布
6月14日,AI行业顶级盛会2024北京智源大会开幕,发布“北京人工智能数据运营平台”,有助于构筑重要的数据基础,支持多种数据标注和汇聚形式。未来将扩充数据规模,推动数据基础制度建设,加速人工智能技术创新与应
2025-06-01
重庆实现人工智能自动选矿
当人工智能和传统产业选矿业相遇,会擦出什么火花?6月11日,记者从重庆市地质矿产测试中心获悉,该中心研发团队自主研发出全市首台数字化智能重选摇床(以下简称智能重选摇床),可通过人工智能视觉识别,配合数字
2025-06-01
苹果智能新时代来临,智能AI陷阱如何规避?必看!
本文介绍了苹果发布产生式人工智能愿景的内容,探讨了其背后的风险与挑战,以及苹果在隐私方面所做的努力。苹果希望通过个性化的人工智能建议来实现差异化,同时保护用户隐私。
2025-06-01
人工智能时代,高职教育如何应对
福建信息职业技术学院教师指导学生使用无线连接控制车辆运动。学校供图在人工智能(AI)技术日新月异的今天,职业教育正面临着前所未有的机遇与挑战。如何调整专业结构、创新教学方法,以适应人工智能时代对高素
2025-06-01
多地出台政策,提速人工智能产业布局,重点方向聚焦
近年来,各地积极布局人工智能产业,抢抓发展先机,加快建设现代化产业体系,加快人工智能等前沿技术研发和应用推广。多地出台扶持政策,深圳、北京、上海等城市陆续推出相关政策举措,推动人工智能产业快速发展。
2025-06-01