新浪浙江 综合

杭州钱江世纪城布局AI数据新高地,数搭国际数据开源社区正式发布

商讯

关注

确定不再关注此人吗

当前人工智能产业竞争逻辑悄然迭代,行业发展重心从算力、参数比拼,转向高质量数据的深耕角逐。5月18日,在钱江世纪城投资促进大会上,数搭国际数据开源社区(ZODA)正式发布。这座立足浙江、面向全球的AI数据基础设施,将补齐行业数据与评测短板,助力钱江世纪城打造AI数据与评测全球高地,为我国人工智能产业高质量发展夯实数据根基。

在AI研发全流程中,超八成时间耗费于数据处理环节,数据质量更是决定大模型性能的核心关键。为破解高质量数据稀缺、评测标准缺失等行业痛点,整数智能信息技术(杭州)有限责任公司牵头建设数搭社区,聚焦“数据+评测+专家生态”,填补全球开源生态行业空白。

依托“以数据筑基,搭建AI未来”的发展定位,数搭社区明确三大核心使命,构建高质量开源数据集、打造覆盖全部主流模型的核心评测基准、连接全球专家网络。运营模式上,社区创新采用“线上+线下+国际”一体化运营模式,线上搭建数据共享、模型排行、技术赛事平台;线下落地ZODA House,复刻顶尖科创社区交流模式,搭建产学研投融合桥梁;国际层面联动全球顶级开源基金会,打通国际化技术交流通道。

数搭社区的诞生,并非孤立的产业布局。它与钱江世纪城正在打造的芯模社区,构成了天然的互补关系。

芯模社区是钱江世纪城2025年正式启动的战略平台,聚焦国产AI芯片与算法模型的适配,致力于打造全国芯模联动发展示范区。依托芯模社区,2300P的智算算力已建成上线,80余种主流模型为企业提供低成本、高效率的研发环境。芯模社区解决的是“算力+模型”的问题——让国产芯片跑得稳、让模型适配快。

而数搭社区则专注于“数据+评测+专家生态”,为生态补上关键短板。高质量数据是训练优质模型的前提,权威评测是衡量模型能力的标尺。数搭社区提供数据和评测,芯模社区提供算力和适配,两者合在一起,就形成了一个完整的闭环:高质量数据训练出更聪明的模型,模型在芯模社区验证芯片性能,芯片的优化反过来支撑更大规模的数据处理。

“我们不只看AI模型在实验室里的表现,更要看它走进生产线后,能帮工人完成多少实际工作、提升多少生产效率。”整数智能副总裁、数搭社区负责人孟卓飞表示,未来,数搭社区致力于打通“产业—模型—数据”生态链,串联产业需求、模型训练和数据构建,助力数字经济与制造业数字化转型。

据了解,未来两年数搭社区将持续扩容生态规模,力争实现数据集下载量超2亿次、专家规模破百万、带动百亿级AI数据产业规模的发展目标。面向长远,数搭社区将依托钱江世纪城,打造全球人工智能开源生态的重要节点,实现从“技术跟随”到“生态引领”的跨越,构建自主可控、开放共赢的AI数据基础设施。(文/黄晓东 洪美娜;图/钱宸)

分享文章到:

相关新闻

推荐阅读

加载中...