开发者&在杭州,我们逛了一家“数据博物馆”( 二 )


而这正是阿里云天池今年重磅升级之后,启动的大规模数据开源计划。
天池大动作为哪般?又是来自真实行业大批量数据集的开源,又是建立行业benchmark,阿里云天池到底图什么?
众所周知,对于数据挖掘/机器学习这些学科,高质量数据集可以说是必不可少的生产资料。
但以高校学生为代表的青年AI开发者,很难接触到大量真实有效的数据,因此也就很难快速提升自身技术实践能力。
而与真实业务场景的脱节,带来的问题还不止于此。
比如,学界和业界在研究目标上往往不同。学界可能更加关注一些确定条件下的确定指标,而业界则会从成本和收益的角度去思考问题。
在云栖大会期间举办的天池数据青年团聚上,达摩院算法专家罗浩博士就谈到:
翻译模型准确率指标从70%提升到80%,在学界是足以发表论文的优秀成果,但对于产业界,就算一百句话都只翻错了一两个单词,还是需要人工全部重译,利润提升不大。
开发者&在杭州,我们逛了一家“数据博物馆”
文章插图
针对这些问题,天池开启大规模数据集开源计划,希望通过提供工业界的最真实的业务数据,降低青年开发者接触和使用科研数据的门槛。
再结合行业实际的竞赛,使开发者能真正研究和解决实际的工业场景中所面临的问题。
这样的举措,其实已见实效。阿里云天池大赛负责人王听介绍:
过去7年中,天池已经举办了400多场高规格的数据科学竞赛。其过程中,青年开发者不仅提升了自身的技术实践能力,同时也孵化出了优秀解决方案,甚至已经有直接反哺产业的案例。
也因此,现在,天池平台上逐渐聚集起90万+AI开发者,覆盖98+国家和地区、4300+海内外高校,成为了中国最大的人工智能开发者社区。
基于这样的背景,阿里云天池也就有了进一步扩大生态的空间:聚合起青年开发者,众智众创,为行业解决业务痛点,并为社会培养和输送人才,打造更完整的AI开发者创新生态,弥合从高校到产业的鸿沟。
开发者&在杭州,我们逛了一家“数据博物馆”
文章插图
天池变了,不再仅仅局限于比赛层面,而是从教育资源、计算资源、数据资源等更多的角度出发,面向青年开发者提供分享、互动、成长的社区阵地。
这样的转变,其实也正迎合了AI发展的大势之下,青年人才更低门槛进入到AI行业的需求。
而据天池方面透露,下一步,他们还将积极参与并致力于数据标准制定和行业标准数据集的建设,进一步服务于AI产业的发展。
那么,你又是否看好呢?
天池官网:
https://tianchi.aliyun.com/
— 完 —
量子位 QbitAI · 头条号签约