2021-10-11
Kaggle 大数据竞赛
美国知名大学认可,更有含金量 / 培训和锻炼学生的效率意识和全局规划意识 / 对于未来想从事计算机相关工作的人有很大的提升作用
Kaggle 大数据竞赛
一 . 比赛简介
Kaggle 创立于 2010 年,是全球最大的数据科学社区和数据科学竞赛平台, 2017 年被 Google 收购。 Kaggle 以数据挖掘起家, 为了快速高效的解决最棘手的问题,该平台发布了众多数据科学、机器学习相关的竞赛。 Kaggle 的多数竞赛由企业或者研究机构 发布,以竞赛奖励的方式向全球征集解决方案,通过众包的方式解决建模问题,诸如 Google 、 Facebook 、 Microsoft 等知名科 技公司均在 Kaggle 上举办过数据挖掘比赛。对参赛者来说,他们不仅有机会接触丰富的真实数据,解决实际问题,角逐名次, 赢取奖金。每年, Kaggle 官方还会举办一次大规模的竞赛,奖金高达一百万。 Kaggle 一直致力于解决业界难题,不以学历和工 作经验作为唯一的人才评判标准,而是着眼于个人技能,为顶尖人才和公司之间搭建了一座桥梁。 Kaggle 竞赛平台:只要你有才, 只要你能解决问题,全球顶尖高校 offer 和顶级互联网公司入职加薪均有可能。
二 . 比赛规则
1. 比赛语言:英文
2. 比赛时间:全年滚动发布,具体可参照官网信息
3. 参赛资格
对数据科学、数据挖掘、机器学习感兴趣的高中生
有一定计算机背景的大学生
4. 竞赛类型
乍看之下, Kaggle 竞赛的参与门槛极高,但其实, Kaggle 对初学者也是十分友好的,从 Kaggle 提供的官方分类来看, 其难度从初学到高阶以及求职均有涉及。最常见的竞赛可以划 分为以下类型:
Featured : Kaggle 最著名的比赛类型,适合数据科学高 手参与。题目都是全面的机器学习问题,难度较高,通常 是商业或科研难题,奖金池最大
Research :科研和学术性较强的比赛,同样适合数据科学 高手参与,以实验研究为主要方向的竞赛,一般需要较强 的领域和专业知识,奖金相比 Featured 较少
Getting Started :适合基础入门选手,与 Featured 竞赛 结构类似,但没有奖金,以初学者项目学习积攒经验为主
Recruitment :适合想要去发布公司求职的人,以各大公 司需要招募相关职业为主,比赛的奖励为面试机会
Playground :提供一些公开的数据集用于尝试模型和算法
Masters :大师级别的比赛,难度最高,项目也最少
Annual : 有 两 种 类 型 的 年 度 比 赛: March Machine Learning Competition , 自 2014 年 以 来, 该 比 赛 每 年都在美国大学篮球锦标赛期间举行; Santa-themed Optimization Competition ,每年在圣诞节前后举行一次
5. 竞赛流程
a. 注册账号(一人只能有一个账号)
b. 选择想要参赛的项目
c. 下载题目的数据( rain 数据集,用来优化模型; test 数据 集,用来测试优化好的模) test 的结果就是要提交的结果, 提交之后就代表正式参赛,会在网上显示排名(每天可多 次提交)
d. 直到时间截止,评出最优者
e. 获奖的队伍必须提交源代码(队伍之间不能私自分享代码 或者数据)
注:可以以个人或组队的形式参加比赛,在参赛时可以相互分 享经验。
6. 竞赛要求
编程语言:最基础的入门学者也需要学会初步使用一门编 程语言。对于毫无基础的新手,推荐使用 Python ,因为 Python 作为一种强大的胶水语言,可迅速入门
探索数据:光有编程语言是不够的,还需要学习如何探索 性分析你手上的数据,这是进入数据科学的第一步。因为 通常到手的数据都多到不可思议,你要学会取舍和迅速获 取最有用的信息
模型训练:熟悉使用机器学习库,培养良好的习惯,为之 后的工作做铺垫实战,从初级可以逐渐增加难度
三 . 奖项设置
Kaggle 奖牌赛只有前 10% 的队伍才有可能拿到最后的奖牌
前 10% 可以拿到铜牌
前 5% 可以拿到银牌
前 20 名可以拿到金牌
前 3 名有奖金
四 . 参赛须知
全国热线: 4008-210-259