有個比賽能讓你快速入門并掌握機器學習和數據分析方法,實操實戰解決真實企業的商業問題,助你收獲實習、科研、留學offer。還有機會拿下高達50000美金的獎勵,和全球頂尖的數據科學家決戰光明頂。
學術活動介紹
Kaggle成立于2010年,是一個進行數據發掘和預測學術活動的在線平臺。從公司的角度來講,可以提供一些數據,進而提出一個實際需要解決的問題;從參賽者的角度來講,他們將組隊參與項目,針對其中一個問題提出解決方案,
最終由公司選出的最佳方案可以獲得5K-10K美金的獎金。 除此之外,Kaggle官方每年還會舉辦一次大規模的學術活動,獎金高達一百萬美金,吸引了廣大的數據科學愛好者參與其中。但是不同于傳統的低層次勞動力需求,
Kaggle一直致力于解決業界難題,因此也創造了一種全新的勞動力市場——不再以學歷和工作經驗作為唯一的人才評判標準,而是著眼于個人技能,為頂尖人才和公司之間搭建了一座橋梁。
只要你有才,只要你能解決問題,藤校offer和頂級互聯網公司入職加薪均有可能。
適合人群
適合對date science、date mining、machine learning感興趣的高中生;
有一定計算機背景的人群。是絕佳提升申請背景的賽事。
賽事說明
賽題示例
Allstate索賠預測挑戰?- 使用客戶的購物歷史記錄來預測他們購買的保險單
有害評論分類挑戰?- 預測維基百科上有害評論的存在和類型
Zillow獎?- 構建一個機器學習算法,可以挑戰Zesow,Zillow房地產價格估算算法
谷歌地標檢索挑戰 - 如果有圖像,您能在數據集中找到所有相同的地標嗎?
右鯨識別 - 識別航空照片中瀕臨滅絕的露脊鯨
大規模分層文本分類 - 將維基百科文檔分類為約300,000個類別之一
泰坦尼克號:從災難中進行機器學習,預測泰坦尼克號的生存幾率
房價預測:回歸方法
貓與狗:創建一種算法去區分貓與狗
紐約出租車行程持續時間:通過數據改善乘車時間預測
商店銷售預測
新用戶預定預測
基本流程
注冊賬號(一人只能有一個賬號)
選擇一個比賽項目
加入學術活動,理解項目需求
下載數據,訓練模型,得出結果
提交結果(一般只需提交預測結果,每天可多次提交)
一直到時間截至,評出最優者
獲獎的隊伍必須提交源代碼
注:上傳過一次結果之后,就直接加入了這場比賽。正式比賽中每個團隊每天有5次的上傳機會,然后就要等24小時再次傳結果,playground的是9次。
比賽技能要求
編程語言:最基礎的入門學者也得先學會初步使用一門編程語言。對于毫無基礎的新手,推薦使用Python,因為Python作為一種強大的膠水語言,可以迅速入門。
探索數據:除編程語言外,還需要學習如何探索性分析你手上的數據,這是進入數據科學的第一步。因為通常到手的數據都多到不可思議,你要學會取舍和迅速獲取最有用的信息。
模型訓練:熟悉使用機器學習庫,培養良好的習慣,為之后的工作做鋪墊實戰:從初級可以逐漸增加難度。
比賽形式
Classic:在比賽開始后,用戶可以訪問完整的數據集。并可以選擇在本地或在線進行建模、預測生成預測文件,最后提交預測結果。目前大多數比賽采取本形式。
Two-stage:分為第一階段和第二階段,第二階段建立在第一階段的結果上,第一階段完成才可參加第二階段。
Kernels:參賽者必須在線提交代碼,更加公平,使每個參賽者都使用相同配置的電腦。
參賽時間
全年滾動,隨時可以報名。
學術活動含金量
從留學申請者的角度來看:
對于申請Data Science相關專業的同學來講,大數據的走紅使得Data Science的申請競爭愈演愈烈,因此如何提升背景也是大家非常關心的問題。而Kaggle正好給大家提供了一個非常好的平臺,在這里人人有參與項目的機會,無論你的背景是什么,都可以通過選擇合適的項目來找到屬于自己的位置,利用自己的專業優勢,為整個team作出貢獻,豐富簡歷的同時也能學習一些干貨,為自己以后的學習打好基礎。而其在領域內的知名度足以讓你在眾多申請者中脫穎而出,絕對是申請利器!
從求職者的角度來看:
Kaggle提供了一個非常好的學習平臺,在這里你可以接觸到真正的業界案例,收獲實際的項目經驗,在每一個項目中不斷挑戰自己,甚至在Kaggle榜上占據一席之位,提高自己在業內的知名度,優秀的排位甚至可能帶來的非常好的工作機會。
同時,也可以認識一群志同道合的人,擴展自己的professional network,與業內最頂尖的高手互動,尤其是很多隊伍在比賽結束后都會公開自己的解法,如果這個項目恰好你參與過,為之投入過無數個日日夜夜,此時就是不可多得的學習機會。如果能在Kaggle這種高手云集的比賽中獲得一個還不錯的成績,
寫在簡歷上足以打動你今后的Boss,跳槽就翻倍的高薪工作指日可待!值得一提的是,雖然是匯集精英的社區,Kaggle的論壇氛圍很好,對新人非常友好,大家一定要多看Script多請教!

? 2025. All Rights Reserved. 滬ICP備2023009024號-1