Kaggle是一個(gè)舉辦機(jī)器學(xué)習(xí)學(xué)術(shù)活動(dòng)的社區(qū),一個(gè)可以很好的發(fā)展和實(shí)踐你的技能以及展示你的能力的機(jī)器學(xué)習(xí)與數(shù)據(jù)分析平臺(tái)。今天主要對(duì)Kaggle學(xué)術(shù)活動(dòng)經(jīng)典案例深度剖析-‘’水下海星檢測(cè)‘’。
比賽名稱:Tensorflow - Help Protect the Great Barrier Reef
https://www.kaggle.com/c/tensorflow-great-barrier-reef
比賽類型:計(jì)算機(jī)視覺、目標(biāo)檢測(cè)
本文整理了比賽論壇中高分的思路解析,希望對(duì)大家有幫助。
使用什么模型?
本次比賽可以算一個(gè)小目標(biāo)檢測(cè)任務(wù),且檢測(cè)模型需要有較高的精度。在本次比賽中比較適合的模型是:
- YOLOV5
- YOLOX
具體模型的預(yù)測(cè)細(xì)節(jié)可以參考:
https://www.kaggle.com/remekkinas/yolox-inference-on-kaggle-for-cots-lb-0-507/
具體模型的訓(xùn)練過程可以參考:
kaggle.com/ammarnassanalhajali/barrier-reef-yolov5-training
這里模型本身是否存在精度上限的差異?從論壇討論我們得出模型并不是本次本次比賽的關(guān)鍵。
現(xiàn)在排行榜第七名分享,他只是用了10折的YOLOV5模型,訓(xùn)練了12個(gè)Epoch。
https://www.kaggle.com/c/tensorflow-great-barrier-reef/discussion/290757
具體模型配置?
如果使用YOLOV5,那么如何選擇具體的版本呢?這里建議選擇YOLOV5-L或者YOLOV5-X,模型太小最終的精度不會(huì)特別好。

這一點(diǎn)已經(jīng)被網(wǎng)友驗(yàn)證:https://www.kaggle.com/c/tensorflow-great-barrier-reef/discussion/294205

圖像具體分辨率?
輸入圖像的尺寸建議越大越好,但越大帶來的顯存消耗也越大。這里建議長(zhǎng)邊為1280的像素即可。
當(dāng)然模型也可以在較小的尺寸上訓(xùn)練,然后在大尺寸上繼續(xù)微調(diào)。
具體的數(shù)據(jù)擴(kuò)增方法
一方面可以使用YOLO內(nèi)置的數(shù)據(jù)擴(kuò)增方法,另一方面也可以使用數(shù)據(jù)增強(qiáng)的方法來增加水下數(shù)據(jù)的可見性。
具體可以將其視為一種數(shù)據(jù)增強(qiáng)的方法,使用GAN模型來完成預(yù)處理。
https://www.kaggle.com/c/tensorflow-great-barrier-reef/discussion/290584
更多賽事信息及參賽經(jīng)驗(yàn)分享,請(qǐng)掃碼添加翰林顧問老師詳細(xì)咨詢
還有不定期的高能講座等你來參加!



