Kaggle,是machine learning 的 crowd-sourcing網站。有需要的公司可以在上面提出專案,讓大家去解,通常會給獎金,甚至是一份工作。已經在上面提出專案的包括
- Amazon,獎金$5000,Amazon.com - Employee Access Challenge
- Facebook,一份工作,Facebook Recruiting Competition、Facebook II - Mapping the Internet、Facebook Recruiting III - Keyword Extraction
- StumbleUpon,獎金$5000,StumbleUpon Evergreen Classification Challenge
以前在學校時上過 Machine Learning 的課,而 kaggle 提供了很棒的資源讓大家接觸更大規模的資料。這2周試玩 Kaggle,我先做了由 kaggle 所提供範例。
Titanic: Machine Learning from Disaster 這個練習有很詳細的說明,教大家使用 excel 做最基本的資料分析,或是改用 python 寫最基本的運算。最後是用 random forest 這項演算法來做機器學習。初學者從這項練習可以了解到進行機器學習時會遇到的狀況。
https://www.kaggle.com/wiki/GettingStartedWithPythonForDataScience