嘿,你好,我是卡裡。
好久不見,你們有在想我麼?
不想就不想吧
反正我也沒有在想你
大家這兩天都被刷屏了吧
薛之謙復婚了。
薛之謙是誰?
薛之謙是那個唱認真的雪,一炮而紅了沒幾天的段子歌手
然後他離婚了
然後他又紅了
然後他復婚了
當然,看了一篇又一篇公眾號的卡裡
不會這麼憤世嫉俗
看了各式各樣的猜測
卡裡覺得挺有意思
有人說他們炒作
有人說他們為了買房
有人說他們是真愛
我願意理性地相信他們倆的故事是甜的
畢竟談戀愛這麼麻煩的事情
如果有一個合適又不需要多花功夫的人
當然選擇重修舊好
但其實看了這麼多
我還是比較喜歡
高嘉程的公眾號「用心罵人」裡面說的話
「就算薛之謙離婚真的是為了買房,人家離個婚,至少還能在上海買套房,你呢?」
簡直
直擊靈魂
嚇得卡裡趕緊扔掉了手機開始學習不得了的新知識
扔掉手機的前一秒
卡裡看到了一條不得了的朋友圈
點燃了卡裡說不定能買得起房的小火苗
這條朋友圈長這樣
Kaggle 不得了
這個獎金的金額又點燃了
人類對於「一夜暴富」這種原始衝動
的願望和期盼
$1,500,000 一道題
一百五十萬美金一道題
得到了還得了麼?
不過好像一百五十萬美金也沒什麼了不起
好像折算成人民幣
還是不夠在深圳買個房?
所以作為人類的小天使
卡裡今天決定跟大家淺談兩句Kaggle
如果你是Kaggle大神
你可以選擇往左猛滑一下屏幕
去幹點別的,別看了。
Kaggle 是什麼?
Kaggle是一個數據建模和數據分析競賽平臺。
企業和研究者可在其上發布數據,
統計學者和數據挖掘專家可在其上進行競賽以產生最好的模型。
這一眾包模式依賴於這一事實,
即有眾多策略可以用於解決幾乎所有預測建模的問題,
而研究者不可能在一開始就了解什麼方法對於特定問題是最為有效的。
Kaggle的目標則是試圖通過眾包的形式來解決這一難題,進而使數據科學成為一場運動。
簡單來說,
Kaggle就是一個平臺,
讓資本主義花錢僱傭你的數據智慧為他辦事。
Kaggle 通常會有怎麼樣的作用呢?或者說Kaggle上面會有怎麼樣的Project來給你做呢?
通常有以下幾種
Featured:商業或科研難題,獎金一般較為豐厚;
Recruitment:比賽的獎勵為面試機會;
Research:科研和學術性較強的比賽,也會有一定的獎金,
一般需要較強的領域和專業知識;
Playground:提供一些公開的數據集用於嘗試模型和算法;
Getting Started:提供一些簡單的任務用於熟悉平臺和比賽;
In Class:用於課堂項目作業或者考試。
一般建議新手都是從Getting Started 和Playground 兩個level的比賽開始做
畢竟一夜暴富這種事情
可能還是需要一步一步來
從領域上來劃分的話有以下幾種
從領域歸屬劃分:包含搜索相關性,
廣告點擊率預估,銷量預估,貸款違約判定,癌症檢測等。
從任務目標劃分:包含回歸,
分類(二分類,多分類,多標籤),排序,混合體(分類+回歸)等。
從數據載體劃分:包含文本,語音,圖像和時序序列等。
從特徵形式劃分:包含原始數據,明文特徵,
脫敏特徵(特徵的含義不清楚)等。
說這些分類其實是想說
這個平臺對於各類數據的涉獵是非常廣的
所以對於想在數據,機器學習或者是算法上有所造詣的朋友們
可以去查一查看一看
卡裡看了很多各式各樣的專欄呀blog呀
覺得都總結的非常好
很多乾貨
但卡裡給入門者的建議還是
去看看官網
畢竟原始開發文檔帶給你的資源
是最厲害的
研究一下到底有啥
自己有沒有興趣
然後再去做一些深度的研究
Kaggle 的各個project 還是主要以Python和R 為主,
Python 除了基本的語法外還是需要一些對應的庫numpy、scipy、scikit-learn(實現了ML的一些算法,可以直接用)、theano(DeepLearning的算法包)。
R 的話也就是用對應功能的一些Package。
如果用到深度學習的算法,cuda、caffe也可以用
但其實使用什麼程式語言,什麼平臺,什麼第三方庫都無所謂
只要你能把數據都搞定然後用很牛逼的算法做出project想要的結果,
你就是厲害的。
然後卡裡今天想再提一下獎金的事情
剛剛去看了下kaggle比賽的獎金榜單上前十名分別是這些
看到了麼
Zillow不再是最賺錢的Project了
政府爸爸才是最厲害的
看到這裡
你有沒有躍躍欲試
反正卡裡是非常想用出賣自己智慧的方式
一夜暴富的
如果你也和卡裡一樣有這種原始衝動
你也可以開始了解Kaggle
看看有沒有什麼你想做的project
給自己的定個小目標
從寫完project
到進入前50%
再到進入前25%
再到進入前10%
再到前5%
最後進入前三,拿錢,一夜暴富。
如果你想要找人陪你一起寫
你可以找個可以carry你的男朋友或者女朋友
或者你可以找個可以並願意carry你的朋友
如果你也覺得自己脫單比拿Kaggle前三還難
那我推薦你
看看這個
https://www.dataapplab.com/course/dscn/
我們的數據科學家訓練營除了教給你你需要的知識技能以外
我們還會帶你做各種project練手
最後帶你走進Kaggle
實力走近一夜暴富的夢想
9月16號實力開船
上不上船
就看你想不想贏了
如果你和卡裡一樣
是一條沒有錢但有夢想的鹹魚
你可以註冊我們本周末的公開課
如何進入Kaggle top 5% – TwoSigma Renthop 案例分析
(直接點,有詳細介紹和報名方式)
一個小時的公開課
雖然沒有數據科學家訓練營一樣
詳細的知識傳輸
但給你一個領進門的起步
還是可以助你飛翔的
別猶豫了
深圳上海的小房子們
都在跟你招小手手
記得給卡裡點個讚
然後點擊「閱讀原文」看看卡裡給你準備的小驚喜
❤️
「閱讀原文」 點這裡👇👇👇