Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
できない英語を駆使して に挑戦してみた 
2014年10月
目次と自己紹介と宣伝と 
1.kaggleって? 
2.実際に参加してみよう! 
3.小学生並の感想 
TOEIC最高510点 
最新は400点代(恥) 
英検4級取得(笑) 
21歳、学生です 
(android)アプリとか作ってますよ...
1.って?
世界のデータサイエンスオタクが集結 
企業や研究者がデータを投稿し、世界中の統計家や データ分析家がその最適モデルを競い合う、 予測モデリングおよび分析手法関連プラットフォーム 及びその運営会社である。(Wikipedia) 
上位入賞者に...
2.実際に参加してみよう! 
kaggle 
https://www.kaggle.com/
ログインをするとこんな画面に 
※プロフィール画像はGravatar経由で変更できます
Active Competitionsから選択選択ゥ! 
Featured 
予測モデリング 
Research 
リサーチ 
Playground 
金は出ねーよ 
Getting Start 
チュートリアル 
タイトル 簡単な説明 
残り...
Data Science+Scikit-learnに挑戦してみる
何書いてんだこれ?(英語勉強しましょう)
GettheDataからデータを入手します 
入手するには規約に同意し、 個人またはグループ参加を宣言する必要があります 
これは(または0としてラベル1)は、2つのクラスのオブジェクトを表す、40の特徴の合成データセットであ る。トレーニン...
練習なので特に考えずに分析します 
出力かくにん! 
よかった。
いざSubmit!! 
分析データを放り込む 
説明とかあれば 
Make a submissionから応募できます
ん・・・? 
たぶん提出フォーマットが違うでー的なエラー
Evaluationで提出フォーマットを確認できます 
こんな形式にしてねーってこと
応募すると結果がすぐに返ってくる! 
209チーム中第164位!(笑) 
oob_scoreと同じくらいのスコアですね 
モデルを改良→再度投稿→上位を狙う・・・という流れ
3.小学生並の感想
楽しそう(小並感) 
たくさんの生のデータに触れられる 
irisは授業でうんざりするくらい使いました 
即座に順位が反映されモチベーションに繋がる 
日本版kaggle「Crowd Solving」は0時集計だった気がする 
新しい...
Upcoming SlideShare
Loading in …5
×

できない英語を駆使してKaggleに挑戦してみた

4,830 views

Published on

Published in: Technology

できない英語を駆使してKaggleに挑戦してみた

  1. 1. できない英語を駆使して に挑戦してみた 2014年10月
  2. 2. 目次と自己紹介と宣伝と 1.kaggleって? 2.実際に参加してみよう! 3.小学生並の感想 TOEIC最高510点 最新は400点代(恥) 英検4級取得(笑) 21歳、学生です (android)アプリとか作ってますよ! できない英語
  3. 3. 1.って?
  4. 4. 世界のデータサイエンスオタクが集結 企業や研究者がデータを投稿し、世界中の統計家や データ分析家がその最適モデルを競い合う、 予測モデリングおよび分析手法関連プラットフォーム 及びその運営会社である。(Wikipedia) 上位入賞者には賞金が出るものもある 実績とか付くらしい その実績がすごい人はすごいカンファレンスに 招待とかされることもあるらしい 就活前の学生とかアピールになるんじゃね?(適当) ※私の就活は無事終了しました 無料だしやらなきゃ損!
  5. 5. 2.実際に参加してみよう! kaggle https://www.kaggle.com/
  6. 6. ログインをするとこんな画面に ※プロフィール画像はGravatar経由で変更できます
  7. 7. Active Competitionsから選択選択ゥ! Featured 予測モデリング Research リサーチ Playground 金は出ねーよ Getting Start チュートリアル タイトル 簡単な説明 残り日数 参加数 賞金
  8. 8. Data Science+Scikit-learnに挑戦してみる
  9. 9. 何書いてんだこれ?(英語勉強しましょう)
  10. 10. GettheDataからデータを入手します 入手するには規約に同意し、 個人またはグループ参加を宣言する必要があります これは(または0としてラベル1)は、2つのクラスのオブジェクトを表す、40の特徴の合成データセットであ る。トレーニングセットは、1000サンプルを有しており、テストセット9000を有している。(google翻訳)
  11. 11. 練習なので特に考えずに分析します 出力かくにん! よかった。
  12. 12. いざSubmit!! 分析データを放り込む 説明とかあれば Make a submissionから応募できます
  13. 13. ん・・・? たぶん提出フォーマットが違うでー的なエラー
  14. 14. Evaluationで提出フォーマットを確認できます こんな形式にしてねーってこと
  15. 15. 応募すると結果がすぐに返ってくる! 209チーム中第164位!(笑) oob_scoreと同じくらいのスコアですね モデルを改良→再度投稿→上位を狙う・・・という流れ
  16. 16. 3.小学生並の感想
  17. 17. 楽しそう(小並感) たくさんの生のデータに触れられる irisは授業でうんざりするくらい使いました 即座に順位が反映されモチベーションに繋がる 日本版kaggle「Crowd Solving」は0時集計だった気がする 新しいモデルに出会える (ぶっちゃけ機械学習そのものもここで知ったし) kaggle公式で答えのデモとかやってくれるらしい 掲示板があったので 意見交換ができる(ジャパニーズ論外) やっぱり世間的にはRかpython(pandas)と実感 ところでkaggleって何て読むの? you tube聞いた限り「かぐぅー↑る」って聞こえた 結論:Let’s enjoy !!

×