Udemyの「実践データサイエンス&機械学習 with Python -統計学の基礎からビッグデータまで-」を受講したので、 ブログに記録を残す
この講座で学びたかったこと
- 機械学習の必要最低限の知識
- 自分には何の知識が足りないかを理解する
講座の感想
講座でためになったこと
- アンサンブル学習について理解が甘いことがわかった
- バギング
- ブースティング
- Apache Sparkを利用した実装が全く分かってないことが分かった
- A/Bテストの落とし穴が非常に参考になるコンテンツだった
- どれも考えてみれば、当たり前とも考えられるが、自分は無知で具体的な事象の名称を全然知らなかった
- novelty effect
- 目新しさにより、一時的に効果を高めること。時間が経過すると、効果が小さくなること。
- 時間が経過してからのデータと従来のデータを比べるように気を付ける必要がある
- 季節効果
- 選択のバイアス
- 帰属の誤り
これからどのように生かすか
- Apache Sparkを動かしたことがないので、一度環境を作成して動かしてみる
- A/Bテストの落とし穴で出てきたキーワードについてもう少し調べて、ちゃんと理解する