SEが最近起こったことを書くブログ

ITエンジニアが試したこと、気になったことを書いていきます。

Udemyの「実践データサイエンス&機械学習 with Python -統計学の基礎からビッグデータまで-」を受講しました

Udemyの「実践データサイエンス&機械学習 with Python -統計学の基礎からビッグデータまで-」を受講したので、 ブログに記録を残す

この講座で学びたかったこと

  • 機械学習の必要最低限の知識
    • 自分には何の知識が足りないかを理解する

講座の感想

  • 浅く広くではあるが、機械学習について多くのことを学べた
  • Pythonが2系だったのが、すこし残念に感じた

講座でためになったこと

  • アンサンブル学習について理解が甘いことがわかった
    • バギング
    • ブースティング
  • Apache Sparkを利用した実装が全く分かってないことが分かった
  • A/Bテストの落とし穴が非常に参考になるコンテンツだった
    • どれも考えてみれば、当たり前とも考えられるが、自分は無知で具体的な事象の名称を全然知らなかった
    • novelty effect
      • 目新しさにより、一時的に効果を高めること。時間が経過すると、効果が小さくなること。
      • 時間が経過してからのデータと従来のデータを比べるように気を付ける必要がある
    • 季節効果
    • 選択のバイアス
    • 帰属の誤り

これからどのように生かすか

  • Apache Sparkを動かしたことがないので、一度環境を作成して動かしてみる
  • A/Bテストの落とし穴で出てきたキーワードについてもう少し調べて、ちゃんと理解する