何度も調べなおしているバイアスとバリアンスについて、また調べたので 簡単ではあるが記録しておく。
バイアス
- 作成したモデルから得られる予測データが学習データとの差
- 大きいときは、モデルが硬すぎて、データにフィットできないアンダーフィッティングとなっている
バリアンス
- 作成したモデルが学習データによりどれぐらい変化するか
- 学習データをひとつ増やすことでどれだけモデルが変化するか
- 大きいときは、モデルが柔らかすぎて、学習データには非常にフィットするが、学習データに含まれないデータにはフィットできないオーバーフィッティングが起こる
一般的に、バイアスとバリアンスはトレードオフなので、 バイアスもバリアンスも両方確認して、どちらも小さくなるようなモデルを探すことが重要