【用語解説】学習不足（Underfitting）とは？

AIの学習が不十分だと、まるで赤ちゃんが言葉を覚え始めたばかりのように、物事を正確に理解できません。

猫と犬を見分けるのに、片方の写真が少なかったら、AIは犬と猫の違いをうまく覚えられません。

この「学習不足」がなぜ起こるのか、どうすれば防げるのかなど、AIの学習について詳しく解説いたします。

学習不足の概念

AIや機械学習において、学習不足（Underfitting）は重要な概念です。

これは、モデルがトレーニングデータから十分に学習できていない状態を指します。

学習不足が発生すると、モデルの予測精度が低くなり、新しいデータに対して正確な予測ができなくなります。
この状態は、モデルが単純すぎて、データの複雑なパターンや関係性を十分に捉えられていないことが原因です。

あるデータセットが複雑な非線形関係を持っているにもかかわらず、モデルとして単純な線形回帰を使用した場合、モデルはデータの本質を捉えきれず、正確な予測ができなくなります。
これが学習不足の典型的な例です。

学習不足は「過学習（Overfitting）」とよく比較されます。
過学習は、モデルがトレーニングデータに過度に適合し、学習したデータに対しては高い精度を示すものの、新しいデータに対しては適切に予測できない状態を指します。

以下の表は、学習不足と過学習の違いをまとめたものです。

学習不足を防ぐためには、以下のようなアプローチが有効です。

より複雑なモデルの使用
学習不足が発生している場合、より複雑なモデル（深層ニューラルネットワークやランダムフォレストなど）を使用することで、データの複雑なパターンを捉えることができます。
　
トレーニングデータの増加
より多くのトレーニングデータを収集することで、モデルはデータのパターンをよりよく学習することができます。
　
特徴量エンジニアリングの改善
モデルに提供する特徴量を見直し、重要な情報を捉えられるようにすることで、学習不足を改善できます。