- 作成日 : 2025年11月13日
機械学習の「回帰」とは?分類との違い、代表的な種類・手法まで分かりやすく解説
機械学習における「回帰」とは、過去のデータをもとに、将来の売上や株価といった連続的な数値を予測する手法です。ビジネスにおける需要予測や価格設定など、様々な場面で活用されています。
この記事では、機械学習の回帰の基本的な考え方から、もう一つの主要な手法である「分類」との違い、そしてビジネスで使われる代表的な回帰モデルの種類まで、初心者の方にも分かりやすく解説します。
目次
そもそも機械学習における「回帰」とは何か?
「回帰」とは、過去のデータから規則性やパターンを見つけ出し、株価や気温、売上高といった「連続する数値」を予測するための機械学習の手法です。「回帰問題」とは、この回帰を用いて解決すべき課題のことを指します。
例えば、過去の広告費と売上の関係をAIに学習させ、「来月、広告費を100万円に設定した場合、売上はいくらになるか?」といった未来の数値を予測するのが、典型的な回帰の活用例です。
具体的な「回帰」の例
回帰は、私たちの身の回りの様々な予測に利用されています。
- ビジネス:過去の販売実績や天候、イベント情報などを基にした、将来の店舗の売上予測。
- 不動産:物件の広さ、築年数、最寄り駅からの距離などを基にした、不動産の価格査定。
- マーケティング:広告の表示回数やクリック数などを基にした、商品のコンバージョン数(成約数)の予測。
「分類」との決定的な違いは?
回帰が「数値を予測する」のに対し、分類は「カテゴリを予測する」という点に決定的な違いがあります。どちらも機械学習の「教師あり学習」というカテゴリに含まれる主要な手法ですが、何を予測したいかによって使い分けられます。
| 比較項目 | 回帰 (Regression) | 分類 (Classification) |
|---|---|---|
| 予測するもの | 連続的な数値 | 離散的なカテゴリ(クラス) |
| 出力の例 | 3,000万円, 25.5度, 150個 | 「犬」or「猫」, 「A」or「B」, 「合格」or「不合格」 |
| 質問の例 | 「この家の価格はいくら?」 | 「このメールはスパムか否か?」 |
統計学の「回帰分析」との違いは?
統計学の回帰分析が「原因と結果の関係性を説明すること」を主な目的とするのに対し、機械学習の回帰は「未知のデータに対する予測精度を高めること」を最優先します。
- 統計学の回帰分析:
目的は「説明・解釈」。 例えば、「広告費が売上にどれくらい影響を与えているか」という変数間の関係性を明らかにすることに重点を置きます。 - 機械学習の回帰:
目的は「予測」。 モデルの内部構造が複雑で解釈が難しくても、とにかく未来の数値を高い精度で予測できるモデルを構築することを目指します。
両者は使う手法に共通点も多いですが、その目的が異なると理解しておきましょう。
機械学習の回帰にはどのような種類・手法があるか?
単純な線形回帰から、より複雑な関係を捉えるランダムフォレストや勾配ブースティングまで、データの特性や求める精度に応じて様々な手法が使い分けられます。
① 線形回帰(単回帰・重回帰)
最も基本的で、古くから使われている回帰手法です。データが直線的な関係にあると仮定して予測モデルを作成します。説明変数が一つの場合を「単回帰」、複数の場合を「重回帰」と呼びます。
② 多項式回帰
データが曲線的な関係を持つ場合に利用される手法です。直線では表現しきれない、より複雑なデータの傾向を捉えることができます。
③ 決定木・ランダムフォレスト
「もしAが〇〇以上ならB、そうでなければC」というような、木の枝分かれのようなルールでデータを分割していくのが「決定木」です。そして、その決定木を多数組み合わせることで、より高い予測精度を実現するのが「ランダムフォレスト」です。
④ サポートベクター回帰(SVR)
分類問題で高い性能を発揮する「サポートベクターマシン」を、回帰問題に応用した手法です。複雑なデータに対しても、高い汎化性能(未知のデータへの適応力)を持つことが知られています。
⑤ 勾配ブースティング
決定木をベースに、予測の誤りを段階的に修正していくことで、非常に高い予測精度を実現するアンサンブル学習の手法です。Kaggleなどのデータ分析コンペティションで頻繁に用いられる「XGBoost」や「LightGBM」といったライブラリが有名です。
Pythonを使った回帰モデル構築の流れは?
Pythonのライブラリ「scikit-learn (サイキット・ラーン)」などを使うことで、データの準備からモデルの学習、評価、予測までを効率的に行うことができます。
専門家でなくても、大まかな流れを理解しておくことは重要です。
- STEP1:データの収集と準備
予測に必要な過去のデータを収集し、欠損値の処理や、AIが学習しやすい形式にデータ整形(前処理)を行います。 - STEP2:モデルの選択と学習
データの特性に合わせ、前述したような回帰モデルの中から適切なものを選択し、準備したデータをAIに学習(トレーニング)させます。 - STEP3:モデルの評価
学習させたモデルが、未知のデータに対しても本当に高い精度で予測できるかを、テスト用のデータを使って評価・検証します。 - STEP4:予測と運用
評価されたモデルを使い、実際に未来の数値を予測します。必要に応じて、モデルを実際のシステムに組み込んで運用します。
ビジネスの未来を「回帰」で予測する
本記事では、機械学習の「回帰」について、その基本から分類との違い、代表的なモデルの種類までを解説しました。
回帰は、売上予測や需要予測、価格査定といった、あらゆるビジネスシーンで未来の数値を予測するための強力なツールです。どのようなデータを基に、自社のどのような数値を予測したいかを考えることが、データ活用の第一歩といえるでしょう。
まずは「回帰」というアプローチがあることを知り、AIによるデータドリブンな意思決定の可能性を探ってみてはいかがでしょうか。
※ 掲載している情報は記事更新時点のものです。
※本サイトは、法律的またはその他のアドバイスの提供を目的としたものではありません。当社は本サイトの記載内容(テンプレートを含む)の正確性、妥当性の確保に努めておりますが、ご利用にあたっては、個別の事情を適宜専門家にご相談いただくなど、ご自身の判断でご利用ください。
関連記事
Copilotの画像生成機能とは?生成方法やプロンプトを解説
Microsoft Copilotは、文章作成やデータ整理に加え、画像生成AIとしても利用できる点が大きな特徴です。特に「Image Creator」機能を活用すれば、テキスト入力だけで目的に沿ったビジュアルを自動生成できます。 専門的なデ…
詳しくみるCopilot(旧Bing Chat)とは?ChatGPTとの違いや使い方を分かりやすく解説
Microsoftが提供するAIチャット「Copilot」は、その前身が「Bing Chat」という名称で知られており、最新情報の検索や画像生成に強いのが特徴です。WindowsやEdgeブラウザに統合されているため、目にする機会も多いので…
詳しくみるChatGPTエージェントとは?仕組み・活用方法・導入手順を解説
AIを活用した業務効率化が注目を集める中、特に話題となっているのが「ChatGPTエージェント」です。従来のAIが回答や文章生成にとどまっていたのに対し、ChatGPTエージェントは自律的に行動し、複雑なタスクを一貫して処理できる点が大きな…
詳しくみるChatGPTに課金するならどのプランがよい?金額と機能の差を解説
ChatGPTは、個人の生産性向上から社内システムへの組み込みまで幅広く活用できる一方で、プランや課金方法が多く、どれを選ぶべきか迷いやすいサービスです。 この記事では、ChatGPTの月額課金プランのそれぞれの違いに加えて、API料金との…
詳しくみるGoogleのAI「Gemini」とは?使い方から無料版と有料版の違いまで解説
Gemini(ジェミニ)とは、Googleが開発した最先端の生成AIモデルです。従来のAIが主にテキスト情報を扱っていたのに対し、Geminiはテキストと画像に加え、特定のモデルやAPI環境では音声や動画なども扱える、最初から複数の情報形式…
詳しくみるGemini 1.5 Proとは?特徴・性能・活用事例を徹底解説
Gemini 1.5 Proは、Google DeepMindが開発した大規模言語モデルであり、自然言語処理の精度や応用範囲を大きく広げました。その後継として登場したGemini 2.5 Proは、さらに高度な推論能力と大規模コンテキスト処…
詳しくみる