- 作成日 : 2025年11月13日
機械学習の「回帰」とは?分類との違い、代表的な種類・手法まで分かりやすく解説
機械学習における「回帰」とは、過去のデータをもとに、将来の売上や株価といった連続的な数値を予測する手法です。ビジネスにおける需要予測や価格設定など、様々な場面で活用されています。
この記事では、機械学習の回帰の基本的な考え方から、もう一つの主要な手法である「分類」との違い、そしてビジネスで使われる代表的な回帰モデルの種類まで、初心者の方にも分かりやすく解説します。
目次
そもそも機械学習における「回帰」とは何か?
「回帰」とは、過去のデータから規則性やパターンを見つけ出し、株価や気温、売上高といった「連続する数値」を予測するための機械学習の手法です。「回帰問題」とは、この回帰を用いて解決すべき課題のことを指します。
例えば、過去の広告費と売上の関係をAIに学習させ、「来月、広告費を100万円に設定した場合、売上はいくらになるか?」といった未来の数値を予測するのが、典型的な回帰の活用例です。
具体的な「回帰」の例
回帰は、私たちの身の回りの様々な予測に利用されています。
- ビジネス:過去の販売実績や天候、イベント情報などを基にした、将来の店舗の売上予測。
- 不動産:物件の広さ、築年数、最寄り駅からの距離などを基にした、不動産の価格査定。
- マーケティング:広告の表示回数やクリック数などを基にした、商品のコンバージョン数(成約数)の予測。
「分類」との決定的な違いは?
回帰が「数値を予測する」のに対し、分類は「カテゴリを予測する」という点に決定的な違いがあります。どちらも機械学習の「教師あり学習」というカテゴリに含まれる主要な手法ですが、何を予測したいかによって使い分けられます。
| 比較項目 | 回帰 (Regression) | 分類 (Classification) |
|---|---|---|
| 予測するもの | 連続的な数値 | 離散的なカテゴリ(クラス) |
| 出力の例 | 3,000万円, 25.5度, 150個 | 「犬」or「猫」, 「A」or「B」, 「合格」or「不合格」 |
| 質問の例 | 「この家の価格はいくら?」 | 「このメールはスパムか否か?」 |
統計学の「回帰分析」との違いは?
統計学の回帰分析が「原因と結果の関係性を説明すること」を主な目的とするのに対し、機械学習の回帰は「未知のデータに対する予測精度を高めること」を最優先します。
- 統計学の回帰分析:
目的は「説明・解釈」。 例えば、「広告費が売上にどれくらい影響を与えているか」という変数間の関係性を明らかにすることに重点を置きます。 - 機械学習の回帰:
目的は「予測」。 モデルの内部構造が複雑で解釈が難しくても、とにかく未来の数値を高い精度で予測できるモデルを構築することを目指します。
両者は使う手法に共通点も多いですが、その目的が異なると理解しておきましょう。
機械学習の回帰にはどのような種類・手法があるか?
単純な線形回帰から、より複雑な関係を捉えるランダムフォレストや勾配ブースティングまで、データの特性や求める精度に応じて様々な手法が使い分けられます。
① 線形回帰(単回帰・重回帰)
最も基本的で、古くから使われている回帰手法です。データが直線的な関係にあると仮定して予測モデルを作成します。説明変数が一つの場合を「単回帰」、複数の場合を「重回帰」と呼びます。
② 多項式回帰
データが曲線的な関係を持つ場合に利用される手法です。直線では表現しきれない、より複雑なデータの傾向を捉えることができます。
③ 決定木・ランダムフォレスト
「もしAが〇〇以上ならB、そうでなければC」というような、木の枝分かれのようなルールでデータを分割していくのが「決定木」です。そして、その決定木を多数組み合わせることで、より高い予測精度を実現するのが「ランダムフォレスト」です。
④ サポートベクター回帰(SVR)
分類問題で高い性能を発揮する「サポートベクターマシン」を、回帰問題に応用した手法です。複雑なデータに対しても、高い汎化性能(未知のデータへの適応力)を持つことが知られています。
⑤ 勾配ブースティング
決定木をベースに、予測の誤りを段階的に修正していくことで、非常に高い予測精度を実現するアンサンブル学習の手法です。Kaggleなどのデータ分析コンペティションで頻繁に用いられる「XGBoost」や「LightGBM」といったライブラリが有名です。
Pythonを使った回帰モデル構築の流れは?
Pythonのライブラリ「scikit-learn (サイキット・ラーン)」などを使うことで、データの準備からモデルの学習、評価、予測までを効率的に行うことができます。
専門家でなくても、大まかな流れを理解しておくことは重要です。
- STEP1:データの収集と準備
予測に必要な過去のデータを収集し、欠損値の処理や、AIが学習しやすい形式にデータ整形(前処理)を行います。 - STEP2:モデルの選択と学習
データの特性に合わせ、前述したような回帰モデルの中から適切なものを選択し、準備したデータをAIに学習(トレーニング)させます。 - STEP3:モデルの評価
学習させたモデルが、未知のデータに対しても本当に高い精度で予測できるかを、テスト用のデータを使って評価・検証します。 - STEP4:予測と運用
評価されたモデルを使い、実際に未来の数値を予測します。必要に応じて、モデルを実際のシステムに組み込んで運用します。
ビジネスの未来を「回帰」で予測する
本記事では、機械学習の「回帰」について、その基本から分類との違い、代表的なモデルの種類までを解説しました。
回帰は、売上予測や需要予測、価格査定といった、あらゆるビジネスシーンで未来の数値を予測するための強力なツールです。どのようなデータを基に、自社のどのような数値を予測したいかを考えることが、データ活用の第一歩といえるでしょう。
まずは「回帰」というアプローチがあることを知り、AIによるデータドリブンな意思決定の可能性を探ってみてはいかがでしょうか。
※ 掲載している情報は記事更新時点のものです。
※本サイトは、法律的またはその他のアドバイスの提供を目的としたものではありません。当社は本サイトの記載内容(テンプレートを含む)の正確性、妥当性の確保に努めておりますが、ご利用にあたっては、個別の事情を適宜専門家にご相談いただくなど、ご自身の判断でご利用ください。
関連記事
ChatGPTを無料で使い始めるには?有料版との違いや制限、画像生成の使い方まで徹底解説
ChatGPTは、簡単なアカウント登録だけで誰でも無料で、かつ非常に高性能な機能を利用開始できます。特に高性能AIモデル「GPT-4o」が無料版にも搭載されたことで、文章作成はもちろん、データ分析や画像生成といった従来は有料だった高度なタス…
詳しくみる【ChatGPTとGeminiを比較】特徴やおすすめの活用シーンを紹介
生成AIを業務に取り入れる際は、機能の違いを理解し、目的に合う選択を行うことが重要です。 ChatGPTは文章生成や推論に強く、企画や資料作成の下地づくりに適しています。Geminiは検索やGoogleサービスとの連携に強みがあり、最新情報…
詳しくみる【YouTubeの要約】YouTube Summary with ChatGPTの機能・使い方
YouTube動画の要点を素早く把握したい方に便利なのが、Chrome拡張機能の「YouTube Summary with ChatGPT」です。動画に自動生成される字幕を基にChatGPTが要約を生成するため、長時間の動画でも短時間で全体…
詳しくみるVSCodeで使えるCopilotとは|導入方法・使い方を解説
GitHub Copilotは、Visual Studio Code(VSCode)に組み込んで利用できるAIアシスタントです。OpenAIの大規模言語モデルを基盤にしており、入力中のコードやコメントから次に必要となる処理を予測して提示しま…
詳しくみるGitHub Copilot Agent Modeとは?できることや料金・導入方法を解説
GitHub Copilot Agent Modeは、従来のコード補完を超え、自然言語による指示で一連の開発タスクを自動実行できる新機能です。コード生成だけでなく、複数ファイルの横断編集やテスト作成、ターミナル操作まで対応し、開発者の手間を…
詳しくみるChatGPTでイラストは作れる?生成方法・注意点を紹介
ChatGPTは文章生成だけでなく、画像生成にも対応しています。プロンプト(テキスト指示)を入力するだけで、アニメ風からビジネス素材まで多彩なイラストを作成可能です。 当記事では、ChatGPTでのイラスト生成の仕組みや手順、作れるイラスト…
詳しくみる