- 作成日 : 2025年11月13日
機械学習の「回帰」とは?分類との違い、代表的な種類・手法まで分かりやすく解説
機械学習における「回帰」とは、過去のデータをもとに、将来の売上や株価といった連続的な数値を予測する手法です。ビジネスにおける需要予測や価格設定など、様々な場面で活用されています。
この記事では、機械学習の回帰の基本的な考え方から、もう一つの主要な手法である「分類」との違い、そしてビジネスで使われる代表的な回帰モデルの種類まで、初心者の方にも分かりやすく解説します。
目次
そもそも機械学習における「回帰」とは何か?
「回帰」とは、過去のデータから規則性やパターンを見つけ出し、株価や気温、売上高といった「連続する数値」を予測するための機械学習の手法です。「回帰問題」とは、この回帰を用いて解決すべき課題のことを指します。
例えば、過去の広告費と売上の関係をAIに学習させ、「来月、広告費を100万円に設定した場合、売上はいくらになるか?」といった未来の数値を予測するのが、典型的な回帰の活用例です。
具体的な「回帰」の例
回帰は、私たちの身の回りの様々な予測に利用されています。
- ビジネス:過去の販売実績や天候、イベント情報などを基にした、将来の店舗の売上予測。
- 不動産:物件の広さ、築年数、最寄り駅からの距離などを基にした、不動産の価格査定。
- マーケティング:広告の表示回数やクリック数などを基にした、商品のコンバージョン数(成約数)の予測。
「分類」との決定的な違いは?
回帰が「数値を予測する」のに対し、分類は「カテゴリを予測する」という点に決定的な違いがあります。どちらも機械学習の「教師あり学習」というカテゴリに含まれる主要な手法ですが、何を予測したいかによって使い分けられます。
| 比較項目 | 回帰 (Regression) | 分類 (Classification) |
|---|---|---|
| 予測するもの | 連続的な数値 | 離散的なカテゴリ(クラス) |
| 出力の例 | 3,000万円, 25.5度, 150個 | 「犬」or「猫」, 「A」or「B」, 「合格」or「不合格」 |
| 質問の例 | 「この家の価格はいくら?」 | 「このメールはスパムか否か?」 |
統計学の「回帰分析」との違いは?
統計学の回帰分析が「原因と結果の関係性を説明すること」を主な目的とするのに対し、機械学習の回帰は「未知のデータに対する予測精度を高めること」を最優先します。
- 統計学の回帰分析:
目的は「説明・解釈」。 例えば、「広告費が売上にどれくらい影響を与えているか」という変数間の関係性を明らかにすることに重点を置きます。 - 機械学習の回帰:
目的は「予測」。 モデルの内部構造が複雑で解釈が難しくても、とにかく未来の数値を高い精度で予測できるモデルを構築することを目指します。
両者は使う手法に共通点も多いですが、その目的が異なると理解しておきましょう。
機械学習の回帰にはどのような種類・手法があるか?
単純な線形回帰から、より複雑な関係を捉えるランダムフォレストや勾配ブースティングまで、データの特性や求める精度に応じて様々な手法が使い分けられます。
① 線形回帰(単回帰・重回帰)
最も基本的で、古くから使われている回帰手法です。データが直線的な関係にあると仮定して予測モデルを作成します。説明変数が一つの場合を「単回帰」、複数の場合を「重回帰」と呼びます。
② 多項式回帰
データが曲線的な関係を持つ場合に利用される手法です。直線では表現しきれない、より複雑なデータの傾向を捉えることができます。
③ 決定木・ランダムフォレスト
「もしAが〇〇以上ならB、そうでなければC」というような、木の枝分かれのようなルールでデータを分割していくのが「決定木」です。そして、その決定木を多数組み合わせることで、より高い予測精度を実現するのが「ランダムフォレスト」です。
④ サポートベクター回帰(SVR)
分類問題で高い性能を発揮する「サポートベクターマシン」を、回帰問題に応用した手法です。複雑なデータに対しても、高い汎化性能(未知のデータへの適応力)を持つことが知られています。
⑤ 勾配ブースティング
決定木をベースに、予測の誤りを段階的に修正していくことで、非常に高い予測精度を実現するアンサンブル学習の手法です。Kaggleなどのデータ分析コンペティションで頻繁に用いられる「XGBoost」や「LightGBM」といったライブラリが有名です。
Pythonを使った回帰モデル構築の流れは?
Pythonのライブラリ「scikit-learn (サイキット・ラーン)」などを使うことで、データの準備からモデルの学習、評価、予測までを効率的に行うことができます。
専門家でなくても、大まかな流れを理解しておくことは重要です。
- STEP1:データの収集と準備
予測に必要な過去のデータを収集し、欠損値の処理や、AIが学習しやすい形式にデータ整形(前処理)を行います。 - STEP2:モデルの選択と学習
データの特性に合わせ、前述したような回帰モデルの中から適切なものを選択し、準備したデータをAIに学習(トレーニング)させます。 - STEP3:モデルの評価
学習させたモデルが、未知のデータに対しても本当に高い精度で予測できるかを、テスト用のデータを使って評価・検証します。 - STEP4:予測と運用
評価されたモデルを使い、実際に未来の数値を予測します。必要に応じて、モデルを実際のシステムに組み込んで運用します。
ビジネスの未来を「回帰」で予測する
本記事では、機械学習の「回帰」について、その基本から分類との違い、代表的なモデルの種類までを解説しました。
回帰は、売上予測や需要予測、価格査定といった、あらゆるビジネスシーンで未来の数値を予測するための強力なツールです。どのようなデータを基に、自社のどのような数値を予測したいかを考えることが、データ活用の第一歩といえるでしょう。
まずは「回帰」というアプローチがあることを知り、AIによるデータドリブンな意思決定の可能性を探ってみてはいかがでしょうか。
※ 掲載している情報は記事更新時点のものです。
※本サイトは、法律的またはその他のアドバイスの提供を目的としたものではありません。当社は本サイトの記載内容(テンプレートを含む)の正確性、妥当性の確保に努めておりますが、ご利用にあたっては、個別の事情を適宜専門家にご相談いただくなど、ご自身の判断でご利用ください。
関連記事
GoogleのAI「Gemini」とは?使い方から無料版と有料版の違いまで解説
Gemini(ジェミニ)とは、Googleが開発した最先端の生成AIモデルです。従来のAIが主にテキスト情報を扱っていたのに対し、Geminiはテキストと画像に加え、特定のモデルやAPI環境では音声や動画なども扱える、最初から複数の情報形式…
詳しくみるChatGPTの料金プランとは?無料版と有料版の違いや日本円での価格まで徹底解説
ChatGPTには、無料で試せるプランから、個人向けの高性能プラン、さらに法人向けのチームプランまで、複数の料金体系が用意されています。しかし、「どのプランが自分に合っているのか?」「日本円だと、実際いくらになるのか?」といった疑問をお持ち…
詳しくみるClaude 3とは?料金、使い方、GPT-4との性能比較まで分かりやすく解説
Claude 3(クロード スリー)は、AI開発企業Anthropicが開発した、非常に高性能なAIモデルファミリーです。 Claudeは、基本コンセプトとして、倫理と安全性に重点を置いた設計(Constitutional AI)が重視され…
詳しくみるGemini 2.0 Flashとは?高速・低コストなAIの特徴と活用法
生成AIの業務活用が広がる中で、「処理が遅い」「コストが高い」「現場で使いづらい」と感じた経験はないでしょうか。特に、問い合わせ対応や情報検索、会議内容の整理など、スピードと量の両方が求められる業務では、従来の高性能モデルが必ずしも最適とは…
詳しくみるGemini Deep Researchの回数制限とは?仕組みと対策を解説
Gemini Deep Researchは、通常の生成AIとは異なり、市場調査や競合分析などを自動で深掘りできる強力な機能です。しかし、回数制限が設定されている点には注意が必要です。特にビジネス用途では、制限を知らずに使ってしまい、必要なタ…
詳しくみる【2025年11月最新版】ChatGPTの最新モデルGPT-5.1とは?GPT-5との違いも
ChatGPTはアップデートにより、利用できるモデルが自動的に最新へ切り替わる場合があります。モデルが変わると、回答の傾向、推論の強さ、得意なタスク、上限などが変動し、同じ指示でも結果が揺れることがあります。特性を把握し、目的と出力形式、確…
詳しくみる