- 作成日 : 2025年11月13日
機械学習の「回帰」とは?分類との違い、代表的な種類・手法まで分かりやすく解説
機械学習における「回帰」とは、過去のデータをもとに、将来の売上や株価といった連続的な数値を予測する手法です。ビジネスにおける需要予測や価格設定など、様々な場面で活用されています。
この記事では、機械学習の回帰の基本的な考え方から、もう一つの主要な手法である「分類」との違い、そしてビジネスで使われる代表的な回帰モデルの種類まで、初心者の方にも分かりやすく解説します。
目次
そもそも機械学習における「回帰」とは何か?
「回帰」とは、過去のデータから規則性やパターンを見つけ出し、株価や気温、売上高といった「連続する数値」を予測するための機械学習の手法です。「回帰問題」とは、この回帰を用いて解決すべき課題のことを指します。
例えば、過去の広告費と売上の関係をAIに学習させ、「来月、広告費を100万円に設定した場合、売上はいくらになるか?」といった未来の数値を予測するのが、典型的な回帰の活用例です。
具体的な「回帰」の例
回帰は、私たちの身の回りの様々な予測に利用されています。
- ビジネス:過去の販売実績や天候、イベント情報などを基にした、将来の店舗の売上予測。
- 不動産:物件の広さ、築年数、最寄り駅からの距離などを基にした、不動産の価格査定。
- マーケティング:広告の表示回数やクリック数などを基にした、商品のコンバージョン数(成約数)の予測。
「分類」との決定的な違いは?
回帰が「数値を予測する」のに対し、分類は「カテゴリを予測する」という点に決定的な違いがあります。どちらも機械学習の「教師あり学習」というカテゴリに含まれる主要な手法ですが、何を予測したいかによって使い分けられます。
| 比較項目 | 回帰 (Regression) | 分類 (Classification) |
|---|---|---|
| 予測するもの | 連続的な数値 | 離散的なカテゴリ(クラス) |
| 出力の例 | 3,000万円, 25.5度, 150個 | 「犬」or「猫」, 「A」or「B」, 「合格」or「不合格」 |
| 質問の例 | 「この家の価格はいくら?」 | 「このメールはスパムか否か?」 |
統計学の「回帰分析」との違いは?
統計学の回帰分析が「原因と結果の関係性を説明すること」を主な目的とするのに対し、機械学習の回帰は「未知のデータに対する予測精度を高めること」を最優先します。
- 統計学の回帰分析:
目的は「説明・解釈」。 例えば、「広告費が売上にどれくらい影響を与えているか」という変数間の関係性を明らかにすることに重点を置きます。 - 機械学習の回帰:
目的は「予測」。 モデルの内部構造が複雑で解釈が難しくても、とにかく未来の数値を高い精度で予測できるモデルを構築することを目指します。
両者は使う手法に共通点も多いですが、その目的が異なると理解しておきましょう。
機械学習の回帰にはどのような種類・手法があるか?
単純な線形回帰から、より複雑な関係を捉えるランダムフォレストや勾配ブースティングまで、データの特性や求める精度に応じて様々な手法が使い分けられます。
① 線形回帰(単回帰・重回帰)
最も基本的で、古くから使われている回帰手法です。データが直線的な関係にあると仮定して予測モデルを作成します。説明変数が一つの場合を「単回帰」、複数の場合を「重回帰」と呼びます。
② 多項式回帰
データが曲線的な関係を持つ場合に利用される手法です。直線では表現しきれない、より複雑なデータの傾向を捉えることができます。
③ 決定木・ランダムフォレスト
「もしAが〇〇以上ならB、そうでなければC」というような、木の枝分かれのようなルールでデータを分割していくのが「決定木」です。そして、その決定木を多数組み合わせることで、より高い予測精度を実現するのが「ランダムフォレスト」です。
④ サポートベクター回帰(SVR)
分類問題で高い性能を発揮する「サポートベクターマシン」を、回帰問題に応用した手法です。複雑なデータに対しても、高い汎化性能(未知のデータへの適応力)を持つことが知られています。
⑤ 勾配ブースティング
決定木をベースに、予測の誤りを段階的に修正していくことで、非常に高い予測精度を実現するアンサンブル学習の手法です。Kaggleなどのデータ分析コンペティションで頻繁に用いられる「XGBoost」や「LightGBM」といったライブラリが有名です。
Pythonを使った回帰モデル構築の流れは?
Pythonのライブラリ「scikit-learn (サイキット・ラーン)」などを使うことで、データの準備からモデルの学習、評価、予測までを効率的に行うことができます。
専門家でなくても、大まかな流れを理解しておくことは重要です。
- STEP1:データの収集と準備
予測に必要な過去のデータを収集し、欠損値の処理や、AIが学習しやすい形式にデータ整形(前処理)を行います。 - STEP2:モデルの選択と学習
データの特性に合わせ、前述したような回帰モデルの中から適切なものを選択し、準備したデータをAIに学習(トレーニング)させます。 - STEP3:モデルの評価
学習させたモデルが、未知のデータに対しても本当に高い精度で予測できるかを、テスト用のデータを使って評価・検証します。 - STEP4:予測と運用
評価されたモデルを使い、実際に未来の数値を予測します。必要に応じて、モデルを実際のシステムに組み込んで運用します。
ビジネスの未来を「回帰」で予測する
本記事では、機械学習の「回帰」について、その基本から分類との違い、代表的なモデルの種類までを解説しました。
回帰は、売上予測や需要予測、価格査定といった、あらゆるビジネスシーンで未来の数値を予測するための強力なツールです。どのようなデータを基に、自社のどのような数値を予測したいかを考えることが、データ活用の第一歩といえるでしょう。
まずは「回帰」というアプローチがあることを知り、AIによるデータドリブンな意思決定の可能性を探ってみてはいかがでしょうか。
※ 掲載している情報は記事更新時点のものです。
※本サイトは、法律的またはその他のアドバイスの提供を目的としたものではありません。当社は本サイトの記載内容(テンプレートを含む)の正確性、妥当性の確保に努めておりますが、ご利用にあたっては、個別の事情を適宜専門家にご相談いただくなど、ご自身の判断でご利用ください。
関連記事
ChatGPTのプロジェクト機能とは?機能や利用手順・指示例を解説
ChatGPTのプロジェクト機能は、複数のチャットやファイル、カスタム指示を1つの単位でまとめて管理できる新機能です。従来のチャット利用では難しかった会話の追跡や資料共有が効率化され、業務活用の幅が広がります。 当記事では、プロジェクト機能…
詳しくみる【Claudeの料金プラン全5種を徹底比較】他AIモデルとの比較も
ClaudeはAnthropic社が開発した対話型AIで、安全性と高精度な自然言語処理に定評があります。無料版から法人向けの大規模プランまで用意されているため、利用者は目的や予算に応じてプランを選べます。特に文章要約やプログラミング支援など…
詳しくみるChatGPT APIの始め方とは?料金、使い方、Web版との違いまで分かりやすく解説
ChatGPT API(OpenAI API)は、自社のサービスやアプリケーションにChatGPTの強力なAI機能を組み込むための開発者向けツールです。このAPIを活用することで、オリジナルのAIチャットボットを開発したり、日々の業務を自動…
詳しくみるChatGPT公式アプリの使い方とは?本物の見分け方、PC版、おすすめアプリまで解説
ChatGPTには、開発元であるOpenAIが提供する、安全な公式のスマートフォンアプリとPCアプリがあります。これらを活用すれば、Webブラウザを開く手間なく、より手軽で快適にAIとの対話が可能です。 しかし、アプリストアには多くの非公式…
詳しくみるGitHub Copilot Chatの使い方とは?表示されない時の対処法から料金まで解説
GitHub Copilot Chatは、コーディング作業に特化した対話型のAIアシスタントです。普段お使いの開発エディタ(IDE)内で直接AIに質問し、コードの説明や修正、テスト作成などを依頼することで、開発の生産性を飛躍的に向上させます…
詳しくみる次世代AI「Claude 3.7」とは?性能や料金、使い方を解説
Claude 3.7は、AI開発企業Anthropicが開発した次世代の高性能AIモデルです。Claude 3.5 Sonnetの後継として高性能化が図られており、複雑な推論やマルチモーダル処理能力の向上が期待されています。 現時点での C…
詳しくみる