• 作成日 : 2025年8月25日

TRIMMEAN関数の使い方:外れ値を除いた平均を計算する方法

TRIMMEAN関数は、データセットの上下から指定した割合のデータを除外して平均を計算する関数です。異常値や外れ値の影響を受けにくい統計値を求めたい場合、例えば採点競技での得点計算、給与データの分析、品質管理での測定値の評価などで活用されます。オリンピックの体操競技で最高点と最低点を除外して平均を出すような計算を、より柔軟に実行できます。本記事では、TRIMMEAN関数の基本的な使い方から実践的な活用方法、他の関数との効果的な組み合わせまで、初心者の方にも理解しやすく解説していきます。

TRIMMEAN関数とは

TRIMMEAN関数は、トリム平均(調整平均)を計算する統計関数です。データを昇順に並べ替え、上位と下位から指定された割合のデータを除外し、残りのデータの平均を計算します。これにより、極端な値の影響を軽減し、より安定した代表値を得ることができます。

この関数の重要な特徴は、除外する割合を柔軟に指定できることです。通常の平均(AVERAGE)は外れ値の影響を強く受けますが、中央値(MEDIAN)は情報の損失が大きいという問題があります。TRIMMEAN関数は、この両者の中間的なアプローチを提供します。

参考:TRIMMEAN 関数 – Microsoft サポート

TRIMMEAN関数の基本的な使い方

関数の構文を理解する

TRIMMEAN関数の構文は次のとおりです。

=TRIMMEAN(配列, 割合)

配列は平均を計算したいデータ範囲、割合は除外するデータの割合(0以上1未満の小数)を指定します。

基本的な使用例

実際の使用例を見てみましょう。

A1:A10に10個のデータがある場合:

=TRIMMEAN(A1:A10, 0.2)

この場合、上下20%(合計20%なので上位10%と下位10%)のデータを除外し、残り80%のデータで平均を計算します。10個のデータなら上下各1個ずつ除外されます。(除外数は切り捨て処理されるため、データ数や割合によって変動します。)

具体的な数値での例:

=TRIMMEAN({1,2,3,4,5,6,7,8,9,100}, 0.2)

この結果は5.5となり、外れ値の100が除外されているため、通常の平均(15.5)より実態に近い値が得られます。

除外割合の考え方

除外割合は、全データに対する割合として指定します。0.1なら10%、0.25なら25%のデータが除外されます。

=TRIMMEAN(A1:A20, 0)     ‘ 通常の平均と同じ(除外なし)

=TRIMMEAN(A1:A20, 0.1)   ‘ 上下5%ずつ除外

=TRIMMEAN(A1:A20, 0.4)   ‘ 上下20%ずつ除外

TRIMMEAN関数の実践的な利用シーン

人事評価での活用

従業員の評価や給与データの分析では、極端な高給与者や新入社員の影響を除外して、組織の標準的な水準を把握することが重要です。TRIMMEAN関数を使用することで、より実態に即した平均給与を算出できます。

360度評価で複数の評価者から得点を集める場合も、TRIMMEAN関数によって個人的な偏見による極端な評価を除外し、公平な評価結果を得ることができます。これにより、評価の信頼性と納得感が向上します。

スポーツ・競技での採点

フィギュアスケートや体操競技のような採点競技では、複数の審判の採点から最高点と最低点を除外して平均を計算することが一般的です。TRIMMEAN関数を使えば、この計算を自動化できます。

審判の数に応じて除外割合を調整することで、より公平な採点システムを構築できます。例えば、7人の審判なら約28.6%(2/7)を除外することで、最高点と最低点を除いた5人の平均を計算できます。

品質管理での測定値処理

製造業での品質検査では、測定誤差や機器の不調による異常値が混入することがあります。TRIMMEAN関数を使用して、これらの外れ値を除外した平均値を求めることで、製品の真の品質水準を評価できます。

連続的な測定データから、機械の調整ミスや一時的な異常を除外し、安定した工程能力を評価することが可能になります。

TRIMMEAN関数の応用テクニック

動的な除外割合の設定

データの特性に応じて除外割合を調整する方法:

=TRIMMEAN(A1:A100, IF(STDEV(A1:A100)>基準値, 0.3, 0.1))

標準偏差が大きい(ばらつきが大きい)場合は多めに除外し、小さい場合は少なめに除外します。

段階的なトリム平均の比較

異なる除外割合での結果を比較:

=TRIMMEAN(データ範囲, ROW()/100)

1%から順に除外割合を増やして、結果の変化を観察できます。

外れ値の影響度分析

通常の平均との差を計算:

=(AVERAGE(A1:A100)-TRIMMEAN(A1:A100, 0.1))/AVERAGE(A1:A100)*100

外れ値がどの程度平均に影響しているかを定量化できます。

TRIMMEAN関数のよくあるエラーと対策

#NUM!エラーへの対処

割合が0以上1未満でない場合や、除外後のデータが不足する場合に発生します。

基本的なエラー処理:

=IFERROR(TRIMMEAN(A1:A10, B1), “割合は0以上1未満で指定してください”)

詳細な検証を含む処理:

=IF(OR(B1<0, B1>=1), “割合は0~1の範囲で指定”,

IF(COUNT(A1:A10)*(1-B1)<1, “除外後のデータが不足”,

TRIMMEAN(A1:A10, B1)))

除外割合が大きすぎると、計算に必要なデータが残らない場合があります。データ数に応じて適切な割合を設定することが重要です。例えば、10個のデータで0.9以上の割合を指定すると、1個以下しか残らないためエラーになります。

#VALUE!エラーへの対処

数値以外のデータが含まれている場合に発生します。

数値のみを抽出して計算:

=TRIMMEAN(IF(ISNUMBER(A1:A20), A1:A20), 0.1)

エラー値を除外する処理:

=IFERROR(TRIMMEAN(A1:A20, 0.1),

IF(SUMPRODUCT(–ISERROR(A1:A20))>0, “エラー値が含まれています”,

“数値データを入力してください”))

データクリーニングの段階で、文字列やエラー値を適切に処理することが重要です。ISNUMBER関数でチェックし、数値データのみを対象にすることで、安定した計算が可能になります。大量データの処理では、事前のデータ型確認が不可欠です。

少数データでの問題

データ数が少ない場合、除外による影響が大きくなります。

データ数に応じた割合調整:

=IF(COUNT(A1:A20)<10, “データ数が少なすぎます”,

TRIMMEAN(A1:A20, MIN(0.2, 2/COUNT(A1:A20))))

最小データ数の確保:

=IF(COUNT(範囲)*(1-割合)<3,

“除外後のデータが3個未満になります”,

TRIMMEAN(範囲, 割合))

統計的に意味のある結果を得るには、除外後も十分なデータ数が必要です。一般的に、除外後も最低3~5個のデータが残るように割合を設定することを推奨します。データ数が少ない場合は、通常の平均や中央値の使用を検討してください。

除外データの切り捨て問題

除外するデータ数が整数にならない場合の処理に注意が必要です。

除外数の確認:

=”除外されるデータ数: ” & INT(COUNT(A1:A20)*B1) & “個”

実際の除外割合の計算:

=”実際の除外割合: ” & INT(COUNT(A1:A20)*B1)/COUNT(A1:A20)*100 & “%”

TRIMMEAN関数は除外数を切り捨てて整数にするため、指定した割合と実際の除外割合が異なる場合があります。正確な除外数を把握して、結果を解釈することが重要です。

TRIMMEAN関数と他の関数との組み合わせ

AVERAGE関数との比較分析

通常平均とトリム平均の差を可視化:

=”通常平均: ” & ROUND(AVERAGE(A1:A20), 2) &

” / トリム平均: ” & ROUND(TRIMMEAN(A1:A20, 0.2), 2) &

” / 差: ” & ROUND(ABS(AVERAGE(A1:A20)-TRIMMEAN(A1:A20, 0.2)), 2)

両者の差が大きい場合、データに外れ値が含まれている可能性が高いことを示します。品質管理では、この差を監視することで工程の異常を早期発見できます。定期的にこの差をグラフ化することで、データの安定性をモニタリングできます。

MEDIAN関数との組み合わせ

3つの代表値を比較して、データの分布を理解:

=”平均: ” & ROUND(AVERAGE(範囲), 1) &

” / トリム平均(20%): ” & ROUND(TRIMMEAN(範囲, 0.2), 1) &

” / 中央値: ” & ROUND(MEDIAN(範囲), 1)

これらの値が近い場合は正規分布に近く、大きく異なる場合は歪んだ分布や外れ値の存在を示唆します。給与データの分析では、これらの指標を組み合わせることで、組織の報酬構造をより深く理解できます。

PERCENTILE関数での除外範囲特定

除外されるデータの具体的な値を確認:

=”下位カットオフ: ” & PERCENTILE(範囲, 割合/2) &

” / 上位カットオフ: ” & PERCENTILE(範囲, 1-割合/2)

どの値が除外されるかを事前に確認できます。除外される値が妥当かどうかを検証し、必要に応じて除外割合を調整できます。品質管理では、除外される測定値が本当に異常値なのか、それとも重要な情報を含んでいるのかを判断する材料になります。

STDEV関数での安定性評価

A列のデータ型(A2~)に対し、B列(B2~)に以下の式を記入して除外される値を明確にします。

=IF(AND(A2>=PERCENTILE(A:A,0.2/2),

A2<=PERCENTILE(A:A,1-0.2/2)), A2,”” )

次に、A列とB列それぞれの標準偏差から、標準偏差の減少率を求めます。

除外前後での標準偏差の変化を分析:

=1-STDEV(B:B)/STDEV(A:A)

標準偏差の減少率により、外れ値除外の効果を定量化できます。大幅に減少する場合は、元データに強い外れ値が含まれていたことを示します。この指標は、データクリーニングの効果を評価する際に有用です。

COUNT関数での除外データ数確認

実際に計算に使用されるデータ数を表示:

=”元データ: ” & COUNT(範囲) & “個 → 使用データ: ” &

COUNT(範囲)*(1-割合) & “個 (除外: ” & COUNT(範囲)*割合 & “個)”

データの透明性を確保し、計算の信頼性を高めます。レポートにこの情報を含めることで、読み手がトリム平均の意味を正しく理解できます。統計的な妥当性を保証するためにも、使用データ数の明示は重要です。

IF関数での条件付きトリム平均

データの特性に応じて処理を分岐:

=IF(COUNT(範囲)<20, MEDIAN(範囲),

IF(STDEV(範囲)/AVERAGE(範囲)>0.5, TRIMMEAN(範囲, 0.3),

TRIMMEAN(範囲, 0.1)))

データ数が少ない場合は中央値、変動係数が大きい場合は高い除外率、そうでない場合は低い除外率を適用します。このような適応的なアプローチにより、様々なデータ特性に対して最適な代表値を提供できます。

TRIMMEAN関数の実務での注意点

除外割合の選定基準

除外割合の選定に絶対的な基準はありませんが、一般的な目安は下記です。

  • 通常のデータ:10-20%(0.1-0.2)
  • ノイズの多いデータ:20-30%(0.2-0.3)
  • 極端な外れ値が予想される場合:30-40%(0.3-0.4)

ただし、データの性質と分析目的に応じて調整することが重要です。

結果の解釈と報告

TRIMMEAN関数を使用した場合は、必ず以下を明記してください。

  • 使用した除外割合
  • 除外されたデータ数
  • 除外の理由と妥当性

透明性のある報告により、分析結果の信頼性が向上します。

外れ値の別途分析

除外されたデータも貴重な情報を含む可能性があります。外れ値を単に除外するのではなく、別途その原因を分析することで、プロセスの改善機会を発見できることがあります。

特に品質管理では、外れ値が機器の故障や工程の異常を示すシグナルである可能性があるため、注意深い分析が必要です。

TRIMMEAN関数で外れ値の影響を抑える

TRIMMEAN関数は、データの両端から指定した割合を除外して平均を計算するExcelの統計関数です。採点競技、給与分析、品質評価など、極端な値が結果に影響しやすい場面で、代表値の安定化を目的とした集計に利用されます。

除外割合は柔軟に設定でき、AVERAGEやMEDIANと比較することで、データの偏りや外れ値の有無を把握しやすくなります。また、IF関数やPERCENTILE関数との併用により、条件付きの除外処理や除外範囲の確認も可能です。分析内容に応じてTRIMMEAN関数を使い分けることで、より適切な数値の把握がしやすくなります。


※ 掲載している情報は記事更新時点のものです。

※本サイトは、法律的またはその他のアドバイスの提供を目的としたものではありません。当社は本サイトの記載内容(テンプレートを含む)の正確性、妥当性の確保に努めておりますが、ご利用にあたっては、個別の事情を適宜専門家にご相談いただくなど、ご自身の判断でご利用ください。

関連記事