Excel で Z スコアを計算する方法: 包括的なガイド
統計とデータ分析の分野では、データが平均とどのように比較されるかを理解することが重要です。 Z スコアは標準スコアとも呼ばれ、データセットの平均からのデータ ポイントの相対距離を標準偏差で表す方法を提供します。テスト スコア、財務データ、その他の数値データセットを分析する場合でも、z スコアを計算すると、データの動作についての深い洞察が得られます。
Excel を使用して Z スコアを計算すると、シンプルさと効率が向上し、大規模なデータセットを迅速に分析して標準化された比較と外れ値の検出が可能になります。このチュートリアルでは、Z スコアとは何か、Excel で Z スコアを検索する方法を理解し、数式の例を示し、データ内の Z スコアを解釈し、これらの計算を実行する際に覚えておくべき重要なヒントを共有する方法を説明します。 |
Zスコアとは何ですか?
Z スコア (標準スコアとも呼ばれます) は、データセットの平均から特定のデータ ポイントまでの距離を定量化する統計指標であり、標準偏差で表されます。この測定は、データ ポイントがデータセットの平均値からどれだけ離れているか、どの方向 (上または下) にずれているかを理解するために重要です。基本的に、Z スコアはデータ ポイントを共通のスケールに変換し、元の測定スケールや分布形状に関係なく、異なるデータセット間または多様な母集団内での直接的な比較を可能にします。
Z スコアの概念は正規分布と密接に関係しています。正規分布は統計学の基本概念であり、ほとんどの観測値が中央ピークの周囲に集まり、値が発生する確率が平均から両方向に対称的に減少する分布を表します。 正規分布のコンテキストでは次のようになります。 |
- データの約 68% が平均の 1 標準偏差 (±XNUMX Z スコア) 以内に収まっており、平均から中程度の偏差があることを示しています。
- 観測値の約 95% は 2 標準偏差 (±XNUMX Z スコア) 以内にあり、極端ではないものの有意な偏差を示しています。
- データのほぼ 99.7% が 3 標準偏差 (±XNUMX Z スコア) 以内に見つかり、分布内のほぼすべての観測値が網羅され、極端な偏差が強調されます。
Z スコアは統計解析において重要なツールであり、研究者や分析者がさまざまなデータセットからの個々の観察を標準化し、異なる分布からのスコアの比較を容易にすることができます。データを Z スコアに変換することにより、特定の観測値が特定の分布内でどの程度異常であるか、または典型的であるかを簡単に判断できるため、外れ値の検出、仮説検定、データの正規化などのさまざまなアプリケーションにとって不可欠なツールになります。
Excel で Z スコアを見つけるにはどうすればよいですか?
Excel には、Z スコアを直接計算するための単一の専用関数はありません。このプロセスには、データセットの平均値の最初の計算が含まれます (μ)および標準偏差(σ)。これらの重要な統計を取得した後、Z スコアを決定するための 2 つの主な方法があります。
- 手動計算方法: Z スコアの式を適用します。
=(x-μ)/σ
- ここで、
- x は調査しているデータポイントです。
μ はデータセットの平均です。
σ はデータセットの標準偏差です。 - STANDARDIZE 関数の使用: より統合されたアプローチについては、Excel の 標準化 関数は、データ ポイント、平均、標準偏差を入力として指定して、Z スコアを直接計算します。
=STANDARDIZE(x, mean, standard_dev)
Excel で Z スコアを計算する式の例
列 A にセルにわたるデータセットがあると仮定します。 A2 〜へ A101これらの値の Z スコアを計算する方法は次のとおりです。
- 平均を計算する (μ): 使用 平均(範囲) 平均を見つける関数 (μ) のデータセット。
=AVERAGE(A2:A101)
- 標準偏差を計算します (σ): データのコンテキストに基づいて適切な数式を選択します。
重要: 正確な計算を確実に行うには、データセットに適切な関数を選択することが重要です。 (私のデータに関しては、 A2:A101 人口全体を表すため、最初の式を使用します。)
- STDEV.P(範囲) データが母集団全体を表す場合 (これらの値がサンプリングされるより大きなグループがないことを意味します)、関数を使用します。
=STDEV.P(A2:A101)
- STDEV.S(範囲) データがより大きな母集団のサンプルである場合、またはサンプルに基づいて母集団の標準偏差を推定する場合は、この関数を使用します。
=STDEV.S(A2:A101)
- STDEV.P(範囲) データが母集団全体を表す場合 (これらの値がサンプリングされるより大きなグループがないことを意味します)、関数を使用します。
- A2 のデータ ポイントの Z スコアを計算する: 次のいずれかの式を使用すると、同じ結果が得られます。 (この例では、2 番目の式を選択します。)
- 手動で計算する データポイントから平均を引き、この結果を標準偏差で割ります。
=(A2 - $E$2) / $E$3
- STANDARDIZE(x, 平均, standard_dev) 機能。
=STANDARDIZE(A2, $E$2, $E$3)
注: ドル記号 ($) 常に特定のセルを参照するように数式を指示します (E2 意味としては、 E3 標準偏差の場合)、数式がコピーされる場所に関係なく。
- 手動で計算する データポイントから平均を引き、この結果を標準偏差で割ります。
- データセット内の各値の Z スコアを計算する: ステップ 3 の式を列の下にコピーして、データセット内の各値の Z スコアを計算します。 ヒント: セルの塗りつぶしハンドルをダブルクリックすると、数式をすばやく拡張できます。
- 平均値と標準偏差の式を個別のセルに個別に入力することなく、データセット全体の Z スコアの計算を合理化するには、次の包括的な式のいずれかを直接使用できます。
=(A2 - AVERAGE($A$2:$A$101)) / STDEV.P($A$2:$A$101)
=STANDARDIZE(A2, AVERAGE($A$2:$A$101), STDEV.P($A$2:$A$101))
- Z スコアに小数点以下 3 桁を使用して一貫した精度を維持することは、科学的および統計的作業においては賞賛に値する行為です。これを実現するには、Z スコア セルを選択し、 XNUMX進数を減らす にあるオプション 数 グループを ホーム タブには何も表示されないことに注意してください。
データ内の Z スコアの解釈
Z スコアの解釈は、データセット内のデータ ポイントの位置と重要性を理解する上で基本です。 Z スコアは、要素がデータセットの平均からどれだけ標準偏差があるかを直接測定し、その相対的な位置と希少性についての洞察を提供します。
平均値との関係
- Z スコア = 0: データ ポイントが正確に平均値にある、平均的なパフォーマンスを示します。
- Z スコア > 0: 平均を上回る値を示し、平均からの距離が大きいほどパフォーマンスが優れていることを示します。
- Z スコア < 0: 平均を下回る値を表し、スコアが低いほど平均を下回る偏差が大きいことを示します。
逸脱度
- |Z スコア| < 1: これらのデータ ポイントは平均に近く、正規分布のデータ本体内に収まっており、標準的なパフォーマンスを示しています。
- |Z スコア| < 2: 平均からの中程度の偏差を示唆し、観測値を珍しいものとしてマークしますが、依然として正常な分散範囲内にあります。
- |Z スコア| > 2: 平均から大幅に離れた異常なデータ ポイントを強調表示します。これは、異常値または予想される標準からの大幅な逸脱を示している可能性があります。
説明例:
- Z スコア 0.66 は、データ ポイントが平均より 0.66 標準偏差上にあることを意味します。これは、値が平均より高いものの、それでも比較的平均に近く、一般的な変動範囲内にあることを示しています。
- 逆に、Z スコア -2.1 は、データ ポイントが平均より 2.1 標準偏差低いことを意味します。この値は平均よりも大幅に低く、一般的な範囲からさらに離れていることを示しています。
Excel で Z スコアを計算する際の注意事項
Excel を利用して Z スコアを計算する場合、精度と精度が最も重要です。結果の信頼性を確保するには、次の重要な考慮事項に留意する必要があります。
- 正規分布をチェックする: Z スコアは、正規分布に従うデータに対して最も効果的です。データセットがこの分布に従っていない場合、Z スコアは適切な分析ツールとして機能しない可能性があります。 Z スコア分析を適用する前に、正規性テストを実行することを検討してください。
- 正しい数式を使用することを確認する: 正しい標準偏差関数を選択していることを確認してください - STDEV.P 人口全体にとって、そして STDEV.S サンプルの場合 - データセットの特性に基づいて。
- 平均値と標準偏差に絶対参照を使用する: 複数のセルに数式を適用する場合は、絶対参照を使用します (例: $ A $ 1) Z スコア式の平均と標準偏差を使用して、計算全体の一貫性を確保します。
- 異常値には注意してください: 外れ値は平均と標準偏差の両方に大きな影響を与え、計算された Z スコアを歪める可能性があります。
- データの整合性を確保する: Z スコアを計算する前に、データセットがクリーンでエラーがないことを確認してください。間違ったデータ入力、重複、または無関係な値は平均と標準偏差に大きな影響を与え、Z スコアの誤解を招く可能性があります。
- 早すぎる丸めや切り捨てを避ける: Excel はかなりの数の小数点以下の桁数を処理できるため、これらを保持することで、最終的な分析を歪める可能性がある累積的な丸め誤差を防ぐことができます。
上記は、Excel での Z スコアの計算に関連するすべてのコンテンツです。このチュートリアルがお役に立てば幸いです。 Excel のヒントやコツをさらに詳しく知りたい場合は、 ここをクリックしてください 数千を超えるチュートリアルの広範なコレクションにアクセスします。
最高のオフィス生産性ツール
Kutools forExcel-群衆から目立つのに役立ちます
🤖 | Kutools AI アシスタント: 以下に基づいてデータ分析に革命をもたらします。 インテリジェントな実行 | コードを生成 | カスタム数式の作成 | データを分析してグラフを生成する | Kutools関数を呼び出す... |
人気の機能: 重複を検索、強調表示、または識別する | 空白行を削除する | データを失わずに列またはセルを結合する | 数式なしのラウンド ... | |
スーパーVルックアップ: 複数の基準 | 複数の値 | 複数のシートにわたって | ファジールックアップ... | |
上級ドロップダウンリスト: 簡単なドロップダウンリスト | 依存関係のドロップダウン リスト | 複数選択のドロップダウンリスト... | |
列マネージャー: 特定の数の列を追加する | 列の移動 | Toggle 非表示列の表示ステータス | 列を比較する 同じセルと異なるセルを選択する ... | |
注目の機能: グリッドフォーカス | デザインビュー | ビッグフォーミュラバー | ワークブックとシートマネージャー | リソースライブラリ (自動テキスト) | 日付ピッカー | ワークシートを組み合わせる | セルの暗号化/復号化 | リストごとにメールを送信する | スーパーフィルター | 特殊フィルター (太字/斜体/取り消し線をフィルター...) ... | |
上位 15 のツールセット: 12 テキスト ツール (テキストを追加, 文字を削除する ...) | 50+ チャート 種類 (ガントチャート ...) | 40+ 実用的 式 (誕生日に基づいて年齢を計算する ...) | 19 挿入 ツール (QRコードを挿入, パスから画像を挿入 ...) | 12 変換 ツール (数字から言葉へ, 通貨の換算 ...) | 7 マージ&スプリット ツール (高度な結合行, Excelのセルを分割する ...) | ... もっと |
Kutools for Excelは300以上の機能を誇り、 必要なものをワンクリックで手に入れることができます...
Officeタブ-MicrosoftOffice(Excelを含む)でタブ付きの読み取りと編集を有効にする
- 数十の開いているドキュメントを切り替えるのにXNUMX秒!
- マウスの手に別れを告げて、毎日何百ものマウスクリックを減らしてください。
- 複数のドキュメントを表示および編集する際の生産性が 50% 向上します。
- Chrome、Edge、Firefox と同様に、効率的なタブを Office (Excel を含む) にもたらします。