logo

平均、分散、標準偏差

平均、分散、標準偏差 は重要な統計的尺度です。分散は平均からのデータ ポイントの偏差を定量化し、標準偏差はデータの分布を測定します。主な違いは、標準偏差が平均と同じ単位であるのに対し、分散は二乗単位であることにあります。定義、公式、説明的な例を使用して、これらの概念をさらに深く掘り下げます。

平均

平均 は、指定されたデータセットの平均です。以下の例を考えてみましょう



2、 4、 4、 4、 5、 5、 7、 9

これら 8 つのデータ ポイントの平均 (平均) は 5 です。

frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5。

計算式 : mu=frac{sum_{i=1}^{N} x_{i}}{N}

どこ ?は平均値と×です1、 バツ2、 バツ3…。、 バツまた、平均は次のように表される場合もあることにも注意してください。 egin{配列}{lll} (2-5)^2 = (-3)^2 = 9 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (- 1)^2 = 1 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (-1)^2 = 1 && (7-5)^2 = 2^2 = 4  (4-5)^2 = (-1)^2 = 1 && (9-5)^2 = 4^2 = 16.  end{配列}

分散

分散 すべての数値と平均の差の二乗和です。
上の例の偏差。まず、平均からの各データ ポイントの偏差を計算し、それぞれの結果を 2 乗します。

計算式: sigma^{2}= frac { sum_{i=1}^{N} (x_{i}-mu)^{2}}{N}

分散 = 	extup{変動係数} =frac{ 	extup{標準偏差}}{平均}*100= 4.



どこ ?は平均、N は要素の総数または分布頻度です。


標準偏差

標準偏差 分散の平方根です。これは、データが平均からどの程度変動するかを示す尺度です。

標準偏差 (上記のデータの場合) = = 2

なぜ数学者は偏差を求めるために平方を選択し、次に平方根を選択したのでしょうか。なぜ単純に値の差を取らなかったのでしょうか?
理由の 1 つは、平均の定義に従って差の合計が 0 になるためです。絶対差の合計はオプションの可能性がありますが、絶対差を使用すると、多くの優れた定理を証明するのが困難になります。 [ソース: MITビデオ講義 1:19から]



  1. 入力内のすべてのエントリが同じ場合、標準偏差の値は 0 になります。
  2. 入力セット内のすべての値に、たとえば 7 という数値を加算 (または減算) すると、平均は 7 増加 (または減少) しますが、標準偏差は変わりません。
  3. 入力セット内のすべての値に数値 7 を乗算すると、平均と標準偏差の両方が 7 倍になります。しかし、すべての入力値に負の数値 (-7 など) を乗算すると、平均は -7 倍になりますが、標準偏差は 7 倍されます。
  4. 標準偏差と分散は、数値がどの程度広がっているかを示す尺度です。分散は広がりを大まかに把握できますが、標準偏差はより具体的であり、平均からの正確な距離がわかります。
  5. 平均、中央値、および最頻値は、データ (グループ化または非グループ化) の中心的な傾向の尺度です。

チェック:

  • 分散と標準偏差
  • 標準偏差の実生活への応用
  • 分散と標準偏差の違い

以下の問題は前年度の GATE 試験で出題されました。 参考文献:
https://en.wikipedia.org/wiki/Standard_deviation
http://staff.argyll.epsb.ca/jreed/math30p/statistics/standardDeviation.htm

平均、分散、標準偏差 – FAQ

標準偏差と分散の違いは何ですか?

標準偏差と分散はどちらも、平均に対するデータセット内のデータ ポイントの広がりを測定します。主な違いは、分散は平均からの偏差の二乗の平均を測定するのに対し、標準偏差は分散の平方根であり、データと同じ単位で広がりの尺度を提供することです。



平均、分散、標準偏差はどのように計算しますか?

  • 平均値: すべての数値を加算し、数値の数で割ります。
  • 分散: 平均を計算し、各数値から平均を引き、結果を 2 乗し、これらの 2 乗した結果を合計し、数値の数から 1 を引いた値で割ります。
  • 標準偏差: 分散の平方根を求めます。

平均、分散、標準偏差が重要なのはなぜですか?

これらの統計的尺度は、データの分布を理解するために非常に重要です。平均値は中心値を提供し、分散と標準偏差はデータのばらつきや広がりについての洞察を与え、データセットの一貫性や変動性を示します。

分散と標準偏差が負になることはありますか?

いいえ、分散と標準偏差を負にすることはできません。分散は、平均値との差の二乗の平均として計算され、負ではない値になります。標準偏差は分散の平方根であるため、負の値にすることもできません。

外れ値は平均、分散、標準偏差にどのように影響しますか?

外れ値は平均を外れ値に近づけることで平均に大きな影響を与える可能性があり、データセットの中心的な傾向を正確に反映していません。分散と標準偏差も増加するため影響を受けます。これは、外れ値によるデータの広がりが大きいことを示しています。