logo

平均値、中央値、最頻値

平均値、中央値、最頻値 は中心傾向の尺度です。これらの値は、特定のデータ セットのさまざまなパラメーターを定義するために使用されます。中心傾向の尺度 (平均、中央値、および最頻値) は、調査対象のデータに関する有用な洞察を提供します。これらは、組織内の従業員の平均給与、任意のクラスの年齢の中央値、従業員数など、あらゆるタイプのデータを調査するために使用されます。スポーツクラブなどでクリケットをする人の数

についてもっと学びましょう この記事では、平均値、中央値、最頻値の式、例、および FAQ を説明します。

目次



中心的傾向の測定

中心傾向の尺度は、特定のデータセットのさまざまな値を表します。中心的な傾向にはさまざまな尺度があり、最も重要な 3 つの尺度は次のとおりです。 中心傾向 は:

  • 平均
  • 中央値
  • モード

平均値、中央値、最頻値とは何ですか?

平均、中央値、および最頻値は、一連のデータを要約するために統計で使用される中心傾向の尺度です。

平均 (x̅ または μ): 平均、つまり算術平均は、データセット内のすべての値を合計し、値の総数で割ることによって計算されます。外れ値の影響を受けやすいため、データが対称的に分散されている場合によく使用されます。

中央値 (M): 中央値は、データセットを昇順または降順に並べたときの中央の値です。値の数が偶数の場合、それは中央の 2 つの値の平均です。中央値は外れ値に対して堅牢であり、データが偏っている場合によく使用されます。

モード (Z): モードは、データセット内で最も頻繁に出現する値です。平均や中央値とは異なり、モードは数値データとカテゴリデータの両方に適用できます。これは、データセット内で最も一般的な値を特定するのに役立ちます。

意味は何?

平均 データセット内のすべての値の合計を、データセット内の値の数で割った値です。算術平均とも呼ばれます。 平均 は x̅ と表され、次のように読み取られます。 x バー

平均を計算する式は次のとおりです。

平均値の計算式

平均値の計算式

平均記号

データセットの平均または算術平均を表すために使用される記号は、通常、母集団の平均を指す場合はギリシャ文字の μ (ミュー)、標本平均を指す場合は x̄ (x バー) です。

  • 母集団の平均: μ(ミュー)
  • 標本平均: x̄ (x バー)

これらの記号は、データ ポイントのセットの平均値を表すために統計表記でよく使用されます。

平均値の計算式

平均を計算する式は次のとおりです。

平均 (x̅) = 値の合計 / 値の数

×の場合1、バツ2、バツ3、……、 バツnがデータセットの値である場合、平均は次のように計算されます。

x̅ = (x 1 2 3 + . 。 。 +× n )/n

例: データセット 10、30、40、20、および 50 の平均を求めます。

解決:

データ 10、30、40、20、50 の平均は次のとおりです。

平均 = (すべての値の合計) / (値の数)

平均値 = (10 + 30 + 40 + 20+ 50) / 5 = 30

グループ化されたデータの平均

グループ化されたデータの平均は、さまざまな方法を使用して計算できます。使用される最も一般的な方法については、次の表で説明します。

直接法 仮定平均法 ステップ偏差法

x̅ = ∑fバツ/ ∑ f

どこ、
∑f すべての周波数の合計です

x̅ = a + ∑ fバツ/ ∑ f

どこ、
ある 平均値と仮定されます
d xに等しい
∑f すべての周波数の合計

x̅ = a + h∑ fバツ/ ∑ f

どこ、
a は推定平均値です
= (x– a)/h
h はクラスのサイズです
∑f すべての周波数の合計

詳しくはこちら グループ化されたデータの平均、中央値、最頻値

中央値とは何ですか?

中央値は、並べ替えられたデータの中間値です。データの並べ替えは昇順または降順で行うことができます。中央値は、データを 2 つの等しい半分に分割します。

を計算する式は、 中央値 項の数が偶数である場合の項の数を以下の図に示します。

偶数項の中央値

偶数項の中央値の式

項の数が奇数の場合に項の数の中央値を計算する式を以下の図に示します。

Javaのおっとコンセプト
奇数項の中央値

奇数項の中央値の式

中央値記号

手紙 M は、母集団用かサンプル用かに関係なく、データセットの中央値を表すために一般的に使用されます。この表記法により、統計の概念と計算の表現が簡素化され、さまざまな状況での理解と適用が容易になります。したがって、インドの統計実務では、 M は中央値の記号として広く受け入れられ、理解されています。

中央値の計算式

中央値の計算式は次のとおりです。

データセット内の値の数 (n 値) が奇数の場合、中央値を計算する式は次のとおりです。

中央値 = [(n + 1)/2] 番目 学期

データセット内の値の数 (n 値) が偶数の場合、中央値を計算する式は次のようになります。

中央値 = [(n/2) 番目 項 + {(n/2) + 1} 番目 期間] / 2

例: 指定されたデータセット 30、40、10、20、および 50 の中央値を見つけます。

解決:

データ 30、40、10、20、50 の中央値は、

ステップ1: 指定されたデータを次のように昇順に並べます。

10、20、30、40、50

ステップ2: n (データセットの項数) が偶数か奇数であるかを確認し、それぞれの「n」値でデータの中央値を見つけます。

ステップ 3: ここで、n = 5 (奇数)

中央値 = [(n + 1)/2]番目学期

中央値 = [(5 + 1)/2]番目学期

= 30

グループ化されたデータの中央値

グループ化されたデータの中央値の中央値は、次の式を使用して計算されます。

中央値 = l + [(n/2 – cf) / f]×h

どこ

  • 中央値クラスの下限です
  • n は観測値の数です
  • f 中央クラスの頻度です
  • h クラスサイズです
  • 参照 中央値クラスに先行するクラスの累積頻度です。

詳しくはこちら グループ化されたデータの中央値

モードとは何ですか?

モードは、データ セットの最も頻繁に使用される値または項目です。通常、データ セットには 1 つまたは複数のデータ セットを含めることができます。 モード 価値。データセットに 1 つのモードがある場合、それはユニモーダルと呼ばれます。同様に、データ セットに 2 つのモードが含まれる場合はバイモーダルと呼ばれ、データ セットに 3 つのモードが含まれる場合はトリモーダルと呼ばれます。データセットが複数のモードで構成されている場合、それはマルチモーダル (二峰性または三峰性の可能性があります) として知られています。すべての数値が 1 回しか出現しない場合、データ セットにモードはありません。

モードを計算する式を以下の図に示します。

モード式

中央値の計算式

モードの記号

統計表記における記号は、 一般に、データセットのモードを表すために使用されます。データセット内で最も頻繁に発生する値を示します。この記号は、統計の議論や分析の明瞭さと精度を高めるために最頻値を示すために統計の議論で広く使用されています。

モード式

モード = 最高周波数項

例: 指定されたデータセット 1、2、2、2、3、3、4、5 のモードを見つけます。

逆文字列Java

解決:

与えられたセットは {1, 2, 2, 2, 3, 3, 4, 5} です

上記のデータセットは昇順に並べられています。

上記のデータセットを観察すると、次のことが言えます。

モード = 2

として、それは最も高い周波数を持っています (3)

グループ化されたデータのモード

グループ化されたデータのモードは、次の式を使用して計算されます。

モード = l + [(f 1 + f 0 ) / (2f 1 – f 0 – f 2 )] × h

どこ、

  • f 1 モーダルクラスの周波数、
  • f 0 モーダルクラスに先行するクラスの頻度です。
  • f 2 モーダルクラスの後継クラスの頻度です。
  • h は授業間隔のサイズであり、
  • モーダルクラスの下限です。

詳しくはこちら グループ化されたデータのモード

平均中央モード間の関係

任意のデータ グループについて、3 つの中心的な傾向の平均、中央値、最頻値間の関係を次の図に示します。

モード = 3 中央値 – 2 平均値

平均中央モード間の関係

モード = 3 中央値 – 2 平均値

平均値、中央値、最頻値: この関係の別名は、経験的関係です。特定のデータ セットの他の 2 つのメジャーがわかっている場合、これを使用してメジャーの 1 つを見つけます。 LHS と RHS を切り替えて、この関係をさまざまな方法で書き換えることができます。

レンジとは何ですか?

特定のデータ セットにおいて、データ セットの最大値と最小値の差は、データ セットの範囲と呼ばれます。たとえば、クラス 10 人の生徒の身長 (cm) を昇順に指定すると、それぞれ 160、161、167、169、170、172、174、175、177、181 となります。この場合、データセットの範囲は (181 – 160) = 21 cm となります。

データの範囲

範囲 最高値と最低値の差です。これは、データセット内で数値がどのように分散されているかを理解する方法です。データセットの範囲は、以下の図に示されている式を使用して簡単に計算できます。

範囲の計算式

範囲を求める式

範囲の計算式

範囲を求める式は次のとおりです。

範囲 = 最高値 – 最低値

例: 指定されたデータセット 12、19、6、2、15、4 の範囲を検索します。

解決:

指定されたセットは {12, 19, 6, 2, 15, 4} です

ここ、

最小値 = 2

最高値 = 19

範囲 = 19 − 2 = 17

平均と中央値の違い

平均と中央値の主な違いを次の表に示します。

側面 平均 中央値
意味 すべての値の合計をカウントで割った値 並べ替えられたデータセットの中央の値
計算 平均 = すべての値の合計/数 中央値は、データを昇順または降順に並べたときの中央の値です。
外れ値に対する感度 データセット内の極端な値に大きく影響される可能性がある 極端な値に対する感度が低く、外れ値の影響は最小限に抑えられます
使用例 統計分析や数学でよく使用されます 極値によってデータが歪む場合、または分布が対称ではない場合に役立ちます。

違いを理解するために次の例を見てみましょう。

平均と中央値の違いは、次の例で理解できます。ある学校に、給与が 20,000 ルピーの教師が 8 名、給与が 35,000 ルピーの校長がいて、彼らの平均給与と中央値を求めます。

平均値 = (20000+20000+20000+20000+20000+20000+20000+20000+35000)/9 = 195000/9 = 21666.67

スイング付きジャワ

したがって、 平均給与は ₹21,666.67 です。

中央値の場合、昇順: 20000、20000、20000、20000、20000、20000、20000、20000、35000。

n = 9、

したがって、(9 + 1)/2 = 5

したがって、 中央値は5です 番目 観察。

中央値 = 20000

したがって、 中央値は₹20,000です。

注記: 平均値は極端な値の影響を受けやすいです。

平均値、中央値、最頻値の違い

平均、中央値、および最頻値は、統計における中心的な傾向の尺度です。

特徴

平均

中央値

モード

意味

平均値はすべての値の平均です。

中央値は、データを並べ替えたときの中央の値です。

モードは、データセット内で最も頻繁に発生する値です。

感度

平均値は外れ値に敏感です。

中央値は外れ値の影響を受けません。

モードは外れ値の影響を受けません。

計算

データセットのすべての値を合計し、データセット内の値の合計数で割ることによって計算されます。

データのリストから中央の値を見つけて計算されます。

データセット内でどの値がより多く出現するかを見つけることによって計算されます。

表現

平均値はデータセットに含まれる場合と含まれない場合があります。

中央値の値は常にデータセットの値です。

モードの値も常にデータセットからの値です。

アルファベット番号付き

平均と平均の違い

側面 平均 平均
意味 すべての値の合計をカウントで割った値 すべての値の合計をカウントで割った値
x̄=∑ x/n 平均値の計算式と同じ
重要性 統計や数学でよく使われる 多くの場合、mean と同じ意味で使用されます。
感度 外れ値の影響を受ける 外れ値に対する感度が低くなる可能性があります。
応用 データセットの分析に使用されます 日常の言語や文脈でよく使われます。
表現 通常、次のように記号的に表されます。 メートル 単に平均または平均と呼ばれることがよくあります。
コンテクスト 研究や分析でよく使用されます 日常会話でカジュアルに使われます。

規約 平均と平均 は数学や統計で頻繁に使用され、多くの場合同じ意味で使用されます。ただし、その意味と用途には微妙な違いがあります。

平均、 統計用語では、データセットの算術平均を表します。これは、データセット内のすべての値を合計し、その合計を値の総数で割ることによって計算されます。たとえば、2、4、6、8、10 という数字がある場合、平均は次のようになります。 (2 + 4 + 6 + 8 + 10) / 5 = 6。

一方で、 平均とは、平均値、中央値、最頻値など、中心傾向のさまざまな尺度を指す広義の用語です。 ただし、一般的な使用法では、平均は平均値を具体的に示すことがよくあります。平均と同様に、一連の値を合計し、値の数で割って代表値を取得します。

続きを読む: 平均と平均の差

私たちの日常生活では、平均値、中央値、最頻値の概念を使用しなければならないさまざまな場面に遭遇します。いろいろあります 平均値、中央値、最頻値の適用 、実際の生活とどのようにリンクしているかは次のとおりです。

  • 平均 : 平均または平均は、典型的な値を理解するために日常的な状況で使用されます。たとえば、ある都市の人々の平均収入を知りたい場合は、平均収入を計算します。
  • 中央値: 中央値は世帯収入データに含まれます。極端な値がある場合、収入の中央値は平均よりも典型的な収入をより適切に表します。不動産では、住宅価格の中央値は、特定の地域の住宅の手頃な価格を評価するためによく使用されます。
  • モード: モードは、データセット内で最も頻繁に発生する値を表し、最も一般的な値を特定することが重要なシナリオで使用されます。たとえば、製造では、このモードを使用して生産ラインで最も一般的な欠陥を特定し、品質管理の取り組みを優先することができます。

他の人はこちらも読んでいます:

統計の公式

算術平均のショートカット方法

離散系列の中央値の計算

離散級数におけるモードの計算

結論 – 平均値、中央値、最頻値

平均値、中央値、最頻値 これは、さまざまな分野にわたるデータの分析と解釈に役立つ中心的な傾向の尺度です。算術平均としてよく使用される平均値は、極端な値に敏感です。一方で、 中央値。データセットの中央値を表します。 一方、最頻値は、最も頻繁に発生する値を示します。

平均、中央値、最頻値に関する解決済みの質問

Oracle SQLが等しくない

平均 = (観測値の合計) / (観測値の数)

= (190+153+168+179+194+153+165+187+190+170+165+189+185+153+147 +161+127+180) / 18

= 2871/18

= 159.5

したがって、平均は 159.5 です。

中央値の場合:

与えられた観測値の昇順は次のとおりです。

127、147、153、153、153、161、165、165、168、170、179、180、185、187、189、190、190、194

ここで、n = 18

中央値 = 1/2 [(n/2) + (n/2 + 1)]番目観察
= 1/2 [9 + 10]番目観察
= 1/2 (168 + 170)
= 338/2
= 169

したがって、中央値は 169 です。

モードの場合:

頻度が最も高い数値 = 153

したがって、モード = 53

範囲の場合:

範囲 = 最高値 – 最低値
= 194 – 127
= 67

ステップ1: 指定されたデータを次のように昇順に並べます。

5、12、15、22、23、24、25、25

ステップ2: n (データセットの項数) が偶数か奇数であるかを確認し、それぞれの「n」値でデータの中央値を見つけます。

ステップ 3: ここで、n = 8 (偶数) なので、

中央値 = [(n/2)番目項 + {(n/2) + 1)番目期間] / 2

中央値 = [(8/2)番目項 + {(8/2) + 1}番目期間] / 2

= (22+23) / 2

= 22.5

与えられたデータセット 15、42、65、65、95

頻度が最も高い数値 = 65

モード = 65

平均、中央値、最頻値に関する FAQ

平均値、中央値、最頻値とは何ですか?

平均値、中央値、最頻値は中心傾向の尺度です。これら 3 つの中心傾向の尺度は、データの概要を把握するために使用されます。それらは、特定のデータセットの本質を表します。

平均値、中央値、最頻値の関係は何ですか?

平均中央値と最頻値の関係は次のとおりです。

モード = 3 中央値 – 2 平均値

平均値、中央値、最頻値を見つけるにはどうすればよいですか?

任意のデータセットの平均、中央値、および最頻値は、記事で前述した適切な式を使用して計算されます。

平均値を見つけるにはどうすればよいですか?

平均は平均とも呼ばれ、グループ化されていないデータに対して次の式を使用して計算されます。

  • 平均 = (観測値の合計)/(観測値の数)

グループ化されたデータの場合、平均は 3 つの方法で計算されます

  • 直接法
  • 仮定平均法
  • ステップ偏差法

中央値を見つけるにはどうすればよいですか?

中央値は、データを昇順または降順に並べたときの中間項です。次の式を使用して計算されます。

  • 中央値 = (n + 1)/2 番目 観測値 {n が奇数の場合}
  • 中央値 = (n/2) の平均 番目 および [(n/2) + 1] 番目 観測値 {n が偶数の場合}

モードを見つけるにはどうすればよいですか?

最も高い頻度を持つ値を最頻値と呼びます。 モードが計算されます 観察により、最初に指定された値のセットが昇順または降順に配置され、次に最も高い頻度の値がモードとして記録されます。