統計を勉強していますか?データを説明するときに「正規分布」というフレーズを聞いたことがあるでしょう。 しかし、「右に曲がった」という表現はどうでしょうか?右に歪んだヒストグラムはどのように見えるでしょうか? そして何が原因なのでしょうか?
この記事では、右に偏ったヒストグラムの例を示し、正規分布グラフとの違いを説明します。
特徴的な画像: モニカ プレイス /ウィキメディア・コモンズ
正規分布とは何ですか?
データが正しく偏っていることが何を意味するかを説明する前に、正規分布の定義を確認してみましょう。
正規分布では、 2 つ以上の変数が直接の関係を共有して、 対称データセット 、 左半分は右半分を反映しています。これらのグラフは次のように呼ばれます ベルカーブ 明確に定義された鐘のような形状のため、
正規分布グラフでは、 平均値、中央値、最頻値はすべて等しい 。 これらの点はすべてデータの中心、つまりグラフのピークを表します。
歪んだ右とはどういう意味ですか?
正規分布は最も一般的な分布形式の 1 つですが、すべてのデータ セットがこの基本曲線に従うわけではありません。言い換えると、 一部のヒストグラムが右または左に歪んでいます 。
右に歪んだ分布 (「正に歪んだ」分布とも呼ばれる) では、ほとんどのデータがグラフのピークの右側、つまり正側に下がります。したがって、 ヒストグラムは、右側 (または「尾部」) が左側よりも長くなるように歪んでいます。
右に歪んだヒストグラムの例。
右に歪んだヒストグラムでは、平均、中央値、最頻値はすべて異なります。 この場合、最頻値はヒストグラムの最高点ですが、中央値と平均値はその右側 (または視覚的にはピークの右側) にあります。ご了承ください 平均的な意志 いつも 中央値の右側にある 。
グラフ A は右に偏り、グラフ B は左に偏ります。右に歪んだグラフでは、平均は常に最頻値 (つまりピーク) の右側に来ます。 ( アシットゴーズ /ウィキメディア・コモンズ) )
これらの機能により、最終的には 典型的な値を割り当てるのが難しい 右に傾いたグラフには明確な中心点がないためです。対照的に、正規分布では、平均、中央値、最頻値がすべて等しく、データ セットの中心に来るため、この値を簡単に使用してデータをより正確に一般化できます。
ヒストグラムが右に歪む原因は何ですか?
右に偏ったデータは通常、 データセットの下限の結果 (一方、データが左に歪んでいるのは境界が高いことによるものです)。したがって、データセットの下限が残りのデータと比較して極端に低い場合、データが右に歪む原因になります。
歪みのもう一つの原因は、 起動効果 。たとえば、プロシージャが最初に長い起動期間中に多くの成功を収めた場合、データに正の歪みが生じる可能性があります。 (逆に、初期障害がいくつかある起動期間では、データにマイナスの歪みが生じる可能性があります。)