logo

右に偏った分布: それは何を意味しますか?

feature_right_skewed_histogram

統計を勉強していますか?データを説明するときに「正規分布」というフレーズを聞いたことがあるでしょう。 しかし、「右に曲がった」という表現はどうでしょうか?右に歪んだヒストグラムはどのように見えるでしょうか? そして何が原因なのでしょうか?

この記事では、右に偏ったヒストグラムの例を示し、正規分布グラフとの違いを説明します。

特徴的な画像: モニカ プレイス /ウィキメディア・コモンズ

正規分布とは何ですか?

データが正しく偏っていることが何を意味するかを説明する前に、正規分布の定義を確認してみましょう。

正規分布では、 2 つ以上の変数が直接の関係を共有して、 対称データセット 左半分は右半分を反映しています。これらのグラフは次のように呼ばれます ベルカーブ 明確に定義された鐘のような形状のため、

body_normal_distribution-300x215

正規分布グラフでは、 平均値、中央値、最頻値はすべて等しい これらの点はすべてデータの中心、つまりグラフのピークを表します。

歪んだ右とはどういう意味ですか?

正規分布は最も一般的な分布形式の 1 つですが、すべてのデータ セットがこの基本曲線に従うわけではありません。言い換えると、 一部のヒストグラムが右または左に歪んでいます

右に歪んだ分布 (「正に歪んだ」分布とも呼ばれる) では、ほとんどのデータがグラフのピークの右側、つまり正側に下がります。したがって、 ヒストグラムは、右側 (または「尾部」) が左側よりも長くなるように歪んでいます。

body_right_skewed_histogram

右に歪んだヒストグラムの例。

右に歪んだヒストグラムでは、平均、中央値、最頻値はすべて異なります。 この場合、最頻値はヒストグラムの最高点ですが、中央値と平均値はその右側 (または視覚的にはピークの右側) にあります。ご了承ください 平均的な意志 いつも 中央値の右側にある

body_skeed_right_left

グラフ A は右に偏り、グラフ B は左に偏ります。右に歪んだグラフでは、平均は常に最頻値 (つまりピーク) の右側に来ます。 ( アシットゴーズ /ウィキメディア・コモンズ) )

これらの機能により、最終的には 典型的な値を割り当てるのが難しい 右に傾いたグラフには明確な中心点がないためです。対照的に、正規分布では、平均、中央値、最頻値がすべて等しく、データ セットの中心に来るため、この値を簡単に使用してデータをより正確に一般化できます。

ヒストグラムが右に歪む原因は何ですか?

右に偏ったデータは通常、 データセットの下限の結果 (一方、データが左に歪んでいるのは境界が高いことによるものです)。したがって、データセットの下限が残りのデータと比較して極端に低い場合、データが右に歪む原因になります。

歪みのもう一つの原因は、 起動効果 。たとえば、プロシージャが最初に長い起動期間中に多くの成功を収めた場合、データに正の歪みが生じる可能性があります。 (逆に、初期障害がいくつかある起動期間では、データにマイナスの歪みが生じる可能性があります。)