箱グラフとは、情報をそれぞれ箱ひげ図にして分布の形で表示するためのグラフです。このデータの分布は、5 つのセット (最小値、第 1 四分位数、中央値、第 3 四分位数、最大値) に基づいています。
箱ひげ図 R プログラミング言語
箱ひげ図は R で次を使用して作成されます。 箱ひげ図() 関数。
構文: boxplot(x, データ, ノッチ, varwidth, 名前, メイン)
パラメーター:
x: このパラメータはベクトルまたは数式として設定されます。 data: このパラメータはデータ フレームを設定します。 notch: このパラメータは横軸のラベルです。 varwidth: このパラメータは論理値です。 true に設定すると、サンプル サイズに比例してボックスの幅が描画されます。 main: このパラメータはチャートのタイトルです。 names: このパラメータは、各箱ひげ図の下に表示されるグループ ラベルです。
データセットの作成
箱ひげ図を作成する方法を理解するには、次のようにします。
- データセット mtcars を使用します。
- mtcars の列 mpg と cyl を見てみましょう。
R
アナコンダ vs パイソンヘビ
input <- mtcars[,>c>(>'mpg'>,>'cyl'>)]> print>(>head>(input))> |
>
>
出力:
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6>
箱ひげ図の作成
箱ひげ図グラフを作成します。
- 箱ひげ図を作成するために必要なパラメータを取得します。
- ここで、mpg と cyl の関係をグラフに描きます。
R
# Load the dataset> data>(mtcars)> # Create the box plot> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>,> >xlab =>'Gear'>,> >ylab =>'Displacement'>)> |
>
>
出力:

R の箱ひげ図
ノッチを使用した箱ひげ図
ノッチを使用して箱ひげ図を描画するには:
- Notch の助けを借りて、さまざまなデータ グループの中央値が互いにどのように一致するかを調べることができます。
R
AWSSNS
# Load the dataset> data>(mtcars)> # Set up plot colors> my_colors <->c>(>'#FFA500'>,>'#008000'>,>'#1E90FF'>,>'#FF1493'>)> # Create the box plot with customized aesthetics> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>, xlab =>'Gear'>, ylab =>'Displacement'>,> >col = my_colors, border =>'black'>, notch =>TRUE>, notchwidth = 0.5,> >medcol =>'white'>, whiskcol =>'black'>, boxwex = 0.5, outpch = 19,> >outcol =>'black'>)> # Add a legend> legend>(>'topright'>, legend =>unique>(mtcars$gear),> >fill = my_colors, border =>'black'>, title =>'Gear'>)> |
>
>
出力:

R の箱ひげ図
列: 色のベクトル (my_colors) を使用して、ボックスの塗りつぶしの色を変更します。
境界線: ボックスの境界線の色を黒に設定します。
ノッチ: 信頼区間を示すために、ボックスにノッチが追加されています。
ノッチ幅: ノッチの幅を管理します。
メドコール: 正中線の色を白にします。
ウィスクコール: whiscol コマンドを使用して、ひげの色を黒に設定します。
ボックスウェクス: ボックスの幅を変更します。
アウトピッチ : 外れ値の形状を実線の円に設定します。
アウトコール: 外れ値の色を黒に変更します。
複数の箱ひげ図
ここでは複数の箱ひげ図を作成しています。箱ひげ図表現が必要な個々のデータは関数に基づいています。
R
# Load the dataset> data>(mtcars)> # Define the variables for the box plots> variables <->c>(>'mpg'>,>'disp'>,>'hp'>,>'wt'>)> # Set up the plotting layout> par>(mfrow =>c>(1,>length>(variables)))> # Create the box plots> for>(var>in> variables) {> >boxplot>(>get>(var) ~ gear, data = mtcars,> >main =>paste>(>'Box Plot of'>, var),> >xlab =>'Gear'>,> >ylab = var,> >col =>'skyblue'>,> >border =>'black'>,> >notch =>TRUE>,> >notchwidth = 0.5,> >medcol =>'white'>,> >whiskcol =>'black'>,> >boxwex = 0.5,> >outpch = 19,> >outcol =>'black'>)> }> # Reset the plotting layout> par>(mfrow =>c>(1, 1))> |
>
カット・ティンフの妹
>
出力:

R の複数の箱ひげ図
- このコードでは、箱ひげ図を作成する変数ベクトル内の変数をリストすることから始めます。この例では mpg、disp、hp、wt を追加しましたが、必要に応じてこのリストを変更できます。
- 次に、par 関数と構文 mfrow = c(1, length(variables)) を使用してグラフ レイアウトを作成します。これにより、変数ベクトル内の変数と同じ数の 1 行と列を含むグリッドが生成されます。
- ループ内で boxplot 関数を使用して、各変数の箱ひげ図を生成します。 get(var) 関数は、一致する列の値をデータセットから動的に取得します。指定された設定を使用して、各箱ひげ図の外観を変更します。