logo

Dplyr を使用した R の関数によるグループ化

Group_by() 関数は、R プログラミング言語の dplyr パッケージに属し、データ フレームをグループ化します。 Group_by() 関数だけでは出力は得られません。その後に、適切なアクションを実行する summarise() 関数を続ける必要があります。 SQL の GROUP BY や Excel のピボット テーブルと同様に機能します。

構文:



group_by(col,…)

構文:

group_by(col,..) %>% summarise(action)



使用中のデータセット:

サンプル_スーパーストア

Group_by() で ある 単一列

これは列をグループ化する最も簡単な方法です。グループ化する列の名前を group_by() 関数に渡し、このグループ化された列に対して実行するアクションを summarise() 関数に渡すだけです。



例: group_by() による単一列のグループ化

メイブンとは何ですか

R




library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_region = df %>%>>(Region) %>%>> >summarise>(total_sales =>sum>(Sales),> >total_profits =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_region)>

>

>

出力:

複数の列に対する Group_by()

Group_by() 関数は 2 つ以上の列に対して実行することもできます。列名は正しい順序である必要があります。グループ化は group_by 関数の最初の列名に従って行われ、次に 2 番目の列に従ってグループ化が行われます。

例: 複数の列をグループ化する

R




library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>>(Region, Category) %>%>> >summarise>(total_Sales =>sum>(Sales),> >total_Profit =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)>

>

文字列を int に変換する
>

出力:

また、集計関数または集計関数の合計を置き換えることによって、平均、個数、最小値または最大値を計算することもできます。たとえば、上記の同じ group_by の例の平均売上と利益を求めます。

例:

R




library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>>(Region, Category) %>%>> >summarise>(mean_Sales =>mean>(Sales),> >mean_Profit =>mean>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)>

>

>

出力: