Group_by() 関数は、R プログラミング言語の dplyr パッケージに属し、データ フレームをグループ化します。 Group_by() 関数だけでは出力は得られません。その後に、適切なアクションを実行する summarise() 関数を続ける必要があります。 SQL の GROUP BY や Excel のピボット テーブルと同様に機能します。
構文:
group_by(col,…)
構文:
group_by(col,..) %>% summarise(action)
使用中のデータセット:
サンプル_スーパーストア
Group_by() で ある 単一列
これは列をグループ化する最も簡単な方法です。グループ化する列の名前を group_by() 関数に渡し、このグループ化された列に対して実行するアクションを summarise() 関数に渡すだけです。
例: group_by() による単一列のグループ化
メイブンとは何ですか
R
library> (dplyr)> df => read.csv> (> 'Sample_Superstore.csv'> )> df_grp_region = df %>%>> > summarise> (total_sales => sum> (Sales),> > total_profits => sum> (Profit),> > .groups => 'drop'> )> View> (df_grp_region)> |
>
>
出力:
複数の列に対する Group_by()
Group_by() 関数は 2 つ以上の列に対して実行することもできます。列名は正しい順序である必要があります。グループ化は group_by 関数の最初の列名に従って行われ、次に 2 番目の列に従ってグループ化が行われます。
例: 複数の列をグループ化する
R
library> (dplyr)> df => read.csv> (> 'Sample_Superstore.csv'> )> df_grp_reg_cat = df %>%>> > summarise> (total_Sales => sum> (Sales),> > total_Profit => sum> (Profit),> > .groups => 'drop'> )> View> (df_grp_reg_cat)> |
>
文字列を int に変換する
>
出力:
また、集計関数または集計関数の合計を置き換えることによって、平均、個数、最小値または最大値を計算することもできます。たとえば、上記の同じ group_by の例の平均売上と利益を求めます。
例:
R
library> (dplyr)> df => read.csv> (> 'Sample_Superstore.csv'> )> df_grp_reg_cat = df %>%>> > summarise> (mean_Sales => mean> (Sales),> > mean_Profit => mean> (Profit),> > .groups => 'drop'> )> View> (df_grp_reg_cat)> |
>
>
出力: