Group_by() 関数は、R プログラミング言語の dplyr パッケージに属し、データ フレームをグループ化します。 Group_by() 関数だけでは出力は得られません。その後に、適切なアクションを実行する summarise() 関数を続ける必要があります。 SQL の GROUP BY や Excel のピボット テーブルと同様に機能します。
構文:
group_by(col,…)
構文:
group_by(col,..) %>% summarise(action)
使用中のデータセット:
サンプル_スーパーストア
Group_by() で ある 単一列
これは列をグループ化する最も簡単な方法です。グループ化する列の名前を group_by() 関数に渡し、このグループ化された列に対して実行するアクションを summarise() 関数に渡すだけです。
例: group_by() による単一列のグループ化
メイブンとは何ですか
R
library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_region = df %>%>> >summarise>(total_sales =>sum>(Sales),> >total_profits =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_region)> |
>
>
出力:
複数の列に対する Group_by()
Group_by() 関数は 2 つ以上の列に対して実行することもできます。列名は正しい順序である必要があります。グループ化は group_by 関数の最初の列名に従って行われ、次に 2 番目の列に従ってグループ化が行われます。
例: 複数の列をグループ化する
R
library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>> >summarise>(total_Sales =>sum>(Sales),> >total_Profit =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)> |
>
文字列を int に変換する
>
出力:
また、集計関数または集計関数の合計を置き換えることによって、平均、個数、最小値または最大値を計算することもできます。たとえば、上記の同じ group_by の例の平均売上と利益を求めます。
例:
R
library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>> >summarise>(mean_Sales =>mean>(Sales),> >mean_Profit =>mean>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)> |
>
>
出力: