logo

Dplyr을 사용하여 R의 기능별로 그룹화

Group_by() 함수는 데이터 프레임을 그룹화하는 R 프로그래밍 언어의 dplyr 패키지에 속합니다. Group_by() 함수만으로는 출력이 제공되지 않습니다. 그 다음에는 수행할 적절한 작업이 포함된 summarise() 함수가 와야 합니다. SQL의 GROUP BY, Excel의 피벗 테이블과 유사하게 작동합니다.

통사론:



group_by(열,…)

통사론:

group_by(col,..) %>% 요약(작업)



사용 중인 데이터 세트:

샘플_슈퍼스토어

Group_by() 켜기단일 열

이는 열을 그룹화할 수 있는 가장 간단한 방법입니다. 그룹화할 열 이름을 group_by() 함수에 전달하고 이 그룹화된 열에 대해 수행할 작업을 summarise() 함수에 전달하면 됩니다.



예: group_by()로 단일 열 그룹화

전가산기 회로

아르 자형




library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_region = df %>%>group_by>(Region) %>%> >summarise>(total_sales =>sum>(Sales),> >total_profits =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_region)>

>

>

산출:

여러 열의 Group_by()

Group_by() 함수는 두 개 이상의 열에 대해 수행될 수도 있으며, 열 이름의 순서가 정확해야 합니다. group_by 함수의 첫 번째 열 이름에 따라 그룹화가 수행되고 두 번째 열에 따라 그룹화가 수행됩니다.

예: 여러 열 그룹화

아르 자형




library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>group_by>(Region, Category) %>%> >summarise>(total_Sales =>sum>(Sales),> >total_Profit =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)>

>

>

산출:

요약 또는 집계 함수의 합계를 대체하여 평균, 개수, 최소값 또는 최대값을 계산할 수도 있습니다. 예를 들어, 위의 동일한 group_by 예에 대한 평균 매출 및 이익을 찾을 수 있습니다.

예:

아르 자형


인터넷 브라우저 설정



library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>group_by>(Region, Category) %>%> >summarise>(mean_Sales =>mean>(Sales),> >mean_Profit =>mean>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)>

>

>

산출: