상자 그래프는 정보 각각에 대해 상자 그림을 그려 분포 형태로 정보를 표시하는 데 사용되는 차트입니다. 이러한 데이터 분포는 5개 세트(최소값, 1분위수, 중앙값, 3분위수, 최대값)를 기반으로 합니다.
상자 그림 R 프로그래밍 언어
상자 그림은 R에서 다음을 사용하여 생성됩니다. 상자 그림() 기능.
통사론: boxplot(x, 데이터, 노치, 가변폭, 이름, 메인)
매개변수:
x: 이 매개변수는 벡터 또는 공식으로 설정됩니다. data: 이 매개변수는 데이터 프레임을 설정합니다. 노치: 이 매개변수는 수평 축의 레이블입니다. varwidth: 이 매개변수는 논리값입니다. 샘플 크기에 비례하여 상자의 너비를 그리려면 true로 설정합니다. main: 이 매개변수는 차트의 제목입니다. 이름: 이 매개변수는 각 상자 그림 아래에 표시될 그룹 레이블입니다.
데이터 세트 만들기
상자 그림을 만드는 방법을 이해하려면 다음을 수행하십시오.
- 우리는 mtcars 데이터 세트를 사용합니다.
- mtcars의 mpg 및 cyl 열을 살펴보겠습니다.
아르 자형
Java에서 csv 파일 읽기
input <- mtcars[,>c>(>'mpg'>,>'cyl'>)]> print>(>head>(input))> |
>
>
산출:
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6>
상자 그림 만들기
상자 그림 그래프 만들기.
- 상자 그림을 만드는 데 필요한 매개변수를 사용합니다.
- 이제 mpg와 cyl 사이의 관계에 대한 그래프를 그립니다.
아르 자형
# Load the dataset> data>(mtcars)> # Create the box plot> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>,> >xlab =>'Gear'>,> >ylab =>'Displacement'>)> |
>
>
산출:

R의 상자 그림
노치를 이용한 상자 그림
노치를 사용하여 상자 그림을 그리려면 다음을 수행하십시오.
- Notch의 도움으로 다양한 데이터 그룹의 중앙값이 어떻게 서로 일치하는지 확인할 수 있습니다.
아르 자형
SQL의 다른 테이블에서 열을 선택하는 방법
# Load the dataset> data>(mtcars)> # Set up plot colors> my_colors <->c>(>'#FFA500'>,>'#008000'>,>'#1E90FF'>,>'#FF1493'>)> # Create the box plot with customized aesthetics> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>, xlab =>'Gear'>, ylab =>'Displacement'>,> >col = my_colors, border =>'black'>, notch =>TRUE>, notchwidth = 0.5,> >medcol =>'white'>, whiskcol =>'black'>, boxwex = 0.5, outpch = 19,> >outcol =>'black'>)> # Add a legend> legend>(>'topright'>, legend =>unique>(mtcars$gear),> >fill = my_colors, border =>'black'>, title =>'Gear'>)> |
>
>
산출:

R의 상자 그림
안부: 색상 벡터(my_colors)를 사용하여 상자 채우기 색상을 변경합니다.
테두리: 상자 테두리의 색상을 검정색으로 설정합니다.
골짜기: 신뢰 구간을 설명하기 위해 상자에 노치가 추가됩니다.
노치폭: 노치의 너비를 관리합니다.
의과대학: 중앙선의 색상을 흰색으로 만듭니다.
위스키콜: Whiscol 명령을 사용하여 수염의 색상을 검은색으로 설정합니다.
박스웩스: 상자의 너비를 수정합니다.
아웃피치 : 이상치의 모양을 단색 원으로 설정합니다.
아웃콜: 이상치의 색상을 검은색으로 변경합니다.
다중 상자 그림
여기서는 여러 상자 그림을 만듭니다. 상자 그림 표현이 필요한 개별 데이터는 기능을 기반으로 합니다.
아르 자형
# Load the dataset> data>(mtcars)> # Define the variables for the box plots> variables <->c>(>'mpg'>,>'disp'>,>'hp'>,>'wt'>)> # Set up the plotting layout> par>(mfrow =>c>(1,>length>(variables)))> # Create the box plots> for>(var>in> variables) {> >boxplot>(>get>(var) ~ gear, data = mtcars,> >main =>paste>(>'Box Plot of'>, var),> >xlab =>'Gear'>,> >ylab = var,> >col =>'skyblue'>,> >border =>'black'>,> >notch =>TRUE>,> >notchwidth = 0.5,> >medcol =>'white'>,> >whiskcol =>'black'>,> >boxwex = 0.5,> >outpch = 19,> >outcol =>'black'>)> }> # Reset the plotting layout> par>(mfrow =>c>(1, 1))> |
>
맘타 쿨카르니
>
산출:

R의 다중 상자 그림
- 이 코드에서는 상자 그림을 만들려는 변수 벡터의 변수를 나열하는 것부터 시작합니다. 이 예에서는 mpg, disp, hp 및 wt를 추가했지만 필요에 맞게 이 목록을 변경할 수 있습니다.
- 그런 다음 par 함수와 mfrow = c(1, length(variables)) 구문을 사용하여 차트 레이아웃을 생성합니다. 이 구문은 변수 벡터에 있는 변수 수만큼 행과 열이 있는 그리드를 생성합니다.
- 루프 내에서 boxplot 함수를 사용하여 각 변수에 대한 상자 그림을 생성합니다. get(var) 함수는 데이터 세트에서 일치하는 열 값을 동적으로 가져옵니다. 주어진 설정을 사용하여 각 상자 그림의 모양을 변경합니다.