통계를 공부하시나요? 그렇다면 데이터를 설명할 때 '정규 분포'라는 말을 들어보셨을 것입니다. 하지만 '오른쪽으로 기울어졌다'라는 문구는 어떻습니까? 오른쪽으로 치우친 히스토그램은 어떤 모양인가요? 그리고 그 원인은 무엇입니까?
이 기사에서는 오른쪽으로 치우친 히스토그램의 예를 제공하고 이것이 정규 분포 그래프와 어떻게 다른지 설명합니다.
추천 이미지: 모니카 플레이스 /위키미디어 공용
자바스크립트로 자다
정규 분포란 무엇입니까?
데이터가 오른쪽으로 치우쳐 있다는 것이 무엇을 의미하는지 설명하기 전에 정규 분포의 정의를 검토해 보겠습니다.
문자열과 비교
정규분포를 사용하면, 두 개 이상의 변수가 직접적인 관계를 공유하여 대칭 데이터 세트 , 왼쪽 절반이 오른쪽 절반을 반영합니다. 이 그래프를 벨 곡선 명확하게 정의된 종 모양의 모양으로 인해:
정규분포 그래프에서, 평균(평균), 중앙값, 최빈값이 모두 동일합니다. . 이러한 점은 모두 데이터의 중심 또는 그래프의 정점을 나타냅니다.
오른쪽으로 치우친 것은 무엇을 의미합니까?
정규 분포는 가장 일반적인 분포 형태 중 하나이지만 모든 데이터 세트가 이 기본 곡선을 따르는 것은 아닙니다. 다시 말해서, 일부 히스토그램이 오른쪽이나 왼쪽으로 치우쳐 있습니다. .
리디마 티와리
오른쪽으로 치우친 분포('양으로 치우친' 분포라고도 함)에서는 대부분의 데이터가 그래프 정점의 오른쪽, 즉 양수 측에 위치합니다. 따라서, 히스토그램은 오른쪽(또는 '꼬리')이 왼쪽보다 길도록 왜곡됩니다.
오른쪽으로 치우친 히스토그램의 예.
오른쪽으로 치우친 히스토그램에서는 평균, 중앙값, 모드가 모두 다릅니다. 이 경우 모드는 히스토그램의 가장 높은 지점인 반면 중앙값과 평균은 오른쪽(또는 시각적으로 피크의 오른쪽)에 위치합니다. 참고하세요 평균은 것입니다 언제나 중앙값 오른쪽에 위치 .
문자열 자바 교체
그래프 A는 오른쪽으로 치우쳐 있고, 그래프 B는 왼쪽으로 치우쳐 있습니다. 오른쪽으로 치우친 그래프의 경우 평균은 항상 최빈값(즉, 최고점)의 오른쪽에 옵니다. ( 아시트고에스 /위키미디어 공용) )
이러한 기능은 궁극적으로 일반적인 값을 할당하기가 어렵습니다. 오른쪽으로 치우친 그래프에는 명확한 중심점이 없기 때문입니다. 반면, 정규 분포에서는 평균, 중앙값, 최빈값이 모두 동일하고 데이터 세트의 중앙에 오기 때문에 이 값을 쉽게 사용하여 데이터를 보다 정확하게 일반화할 수 있습니다.
오른쪽으로 치우친 히스토그램의 원인은 무엇입니까?
일반적으로 오른쪽으로 치우친 데이터는 다음과 같습니다. 데이터 세트의 하한 경계 결과 (반면에 왼쪽으로 치우친 데이터는 더 높은 경계의 결과입니다.) 따라서 데이터 세트의 하한이 나머지 데이터에 비해 매우 낮으면 데이터가 오른쪽으로 치우치게 됩니다.
왜곡의 또 다른 원인은 다음과 같습니다. 시작 효과 . 예를 들어, 처음에 긴 시작 기간 동안 프로시저가 많은 성공을 거둔 경우 데이터에 양의 편향이 발생할 수 있습니다. (반대로 초기 실패가 여러 번 발생한 시작 기간은 데이터를 부정적으로 왜곡시킬 수 있습니다.)