Python의 numpy 모듈은 다음과 같은 함수를 제공합니다. numpy.히스토그램() . 이 함수는 일련의 값 범위와 비교되는 값 개수의 빈도를 나타냅니다. 이 기능은 다음과 유사합니다. 역사() 기능 matplotlib.pyplot .
간단히 말해서, 이 함수는 데이터 세트의 히스토그램을 계산하는 데 사용됩니다.
통사론:
numpy.histogram(x, bins=10, range=None, normed=None, weights=None, density=None)
매개변수:
x: array_like
이 매개변수는 히스토그램이 계산되는 평면화된 배열을 정의합니다.
bins: int 또는 str 또는 스칼라 시퀀스(선택 사항)
난수 생성 자바
이 매개변수가 정수로 정의되면 지정된 범위에서 너비가 동일한 Bin의 수를 정의합니다. 그렇지 않으면 단조롭게 증가하는 Bin 가장자리의 배열이 정의됩니다. 또한 균일하지 않은 빈 너비를 허용하는 가장 오른쪽 가장자리도 포함됩니다. 최신 버전의 numpy를 사용하면 bin 매개변수를 문자열로 설정할 수 있으며, 이는 최적의 bin 너비를 계산하는 방법을 정의합니다.
범위 : (부동, 부동)(선택 사항)
우분투의 ipconfig
이 매개변수는 빈의 하한-상한 범위를 정의합니다. 기본적으로 범위는 다음과 같습니다. (x.min(), x.max()) . 범위를 벗어나는 값은 무시됩니다. 첫 번째 요소의 범위는 두 번째 요소보다 작거나 같아야 합니다.
규범 : bool(선택 사항)
이 매개변수는 밀도 인수와 동일하지만 빈 너비가 동일하지 않은 경우 잘못된 출력을 제공할 수 있습니다.
가중치 : array_like(선택 사항)
'사자와 호랑이의 차이점은 무엇입니까'
이 매개변수는 가중치를 포함하고 다음과 같은 모양을 갖는 배열을 정의합니다. '엑스' .
밀도 : bool(선택 사항)
True로 설정하면 모든 빈에 샘플 수가 표시됩니다. 해당 값이 False인 경우 밀도 함수는 빈에 확률 밀도 함수 값을 반환합니다.
보고:
역사: 배열
밀도 함수는 히스토그램의 값을 반환합니다.
edge_bin: float dtype 배열
이 함수는 Bin 가장자리를 반환합니다. (길이(히스트+1)) .
예시 1:
import numpy as np a=np.histogram([1, 5, 2], bins=[0, 1, 2, 3]) a
산출:
자바에는 임의의 생성기가 없습니다.
(array([0, 1, 1], dtype=int64), array([0, 1, 2, 3]))
위의 코드에서
- 별칭 이름이 np인 numpy를 가져왔습니다.
- 변수 'a'를 선언하고 반환된 값을 할당했습니다. np.히스토그램() 기능.
- 함수에 배열과 bin 값을 전달했습니다.
- 마지막으로 우리는 'ㅏ' .
출력에는 히스토그램 값이 포함된 ndarray가 표시됩니다.
자바는 같음
예시 2:
import numpy as np x=np.histogram(np.arange(6), bins=np.arange(7), density=True) x
산출:
(array([0.16666667, 0.16666667, 0.16666667, 0.16666667, 0.16666667, 0.16666667]), array([0, 1, 2, 3, 4, 5, 6]))
예시 3:
import numpy as np x=np.histogram([[1, 3, 1], [1, 3, 1]], bins=[0,1,2,3]) x
산출:
(array([0, 4, 2], dtype=int64), array([0, 1, 2, 3]))
예시 4:
import numpy as np a = np.arange(8) hist, bin_edges = np.histogram(a, density=True) hist bin_edges
산출:
array([0.17857143, 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0.17857143]) array([0. , 0.7, 1.4, 2.1, 2.8, 3.5, 4.2, 4.9, 5.6, 6.3, 7. ])
예시 5:
import numpy as np a = np.arange(8) hist, bin_edges = np.histogram(a, density=True) hist hist.sum() np.sum(hist * np.diff(bin_edges))
산출:
array([0.17857143, 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0.17857143]) 1.4285714285714288 1.0
위의 코드에서
- 별칭 이름이 np인 numpy를 가져왔습니다.
- 우리는 배열을 만들었습니다 'ㅏ' 사용하여 np.arange() 기능.
- 우리는 변수를 선언했습니다. '역사' 그리고 'bin_edges' 그런 다음 반환된 값을 할당했습니다. np.히스토그램() 기능.
- 우리는 배열을 통과했습니다 'ㅏ' 그리고 설정 '밀도' 함수에서 True로 설정합니다.
- 우리는 '역사' .
- 그리고 마지막으로 다음을 사용하여 히스토그램 값의 합을 계산해 보았습니다. 히스트.합() 그리고 np.sum() 히스토그램 값과 빈의 가장자리를 전달했습니다.
출력에는 히스토그램 값과 히스토그램 값의 합이 포함된 ndarray가 표시됩니다.