logo

파이썬 팬더 시리즈

Pandas 시리즈는 다양한 데이터 유형을 저장할 수 있는 1차원 배열로 정의할 수 있습니다. '를 사용하여 리스트, 튜플, 사전을 시리즈로 쉽게 변환할 수 있습니다. 시리즈 ' 방법. 계열의 행 레이블을 인덱스라고 합니다. 시리즈에는 여러 열이 포함될 수 없습니다. 여기에는 다음 매개변수가 있습니다.

    데이터:목록, 사전 또는 스칼라 값일 수 있습니다.색인:인덱스 값은 고유하고 해시 가능해야 합니다. 데이터와 길이가 동일해야 합니다. 인덱스를 전달하지 않으면 기본값 np.정렬(n) 사용하게 될 것이다.유형:계열의 데이터 유형을 나타냅니다.복사:데이터를 복사하는데 사용됩니다.

시리즈 만들기:

두 가지 방법으로 시리즈를 만들 수 있습니다.

자바 정수를 문자열로
  1. 빈 시리즈 만들기
  2. 입력을 사용하여 시리즈를 생성합니다.

빈 시리즈 만들기:

Pandas에서는 빈 시리즈를 쉽게 만들 수 있는데, 이는 아무런 가치도 갖지 않음을 의미합니다.

빈 시리즈를 생성하는 데 사용되는 구문은 다음과 같습니다.

 = pandas.Series() 

아래 예에서는 값이 없고 기본 데이터 유형을 갖는 빈 시리즈 유형 객체를 생성합니다. float64 .

 import pandas as pd x = pd.Series() print (x) 

산출

 Series([], dtype: float64) 

입력을 사용하여 시리즈 생성:

다양한 입력을 사용하여 시리즈를 만들 수 있습니다.

  • 정렬
  • 사전
  • 스칼라 값

배열에서 시리즈 만들기:

워드에 워터마크 삽입

시리즈를 만들기 전에 먼저 멍청하다 모듈을 만든 다음 프로그램에서 array() 함수를 사용합니다. 데이터가 ndarray인 경우 전달된 인덱스의 길이는 동일해야 합니다.

인덱스를 전달하지 않으면 기본적으로 인덱스는 범위(n) n이 배열의 길이를 정의하는 경우(예: [0,1,2,...)가 전달됩니다. 범위(len(배열))-1 ].

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

산출

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

dict에서 시리즈 만들기

dict에서 시리즈를 만들 수도 있습니다. 사전 객체가 입력으로 전달되고 인덱스가 지정되지 않은 경우 사전 키는 정렬된 순서로 가져와 인덱스를 구성합니다. .

인덱스가 전달되면 인덱스의 특정 레이블에 해당하는 값이 사전 .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

산출

 x 0.0 y 1.0 z 2.0 dtype: float64 

Scalar를 사용하여 시리즈 생성:

스칼라 값을 사용하는 경우 인덱스를 제공해야 합니다. 인덱스 길이를 일치시키기 위해 스칼라 값이 반복됩니다.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

산출

 0 4 1 4 2 4 3 4 dtype: int64 

위치를 사용하여 시리즈의 데이터에 액세스:

Series 유형 개체를 생성하면 해당 인덱스, 데이터 및 개별 요소에도 액세스할 수 있습니다.

자바스크립트 경고 상자

Series의 데이터는 ndarray의 데이터와 유사하게 액세스할 수 있습니다.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

산출

 1 

시리즈 객체 속성

Series 속성은 크기, 데이터 유형 등 Series 개체와 관련된 모든 정보로 정의됩니다. 등. 다음은 Series 객체에 대한 정보를 얻는 데 사용할 수 있는 몇 가지 속성입니다.

속성 설명
시리즈.색인 시리즈의 인덱스를 정의합니다.
시리즈.모양 데이터 모양의 튜플을 반환합니다.
Series.dtype 데이터의 데이터 유형을 반환합니다.
시리즈.크기 데이터의 크기를 반환합니다.
시리즈.비어 있음 Series 객체가 비어 있으면 True를 반환하고, 그렇지 않으면 False를 반환합니다.
시리즈.hasnans NaN 값이 있으면 True를 반환하고, 그렇지 않으면 False를 반환합니다.
시리즈.n바이트 데이터의 바이트 수를 반환합니다.
시리즈입니다. 데이터의 차원 수를 반환합니다.
시리즈.항목크기 항목의 데이터 유형 크기를 반환합니다.

시리즈 객체의 인덱스 배열 및 데이터 배열 검색

속성 인덱스와 값을 사용하여 기존 Series 객체의 인덱스 배열과 데이터 배열을 검색할 수 있습니다.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

산출

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

유형(dtype) 및 유형 크기(itemsize) 검색

시리즈 객체의 개별 요소에 대한 데이터 유형을 검색하기 위해 dtype으로 Series 객체와 함께 속성 dtype을 사용할 수 있습니다. 항목 크기 각 데이터 항목에 할당된 바이트 수를 표시하는 속성입니다.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

산출

메이슨 공식
 int64 8 float64 8 

모양 검색

Series 객체의 모양은 누락된 값 또는 빈 값(NaN)을 포함한 총 요소 수를 정의합니다.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

산출

 (4,) (3,) 

차원, 크기 및 바이트 수 검색:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

산출

 1 1 4 3 32 24 

NaN의 공허함과 존재 여부 확인

Series 객체가 비어 있는지 확인하려면 빈 속성 . 마찬가지로 계열 객체에 일부 NaN 값이 포함되어 있는지 확인하려면 다음을 사용할 수 있습니다. 하산 기인하다.

자바 문자열을 배열로

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

산출

 False False True True False False 4 3 3 3 

시리즈 기능

Series에는 다음과 같은 몇 가지 기능이 사용됩니다.

기능 설명
팬더 시리즈.map() 공통 열이 있는 두 계열의 값을 매핑합니다.
팬더 시리즈.std() 주어진 숫자, DataFrame, 열 및 행 집합의 표준 편차를 계산합니다.
팬더 시리즈.to_frame() 시리즈 개체를 데이터 프레임으로 변환합니다.
팬더 시리즈.value_counts() 고유한 값의 개수가 포함된 시리즈를 반환합니다.