logo

파이썬 | 팬더 DataFrame.set_index()

이 기사에서는 Python의 Pandas DataFrame.set_index()에 대해 설명합니다. 파이썬 데이터 중심 패키지의 뛰어난 생태계 덕분에 데이터 분석을 위한 탁월한 언어로 돋보입니다. 이 패키지 중에는 팬더 데이터 가져오기 및 분석을 단순화하는 데 중요한 역할을 합니다.

팬더 DataFrame.set_index() 구문

통사론: DataFrame.set_index(keys, drop=True, 추가=False, inplace=False, verify_integrity=False)



매개변수:

  • 키: 열 이름 또는 열 이름 목록입니다.
  • 떨어지다: True일 경우 인덱스에 사용되는 열을 삭제하는 부울 값입니다.
  • 추가: True인 경우 지정된 열을 기존 인덱스 열에 추가합니다.
  • 제자리에: True이면 DataFrame 자체에서 변경이 이루어집니다.
  • verify_무결성: True인 경우 새 인덱스 열에 중복 항목이 있는지 확인합니다.

팬더 DataFrame.set_index() 란 무엇입니까?

팬더 데이터프레임. set_index() 메서드는 목록, 시리즈 또는 다른 데이터 프레임을 주어진 데이터 프레임의 인덱스로 할당하는 데 사용됩니다. 여러 데이터 프레임을 결합할 때 특히 유용하며 인덱스를 쉽게 수정할 수 있습니다. 데이터 프레임 생성 중에 인덱스 열을 지정할 수 있지만 set_index()는 나중에 인덱스를 변경할 수 있는 유연한 방법을 제공합니다. 본질적으로 목록, 시리즈 또는 데이터 프레임을 데이터 프레임의 인덱스로 설정할 수 있습니다. 그러나 때로는 데이터 프레임이 두 개 이상의 데이터 프레임으로 구성되므로 이 방법을 사용하여 나중에 인덱스를 변경할 수 있습니다.

사용된 CSV 파일을 다운로드하려면 다음을 클릭하세요. 여기.



팬더 DataFrame.set_index() 예

다음은 Pandas DataFrame.set_index()에 대한 예제의 적절한 그림입니다.

  • Pandas는 인덱스를 열로 설정합니다.
  • 다중 인덱스 열
  • 단일 설정 플로트 컬럼 색인으로
  • 환경 세 개의 열 ~처럼 멀티인덱스
  • Pandas는 특정 열의 인덱스를 설정합니다.

Pandas는 인덱스를 열로 설정합니다.

이 예에서는 인덱스 열을 변경하고 있으며 이름 열은 데이터 프레임의 인덱스 열로 만들어졌습니다.

파이썬3




# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index(>'First Name'>, inplace>=> True>)> # display> data.head()>

>

>

산출 : 수술 전 –

수술 후 –

출력 이미지에 표시된 것처럼 이전에는 인덱스 열이 일련의 숫자였지만 나중에는 이름으로 대체되었습니다.

Pandas는 인덱스를 다중 인덱스 열로 설정합니다.

이 예에서는 두 개의 열이 인덱스 열로 만들어집니다. Drop 매개변수는 열을 삭제하는 데 사용되고, 추가 매개변수는 전달된 열을 이미 존재하는 인덱스 열에 추가하는 데 사용됩니다.

파이썬3




# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index([>'First Name'>,>'Gender'>], inplace>=> True>,> >append>=> True>, drop>=> False>)> # display> data.head()>

>

>

산출:

출력 이미지에 표시된 것처럼 데이터에는 3개의 인덱스 열이 있습니다.

Pandas Dataframe Index 단일 설정 플로트 컬럼 색인으로

이 예에서 아래 코드 조각은 Pandas 라이브러리를 사용하여 학생 데이터의 중첩 목록에서 'df'라는 DataFrame을 생성합니다. 'Agg_Marks' 열을 인덱스로 설정하고 'Name', 'Age', 'City' 및 'Country' 열이 포함된 결과 DataFrame을 표시합니다.

파이썬3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # here we set Float column 'Agg_Marks' as index of data frame> # using dataframe.set_index() function> df>=> df.set_index(>'Agg_Marks'>)> # Displaying the Data frame> df>

>

>

출력 :

 Name Age City Country Agg_Marks 85.96 jack 34 Sydeny Australia 95.20 Riti 30 Delhi India 85.25 Vansh 31 Delhi India 74.21 Nanyu 32 Tokyo Japan 99.63 Maychan 16 New York US 47.28 Mike 17 las vegas US>

위의 예에서는 ' 열을 설정했습니다. Agg_Marks '를 데이터 프레임의 인덱스로 사용합니다.

Pandas 데이터 프레임 인덱스 설정 세 개의 열 ~처럼 멀티인덱스

이 예에서 아래 코드는 Pandas를 활용하여 'Name', 'Age', 'City', 'Country', 'Agg_Marks' 및 'ID' 열이 있는 학생 데이터에서 DataFrame 'df'를 생성합니다. `set_index()` 함수를 사용하여 'Name', 'City', 'ID'를 사용하여 다중 레벨 인덱스를 설정한 다음 결과 DataFrame을 표시합니다.

파이썬3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>,>400>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>,>750>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>,>101>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>,>900>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>,>420>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>,>555>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>,>'ID'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # Here we pass list of 3 columns i.e 'Name', 'City' and 'ID'> # to dataframe.set_index() function> # to set them as multiIndex of dataframe> df>=> df.set_index([>'Name'>,>'City'>,>'ID'>])> # Displaying the Data frame> df>

>

>

출력 :

JSON 파일
 Age Country Agg_Marks Name City ID jack Sydeny 400 34 Australia 85.96 Riti Delhi 750 30 India 95.20 Vansh Delhi 101 31 India 85.25 Nanyu Tokyo 900 32 Japan 74.21 Maychan New York 420 16 US 99.63 Mike las vegas 555 17 US 47.28>

위의 예에서는 ' 이름 ',' 도시 ', 그리고 ' ID ' 데이터 프레임의 multiIndex로.

Pandas는 특정 열의 인덱스를 설정합니다.

이 예에서 아래 코드는 Pandas를 사용하여 DataFrame을 생성하고 특정 열(이 경우 'Name')을 인덱스로 설정하는 방법을 보여줍니다.set_index()>메서드를 선택한 다음 원본 및 수정된 DataFrame을 모두 표시합니다. 그만큼inplace=True>매개변수를 사용하면 재할당할 필요 없이 변경 사항이 DataFrame에 직접 적용됩니다.

파이썬3




import> pandas as pd> # Creating a sample DataFrame> data>=> {>'Name'>: [>'Geek1'>,>'Geek2'>,>'Geek3'>],> >'Age'>: [>25>,>30>,>35>],> >'City'>: [>'New York'>,>'San Francisco'>,>'Los Angeles'>]}> df>=> pd.DataFrame(data)> # Displaying the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using set_index() to set 'Name' column as the index> df.set_index(>'Name'>, inplace>=>True>)> # Displaying the DataFrame after setting the index> print>(>' DataFrame after set_index:'>)> print>(df)>

>

>

출력 :

Original DataFrame: Name Age City 0 Geek1 25 New York 1 Geek2 30 San Francisco 2 Geek3 35 Los Angeles DataFrame after set_index: Age City Name Geek1 25 New York Geek2 30 San Francisco Geek3 35 Los Angeles>