기존 DataFrame에 새 열을 추가하는 것은 다음을 사용하여 데이터 분석의 기본 작업입니다. 팬더 . 이를 통해 추가 정보로 데이터를 풍부하게 하고 추가 분석 및 조작을 용이하게 할 수 있습니다. 이 문서에서는 간단한 할당,insert()>방법,assign()>방법. Pandas의 기존 DataFrame에 새 열을 추가하는 방법에 대해 논의해 보겠습니다.
팬더 데이터프레임이란 무엇입니까?
ㅏ 팬더 데이터프레임 레이블이 지정된 축(행 및 열)이 있는 2차원의 크기 변경이 가능하며 잠재적으로 이질적인 표 형식의 데이터 구조입니다. 이는 Python 데이터 과학 생태계의 기본 데이터 구조이며 표 형식 데이터로 작업하는 강력한 방법을 제공합니다.
Pandas DataFrame의 주요 기능은 다음과 같습니다.
- 데이터 표현: 행과 열이 있는 테이블 형식으로 데이터를 저장합니다.
- 이기종 데이터 유형: 다양한 열에 다양한 데이터 유형(예: 정수, 부동 소수점, 문자열, 부울)을 보유할 수 있습니다.
- 라벨링: 각 행과 열에는 레이블(인덱스 및 열 이름)이 있습니다.
- 변하기 쉬운: 데이터 조작 및 수정을 허용합니다.
- 강력한 작업: 데이터 분석, 조작, 탐색을 위한 다양한 기능과 방법을 제공합니다.
- 확장 가능: 라이브러리 및 사용자 정의 기능을 통해 추가 기능으로 사용자 정의하고 확장할 수 있습니다.
Pandas의 기존 DataFrame에 새 열을 추가하는 방법에는 여러 가지가 있습니다. 파이썬 :
- 샘플 데이터프레임 생성
- 사용하여 데이터프레임.삽입() 방법
- 사용하여 데이터프레임.할당() 방법
- 사전 사용
- 목록 사용
- 사용 .장소()
- 기존 데이터 프레임에 둘 이상의 열 추가
샘플 데이터프레임 생성
여기서는 샘플 데이터프레임을 생성합니다.
파이썬3
자바 목록 방법
import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> print>(df)> |
>
>
산출:
Name Height Qualification 0 Jai 5.1 Msc 1 Princi 6.2 MA 2 Gaurav 5.1 Msc 3 Anuj 5.2 Msc>
목록의 길이는 인덱스 열의 길이와 일치해야 합니다. 그렇지 않으면 오류가 표시됩니다.
DataFrame.insert()를 사용하여 기존 Datframe에 새 열 추가
끝뿐만 아니라 원하는 위치에 자유롭게 열을 추가할 수 있습니다. 또한 열 값을 삽입하기 위한 다양한 옵션도 제공합니다.
파이썬3
import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using DataFrame.insert() to add a column> df.insert(>2>,>'Age'>, [>21>,>23>,>24>,>21>],>True>)> # Observe the result> print>(df)> |
>
>
산출:
Name Height Age Qualification 0 Jai 5.1 21 Msc 1 Princi 6.2 23 MA 2 Gaurav 5.1 24 Msc 3 Anuj 5.2 21 Msc>
Dataframe.sign()을 사용하여 Pandas DataFrame에 열 추가
이 메서드는 이전 데이터 프레임에 새 열이 추가된 새 데이터 프레임을 생성합니다.
파이썬3
건너뛰기 목록
import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using 'Address' as the column name and equating it to the list> df2>=> df.assign(address>=>[>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>])> print>(df2)> |
파이썬 새 줄
>
>
산출:
Name Height Qualification address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
Pandas는 사전을 사용하여 DataFrame에 열을 추가합니다.
우리는 파이썬 사전 Pandas DataFrame에 새 열을 추가합니다. 기존 열을 키 값으로 사용하면 해당 값이 새 열의 값이 됩니다.
파이썬3
# Import pandas package> import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Define a dictionary with key values of> # an existing column and their respective> # value pairs as the # values for our new column.> address>=> {>'Delhi'>:>'Jai'>,>'Bangalore'>:>'Princi'>,> >'Patna'>:>'Gaurav'>,>'Chennai'>:>'Anuj'>}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Provide 'Address' as the column name> df[>'Address'>]>=> address> # Observe the output> print>(df)> |
>
>
산출:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
List를 사용하여 Pandas DataFrame에 새 열 추가
이 예에서는 Pandas는 목록에서 새 열을 추가합니다. 사전과 목록을 사용하여 기존 Pandas DataFrame에 대한 주소를 지정합니다.
의도 의도
파이썬3
# Declare a list that is to be converted into a column> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Using 'Address' as the column name> # and equating it to the list> df[>'Address'>]>=> address> print>(df)> |
>
>
산출:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
Dataframe.loc()를 사용하여 기존 Pandas DataFrame에 새 열 추가
이 예에서는 Pandas DataFrame이라는 이름을 생성합니다.df>Name, Height 및 Qualification 열을 사용하고 다음을 사용하여 새 열 Address를 추가합니다.loc>기인하다.
파이썬3
import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> # Create the list of new column values> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Add the new column using loc> df.loc[:,>'Address'>]>=> address> print>(df)> |
>
>
산출:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
기존 데이터 프레임에 둘 이상의 열 추가
이 예에서는 기존 Pandas DataFrame을 확장합니다.df>각각의 데이터 목록을 사용하는 Age 및 State라는 두 개의 새로운 열이 있습니다.
파이썬3
import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>],> >'Address'>: [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]}> df>=> pd.DataFrame(data)> # Define new data for additional columns> age>=> [>22>,>25>,>23>,>24>]> state>=> [>'NCT'>,>'Karnataka'>,>'Tamil Nadu'>,>'Bihar'>]> # Add multiple columns using dictionary assignment> new_data>=> {>'Age'>: age,>'State'>: state }> df>=> df.assign(>*>*>new_data)> print>(df)> |
알파벳 숫자
>
>
산출:
Name Height Qualification Address Age State 0 Jai 5.1 Msc Delhi 22 NCT 1 Princi 6.2 MA Bangalore 25 Karnataka 2 Gaurav 5.1 Msc Chennai 23 Tamil Nadu 3 Anuj 5.2 Msc Patna 24 Bihar>
결론
Pandas에서 데이터를 탐색하고 조작하려면 DataFrames에 새 열을 추가하는 방법을 이해하는 것이 필수적입니다. 적절한 방법을 선택하는 것은 특정 상황과 원하는 결과에 따라 달라집니다. 이러한 기술을 익히면 데이터를 효과적으로 조작, 분석하고 귀중한 통찰력을 얻을 수 있습니다.