팬더 데이터프레임 행과 열이 있는 테이블과 같은 2차원 레이블이 지정된 데이터 구조입니다. DataFrame의 크기와 값은 변경 가능합니다. 즉, 수정될 수 있습니다.
DataFrame은 주로 데이터 분석 및 데이터 조작에 사용됩니다. SQL 데이터베이스, MS Excel 또는 Google 스프레드시트와 같은 표 형식으로 데이터를 저장할 수 있으므로 데이터에 대한 산술 연산을 더 쉽게 수행할 수 있습니다.
가장 일반적으로 사용되는 Pandas 개체입니다. 그만큼 데이터프레임() 함수 Pandas에서 DataFrame을 만드는 데 사용됩니다. 다양한 방법으로 Pandas DataFrame을 생성할 수도 있습니다.
팬더 데이터프레임() 구문
pandas.DataFrame(데이터, 인덱스, 열)
카일리 제너는 몇 살입니까?
매개변수:
- 데이터 : DataFrame을 생성할 데이터셋입니다. 목록, 사전, 스칼라 값, 시리즈, 배열 등이 될 수 있습니다.
- 색인 : 선택사항이며 기본적으로 DataFrame의 인덱스는 0부터 시작하여 마지막 데이터 값(n-1)에서 끝납니다. 행 레이블을 명시적으로 정의합니다.
- 기둥 : 이 매개변수는 DataFrame에 열 이름을 제공하는 데 사용됩니다. 열 이름이 기본적으로 정의되지 않은 경우 0에서 n-1 사이의 값을 사용합니다.
보고:
- 데이터프레임 객체
이제 DataFrame() 함수에 대해 논의했으므로 DataFrame을 생성하는 다양한 방법을 살펴보겠습니다.
Python에서 데이터프레임을 생성하는 다양한 방법
생성하는 방법에는 여러 가지가 있습니다. 팬더 데이터프레임 ~에 파이썬 . 다음 방법을 사용하여 DataFrame을 만들 수 있습니다.
- DataFrame() 함수를 사용하여 Pandas DataFrame 만들기
- 목록 목록에서 Pandas DataFrame 만들기
- ndarray/list 사전에서 Pandas DataFrame 만들기
- 사전 목록에서 Pandas DataFrame 만들기
- Series 사전에서 Pandas DataFrame 만들기
- zip() 함수를 사용하여 DataFrame 만들기
- 인덱스 레이블을 명시적으로 증명하여 DataFrame 만들기
DataFrame() 메서드를 사용하여 빈 DataFrame 만들기
Python의 DataFrame은 DataFrame() 함수를 사용하여 생성할 수 있습니다. 팬더 라이브러리 . DataFrame 생성자를 사용하여 함수를 호출하면 DataFrame이 생성됩니다.
예 : Python에서 DataFrame() 함수를 사용하여 빈 DataFrame 만들기
파이썬3
# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df> => pd.DataFrame()> # Printing Empty DataFrame> print> (df)> |
>
>
산출:
Empty DataFrame Columns: [] Index: []>
목록 목록에서 DataFrame 만들기
Pandas DataFrame을 생성하려면 목록 목록의 경우 pd.DataFrame() 함수를 사용할 수 있습니다. 이 함수는 목록 목록을 입력으로 사용하고 입력 목록과 동일한 수의 행과 열이 있는 DataFrame을 만듭니다.
예 : DataFrame() 메서드를 사용하여 목록 목록에서 DataFrame 만들기
파이썬3
# Import pandas library> import> pandas as pd> # initialize list of lists> data> => [[> 'tom'> ,> 10> ], [> 'nick'> ,> 15> ], [> 'juli'> ,> 14> ]]> # Create the pandas DataFrame> df> => pd.DataFrame(data, columns> => [> 'Name'> ,> 'Age'> ])> # print dataframe.> print> (df)> |
>
>
산출:
리눅스 단축키
Name Age 0 tom 10 1 nick 15 2 juli 14>
ndArray/Lists 사전에서 DataFrame 생성
DataFrame을 생성하려면 사전 ~의 ndarrays /lists에서는 모든 배열의 길이가 동일해야 합니다. 인덱스가 전달되면 길이 인덱스는 배열의 길이와 같아야 합니다.
인덱스가 전달되지 않으면 기본적으로 인덱스는 range(n)이 됩니다. 여기서 n은 배열 길이입니다.
예 : ndarray/lists 사전에서 DataFrame 생성
파이썬3
# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'nick'> ,> 'krish'> ,> 'jack'> ],> > 'Age'> : [> 20> ,> 21> ,> 19> ,> 18> ]}> # Create DataFrame> df> => pd.DataFrame(data)> # Print the output.> print> (df)> |
>
>
자바의 정적 키워드
산출:
Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>
메모: 사전을 사용하여 DataFrame을 생성하는 동안 사전의 키는 기본적으로 열 이름이 됩니다. 열 매개변수를 사용하여 명시적으로 열 이름을 제공할 수도 있습니다.
사전 목록에서 DataFrame 만들기
Pandas DataFrame은 다음을 전달하여 생성할 수 있습니다. 사전 목록 입력 데이터로. 기본적으로 사전 키는 열로 사용됩니다.
파이썬3
# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data> => [{> 'a'> :> 1> ,> 'b'> :> 2> ,> 'c'> :> 3> },> > {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates DataFrame.> df> => pd.DataFrame(data)> # Print the data> print> (df)> |
>
>
산출:
a b c 0 1 2 3 1 10 20 30>
또 다른 예는 사전 목록을 전달하여 Pandas DataFrame을 생성하는 것입니다. 행 인덱스 .
파이썬3
# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data> => [{> 'b'> :> 2> ,> 'c'> :> 3> }, {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df> => pd.DataFrame(data, index> => [> 'first'> ,> 'second'> ])> # Print the data> print> (df)> |
>
>
산출:
b c a first 2 3 NaN second 20 30 10.0>
Series 사전에서 DataFrame 만들기
사전에서 DataFrame을 생성하려면 시리즈 , 사전을 전달하여 DataFrame을 형성할 수 있습니다. 결과 인덱스는 전달된 모든 인덱스 계열의 합집합입니다.
예: 시리즈 사전에서 DataFrame을 생성합니다.
파이썬3
자바에서 난수를 생성하는 방법
# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d> => {> 'one'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ]),> > 'two'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ])}> # creates Dataframe.> df> => pd.DataFrame(d)> # print the data.> print> (df)> |
>
>
산출:
one two a 10 10 b 20 20 c 30 30 d 40 40>
zip() 함수를 사용하여 DataFrame 만들기
다음을 사용하여 두 목록을 병합할 수 있습니다. zip() 함수 . 이제 pd.DataFrame() 함수를 호출하여 Pandas DataFrame을 만듭니다.
예: zip() 함수를 사용하여 DataFrame을 생성합니다.
파이썬3
# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name> => [> 'tom'> ,> 'krish'> ,> 'nick'> ,> 'juli'> ]> # List2> Age> => [> 25> ,> 30> ,> 26> ,> 22> ]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples> => list> (> zip> (Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df> => pd.DataFrame(list_of_tuples,> > columns> => [> 'Name'> ,> 'Age'> ])> # Print data.> print> (df)> |
>
자바 수면
>
산출:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
인덱스 레이블을 명시적으로 증명하여 DataFrame을 만듭니다.
인덱스 레이블을 명시적으로 제공하여 DataFrame을 생성하려면 pd.DataFrame() 생성자의 index 매개 변수를 사용할 수 있습니다. index 매개변수는 인덱스 레이블 목록을 입력으로 사용하고 DataFrame은 DataFrame의 행에 대해 이러한 레이블을 사용합니다.
예: 인덱스 레이블을 명시적으로 증명하여 DataFrame 만들기
파이썬3
# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'Jack'> ,> 'nick'> ,> 'juli'> ],> > 'marks'> : [> 99> ,> 98> ,> 95> ,> 90> ]}> # Creates pandas DataFrame.> df> => pd.DataFrame(data, index> => [> 'rank1'> ,> > 'rank2'> ,> > 'rank3'> ,> > 'rank4'> ])> # print the data> print> (df)> |
>
>
산출:
Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>
결론
Python Pandas DataFrame은 행과 열이 있는 테이블과 유사합니다. 2차원 데이터 구조로 데이터 분석 및 데이터 조작에 매우 유용합니다.
이 튜토리얼에서는 Pandas DataFrame을 생성하는 여러 가지 방법을 논의했습니다. 이 튜토리얼을 사용하면 DataFrame 생성에 필요한 복잡한 요구 사항을 처리할 수 있습니다.