Pandas Dataframe에서 하나 또는 여러 개의 열을 삭제하는 방법을 논의해 보겠습니다. 열을 삭제하려면 팬더 데이터프레임 또는 Pandas Dataframe에서 하나 이상의 열을 삭제하는 것은 여러 가지 방법으로 달성할 수 있습니다.
Pandas Dataframe에서 하나 또는 여러 열 삭제
Pandas Dataframe에서 하나 또는 여러 개의 열을 삭제하는 다양한 방법이 있습니다. 우리는 Pandas Dataframe에서 하나 또는 여러 개의 열을 삭제하는 데 일반적으로 사용되는 몇 가지 방법을 논의하고 있습니다.
데이터프레임 생성
먼저 목록 사전을 사용하여 간단한 데이터 프레임을 만듭니다. 즉, 열 이름은 다음과 같습니다. 에이 비 씨 디이 . 이 기사에서는 Pandas DataFrame에서 일부 열을 삭제하는 6가지 방법을 다룹니다.
파이썬 # Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df> 출력 :
A B C D E 0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E2 2 A3 B3 C3 D3 E3 3 A4 B4 C4 D4 E4 4 A5 B5 C5 D5 E5>
df.drop() 메서드를 사용하여 Pandas의 데이터프레임 드롭 열
예시 1: 이 예에서는 아래 코드에서 사용하는 것처럼 특정 단일 열을 제거합니다. 팬더 사전에서 DataFrame을 생성한 다음 다음을 사용하여 'A' 열을 제거합니다.drop>방법axis=1>. 그러나 원본 DataFrame('df')은 변경되지 않은 상태로 유지된다는 점에 유의하는 것이 중요합니다.inplace=True>매개변수가 사용되거나 결과가 'df'에 다시 할당됩니다.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove column name 'A' df.drop(['A'], axis=1)> 출력 :
B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>
예시 2: 이 예에서 아래 코드는 Pandas를 사용하여 사전에서 DataFrame을 생성한 다음 'C' 및 'D' 열을 제거하므로 특정 여러 열을 제거합니다.drop>방법axis=1>. 그러나 결과가 다시 할당되거나 할당되지 않는 한 원래 DataFrame('df')은 변경되지 않은 상태로 유지됩니다.inplace=True>사용. 또는 다음을 사용하여 동일한 작업을 수행할 수 있습니다.df.drop(columns=['C', 'D'])>.
파이썬
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove two columns name is 'C' and 'D' df.drop(['C', 'D'], axis=1) # df.drop(columns =['C', 'D'])> 출력 :
A B E 0 A1 B1 E1 1 A2 B2 E2 2 A3 B3 E3 3 A4 B4 E4 4 A5 B5 E5>
예시 3: 이 예에서는 아래 코드가 사전에서 Pandas DataFrame을 생성하고 `drop` 메서드를 사용하여 인덱스 위치를 기반으로 세 개의 열('A', 'E', 'C')을 제거하므로 열 인덱스를 기반으로 열을 제거합니다. 축=1`. 수정된 DataFrame이 표시되고 변경 사항이 적용됩니다(`inplace=True`).
파이썬 # Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove three columns as index base df.drop(df.columns[[0, 4, 2]], axis=1, inplace=True) df> 출력 :
B D 0 B1 D1 1 B2 D2 2 B3 D3 3 B4 D4 4 B5 D5>
df.iloc[] 메서드를 사용하여 Pandas에서 데이터프레임 드롭 열
이 예에서는 아래 코드는 Pandas를 활용하여 사전에서 DataFrame을 생성한 다음 다음을 사용하여 열 인덱스 1~3 사이의 모든 열을 제거하므로 특정 시작 열과 끝 열 사이의 열을 삭제합니다.drop>방법axis=1>. 변경 사항이 적용됩니다(inplace=True>), 수정된 DataFrame이 표시됩니다.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column index 1 to 3 df.drop(df.iloc[:, 1:3], inplace=True, axis=1) df> 산출:
A D E 0 A1 D1 E1 1 A2 D2 E2 2 A3 D3 E3 3 A4 D4 E4 4 A5 D5 E5>
Pandas는 df.ix() 메서드를 사용하여 데이터 프레임에서 열을 삭제합니다.
이 예에서는 Pandas를 사용하여 아래 코드와 같이 특정 열 이름 사이의 열을 제거하고 사전에서 DataFrame을 생성한 다음drop>방법axis=1>. 그러나 결과가 다시 할당되거나 할당되지 않는 한 원래 DataFrame('df')은 변경되지 않은 상태로 유지됩니다.inplace=True>사용.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.ix[:, 'B':'D'].columns, axis=1)> 출력 :
A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>
Pandas는 df.loc[] 메서드를 사용하여 데이터프레임에서 열을 삭제합니다.
이 예에서는 다음과 같이 특정 열 이름 사이에 열을 삭제합니다. 아래 코드 사용 팬더 사전에서 DataFrame을 생성한 다음 다음을 사용하여 열 이름 'B'와 'D' 사이의 모든 열을 제거합니다.drop>방법axis=1>. 수정된 DataFrame은 어떤 변수에도 다시 할당되지 않으며 원래 DataFrame은 변경되지 않은 상태로 유지됩니다.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.loc[:, 'B':'D'].columns, axis=1)> 출력 :
A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>
메모: 다른 loc()과 iloc()는 iloc()에서 마지막 열 범위 요소를 제외합니다.
Pandas는 반복 방법을 사용하여 Datafram에서 열을 삭제합니다.
이 예에서는 아래 코드가 특정 열 이름 사이의 열을 삭제하여 Pandas DataFrame을 생성합니다. 사전 해당 열을 반복합니다. 각 열의 열 이름에 문자 'A'가 있으면 해당 열이 DataFrame에서 삭제됩니다. 수정된 결과 DataFrame이 표시됩니다.
파이썬 # Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) for col in df.columns: if 'A' in col: del df[col] df> 출력 :
B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>
Dataframe.pop() 메서드를 사용하여 Pandas의 데이터프레임 드롭 열
이 예에서는 DataFrame에서 특정 열 제거 코드에서 사전에서 생성된 Pandas DataFrame에서 특정 열('B')을 제거하는 방법을 보여줍니다. 그것은 pop> 메서드를 실행하면 수정된 결과 DataFrame이 표시됩니다.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df.pop('B') df> 산출:
A C D E 0 A1 C1 D1 E1 1 A2 C2 D2 E2 2 A3 C3 D3 E3 3 A4 C4 D4 E4 4 A5 C5 D5 E5>