팬더 병합 - 팬더 튜토리얼

팬더 병합() 두 개의 데이터 세트를 하나로 모으고 공통 속성이나 열을 기반으로 행을 정렬하는 프로세스로 정의됩니다. 이는 DataFrame 객체 간의 모든 표준 데이터베이스 조인 작업의 진입점입니다.

통사론:

 pd.merge(left, right, how=&apos;inner&apos;, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True)

매개변수:

DataFrame 또는 명명된 시리즈

{'왼쪽', '오른쪽', '외부', '내부'}, 기본값 '내부'

왼쪽:SQL 왼쪽 외부 조인과 유사하게 왼쪽 프레임의 키만 사용합니다. 키 순서를 유지합니다.오른쪽:SQL 오른쪽 외부 조인과 유사하게 오른쪽 프레임의 키만 사용합니다. 키 순서를 유지합니다.밖의:SQL 완전 외부 조인과 유사하게 두 프레임의 키 통합을 사용했습니다. 키를 사전순으로 정렬합니다.안의:SQL 내부 조인과 유사하게 두 프레임의 키 교차를 사용합니다. 왼쪽 키의 순서를 유지합니다.

라벨 또는 목록

왼쪽_켜짐:

레이블이나 목록 또는 배열과 유사한

bool, 기본값은 False

(str, str)의 튜플, 기본값('_x', '_y')

bool, 기본값은 True

bool 또는 str, 기본값은 False

_병합

'왼쪽만'병합 키가 DataFrame의 '왼쪽'에만 나타나는 관찰의 경우'올바른_만'병합 키가 DataFrame의 '오른쪽'에만 나타나는 관찰에 대해 정의됩니다.'둘 다'관측치의 병합 키가 두 관측치 모두에서 발견되면.

문자열, 선택 사항

'one_to_one' 또는 '1:1': 왼쪽 및 오른쪽 데이터세트 모두에서 병합 키가 고유한지 확인합니다.
'one_to_many' 또는 '1:m': 왼쪽 데이터세트에서만 병합 키가 고유한지 확인합니다.
'many_to_one' 또는 'm:1': 병합 키가 올바른 데이터세트에서만 고유한지 확인합니다.
'many_to_many' 또는 'm:m': 허용되지만 검사 결과는 아닙니다.

예시 1: 하나의 키에 두 개의 DataFrame을 병합합니다.

 # import the pandas library import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;John&apos;, &apos;Parker&apos;, &apos;Smith&apos;, &apos;Parker&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;William&apos;, &apos;Albert&apos;, &apos;Tony&apos;, &apos;Allen&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;]}) print (left) print (right)

산출

 id Name subject_id 0 1 John sub1 1 2 Parker sub2 2 3 Smith sub4 3 4 Parker sub6 id Name subject_id 0 1 William sub2 1 2 Albert sub4 2 3 Tony sub3 3 4 Allen sub6

예2: 여러 키에 있는 두 개의 DataFrame을 병합합니다.

 import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Alex&apos;, &apos;Amy&apos;, &apos;Allen&apos;, &apos;Alice&apos;, &apos;Ayoung&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Billy&apos;, &apos;Brian&apos;, &apos;Bran&apos;, &apos;Bryce&apos;, &apos;Betty&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) print pd.merge(left,right,on=&apos;id&apos;)

산출

 id Name_x subject_id_x Name_y subject_id_y 0 1 John sub1 William sub2 1 2 Parker sub2 Albert sub4 2 3 Smith sub4 Tony sub3 3 4 Parker sub6 Allen sub6

TechCodeview

팬더 DataFrame.merge()

통사론:

매개변수:

예시 1: 하나의 키에 두 개의 DataFrame을 병합합니다.

예2: 여러 키에 있는 두 개의 DataFrame을 병합합니다.