Pandas 기초 8편

1. merge

 

두개의 데이터 테이블을 하나로 합치는 기능

 

기본은 pd.merge(df1,df2,on=(기준변수))

 

left_on=(왼쪽 프레임의 기준변수), right_on=(오른쪽 프레임의 기준 변수)

 

etc-image-0
그림1. 첫번째 데이터프레임

 

etc-image-1
그림2. 두번째 데이터프레임

 

 

etc-image-2
그림3. 여러가지 join 방식

 

4,5,7,8이 공통으로 subject_id에 들어있으므로 기준변수를 subject_id라 하면 inner join

 

inner join은 두 데이터 프레임에서 공통된 것을 뽑아오고(기본)

 

etc-image-3
그림4. inner join으로 데이터프레임을 합침

 

full join(outer join)은 기준변수에서 두 데이터 프레임 값 모두 가지고 오고

 

etc-image-4
그림5. outer join으로 데이터프레임을 합침

 

left join은 왼쪽 데이터 프레임은 모두 가지고오고 오른쪽 데이터프레임에 없는 것은 NaN으로 채워넣음

 

etc-image-5
그림6. left join으로 데이터프레임을 합침

 

right join은 오른쪽 데이터 프레임은 모두 가지고오고 왼쪽 데이터프레임에 없는 것은 NaN으로 채워넣음

 

etc-image-6
그림7. right join으로 데이터프레임을 합침

 

index based join은 left, right dataframe에서 index를 모두 가지고 오는 merge 방식

etc-image-7
그림8. index based join 예시

 

2. concat

 

같은 형태의 데이터를 서로 붙이는 기술

 

붙일 두 데이터를 리스트로 묶어서 인자로 넣어줌

 

기본 값은 axis=0이고 위 아래로 붙임

 

etc-image-8
그림9. axis=0으로 concat한 모습

 

df1.append(df2)랑 동일

 

etc-image-9
그림10. append를 이용해 데이터프레임을 합침

 

axis=1은 양 옆으로 붙임

 

etc-image-10
그림11. axis=1로 concat한 모습

 

728x90

'프로그래밍 > Pandas' 카테고리의 다른 글

Pandas 기초 9편  (0) 2024.01.03
데이터프레임에서 행별로 이상치 판단하기 (코딩테스트 복기)  (0) 2022.03.25
Pandas 기초 7편  (0) 2021.12.02
Pandas 기초 6편  (0) 2021.11.25
Pandas 기초 5편  (0) 2021.11.25