Pandas 기초 8편

1. merge

 

두개의 데이터 테이블을 하나로 합치는 기능

 

기본은 pd.merge(df1,df2,on=(기준변수))

 

left_on=(왼쪽 프레임의 기준변수), right_on=(오른쪽 프레임의 기준 변수)

 

그림1. 첫번째 데이터프레임

 

그림2. 두번째 데이터프레임

 

 

그림3. 여러가지 join 방식

 

4,5,7,8이 공통으로 subject_id에 들어있으므로 기준변수를 subject_id라 하면 inner join

 

inner join은 두 데이터 프레임에서 공통된 것을 뽑아오고(기본)

 

그림4. inner join으로 데이터프레임을 합침

 

full join(outer join)은 기준변수에서 두 데이터 프레임 값 모두 가지고 오고

 

그림5. outer join으로 데이터프레임을 합침

 

left join은 왼쪽 데이터 프레임은 모두 가지고오고 오른쪽 데이터프레임에 없는 것은 NaN으로 채워넣음

 

그림6. left join으로 데이터프레임을 합침

 

right join은 오른쪽 데이터 프레임은 모두 가지고오고 왼쪽 데이터프레임에 없는 것은 NaN으로 채워넣음

 

그림7. right join으로 데이터프레임을 합침

 

index based join은 left, right dataframe에서 index를 모두 가지고 오는 merge 방식

그림8. index based join 예시

 

2. concat

 

같은 형태의 데이터를 서로 붙이는 기술

 

붙일 두 데이터를 리스트로 묶어서 인자로 넣어줌

 

기본 값은 axis=0이고 위 아래로 붙임

 

그림9. axis=0으로 concat한 모습

 

df1.append(df2)랑 동일

 

그림10. append를 이용해 데이터프레임을 합침

 

axis=1은 양 옆으로 붙임

 

그림11. axis=1로 concat한 모습

 

'프로그래밍 > Pandas' 카테고리의 다른 글

Pandas 기초 9편  (0) 2024.01.03
데이터프레임에서 행별로 이상치 판단하기 (코딩테스트 복기)  (0) 2022.03.25
Pandas 기초 7편  (0) 2021.12.02
Pandas 기초 6편  (0) 2021.11.25
Pandas 기초 5편  (0) 2021.11.25
TAGS.

Comments