Pandas 기초 8편
1. merge
두개의 데이터 테이블을 하나로 합치는 기능
기본은 pd.merge(df1,df2,on=(기준변수))
left_on=(왼쪽 프레임의 기준변수), right_on=(오른쪽 프레임의 기준 변수)
4,5,7,8이 공통으로 subject_id에 들어있으므로 기준변수를 subject_id라 하면 inner join
inner join은 두 데이터 프레임에서 공통된 것을 뽑아오고(기본)
full join(outer join)은 기준변수에서 두 데이터 프레임 값 모두 가지고 오고
left join은 왼쪽 데이터 프레임은 모두 가지고오고 오른쪽 데이터프레임에 없는 것은 NaN으로 채워넣음
right join은 오른쪽 데이터 프레임은 모두 가지고오고 왼쪽 데이터프레임에 없는 것은 NaN으로 채워넣음
index based join은 left, right dataframe에서 index를 모두 가지고 오는 merge 방식
2. concat
같은 형태의 데이터를 서로 붙이는 기술
붙일 두 데이터를 리스트로 묶어서 인자로 넣어줌
기본 값은 axis=0이고 위 아래로 붙임
df1.append(df2)랑 동일
axis=1은 양 옆으로 붙임
'프로그래밍 > Pandas' 카테고리의 다른 글
Pandas 기초 9편 (0) | 2024.01.03 |
---|---|
데이터프레임에서 행별로 이상치 판단하기 (코딩테스트 복기) (0) | 2022.03.25 |
Pandas 기초 7편 (0) | 2021.12.02 |
Pandas 기초 6편 (0) | 2021.11.25 |
Pandas 기초 5편 (0) | 2021.11.25 |