Pandas 기초 7편
1. groupby
key별로 데이터를 각각 split하고 각각에 함수를 적용하여 결과를 합침
df.groupby((묶는 기준이 되는 열))[(적용받는 열)].(함수)
2개 이상의 열로 묶어낸 경우 리스트를 사용해서 넣어야한다
2. hierarchical index
두 줄 이상의 index를 가지는 dataframe
unstack()으로 두줄의 index를 행과 열로 둔 matrix 형태로 바꿔줌
stack()을 하면 다시 원래 데이터프레임으로 되돌아옴
3. reset_index
reset_index를 이용하여 index를 다시 데이터프레임의 변수로 만든다
4. swaplevel()
swaplevel()하면 index level을 변경함
index level 기준으로 여러 기본 연산 수행이 가능
5. grouped
groupby 시키고 할당시키면 grouped된 형태를 만든다
tuple로 (groupname, datatable)
grouped.get_group(key) 특정 그룹명 가진 그룹 데이터만 가져옴
grouped 상태에서 요약정보를 추출할 수 있음
.agg() 변수별 통계량을 group별로 출력함
리스트에 여러개의 함수를 넣어 적용시킬 수도 있고 특정 칼럼에만 적용시킬 수도 있다
agg할때 ‘변수명’ : ‘ 적용함수’ 로 적을 수도 있다.
df.transform(f) 은 개별 데이터의 변환을 지원함
.filter은 특정 조건으로 데이터를 추출한다
'프로그래밍 > Pandas' 카테고리의 다른 글
데이터프레임에서 행별로 이상치 판단하기 (코딩테스트 복기) (0) | 2022.03.25 |
---|---|
Pandas 기초 8편 (0) | 2021.12.02 |
Pandas 기초 6편 (0) | 2021.11.25 |
Pandas 기초 5편 (0) | 2021.11.25 |
Pandas 기초 4편 (0) | 2021.11.24 |