Pandas 기초 7편

1. groupby

 

key별로 데이터를 각각 split하고 각각에 함수를 적용하여 결과를 합침

 

etc-image-0
그림1. groupby 과정

 

df.groupby((묶는 기준이 되는 열))[(적용받는 열)].(함수)

 

etc-image-1
그림2. groupby 예시1

 

2개 이상의 열로 묶어낸 경우 리스트를 사용해서 넣어야한다

 

etc-image-2
그림3. groupby 예시2

 

2. hierarchical index

 

두 줄 이상의 index를 가지는 dataframe

 

etc-image-3
그림4. index는 두줄 이상일 수 있음

 

unstack()으로 두줄의 index를 행과 열로 둔 matrix 형태로 바꿔줌

 

stack()을 하면 다시 원래 데이터프레임으로 되돌아옴

 

etc-image-4
그림5. unstack(), stack() 활용

 

3. reset_index

 

reset_index를 이용하여 index를 다시 데이터프레임의 변수로 만든다

 

etc-image-5
그림6. reset_index 활용

 

4. swaplevel()

 

swaplevel()하면 index level을 변경함

 

etc-image-6
그림7. swaplevel()로 index level을 변경

 

index level 기준으로 여러 기본 연산 수행이 가능

 

etc-image-7
그림8. index level에 따른 수학연산 예시

 

5. grouped

 

groupby 시키고 할당시키면 grouped된 형태를 만든다

 

tuple로 (groupname, datatable)

 

etc-image-8
그림9. grouped된 데이터프레임 불러오기

 

grouped.get_group(key) 특정 그룹명 가진 그룹 데이터만 가져옴

 

etc-image-9
그림10. get_group로 Devils라는 group명을 가진 데이터프레임 가져오기

 

grouped 상태에서 요약정보를 추출할 수 있음

 

.agg() 변수별 통계량을 group별로 출력함

 

etc-image-10
그림11. agg를 이용해 max값을 추출

 

리스트에 여러개의 함수를 넣어 적용시킬 수도 있고 특정 칼럼에만 적용시킬 수도 있다

 

etc-image-11
그림12. 특정 칼럼에 여러개의 통계량 함수를 적용

 

 

agg할때 ‘변수명’ : ‘ 적용함수’ 로 적을 수도 있다.

 

etc-image-12

 

 

 

df.transform(f) 은 개별 데이터의 변환을 지원함

 

etc-image-13
그림13. transform으로 개별 데이터의 변환을 구함

 

.filter은 특정 조건으로 데이터를 추출한다

 

etc-image-14
그림14. filter로 특정 조건을 만족시키는 데이터 추출

 

728x90

'프로그래밍 > Pandas' 카테고리의 다른 글

데이터프레임에서 행별로 이상치 판단하기 (코딩테스트 복기)  (0) 2022.03.25
Pandas 기초 8편  (0) 2021.12.02
Pandas 기초 6편  (0) 2021.11.25
Pandas 기초 5편  (0) 2021.11.25
Pandas 기초 4편  (0) 2021.11.24