Pandas 기초 7편

1. groupby

 

key별로 데이터를 각각 split하고 각각에 함수를 적용하여 결과를 합침

 

그림1. groupby 과정

 

df.groupby((묶는 기준이 되는 열))[(적용받는 열)].(함수)

 

그림2. groupby 예시1

 

2개 이상의 열로 묶어낸 경우 리스트를 사용해서 넣어야한다

 

그림3. groupby 예시2

 

2. hierarchical index

 

두 줄 이상의 index를 가지는 dataframe

 

그림4. index는 두줄 이상일 수 있음

 

unstack()으로 두줄의 index를 행과 열로 둔 matrix 형태로 바꿔줌

 

stack()을 하면 다시 원래 데이터프레임으로 되돌아옴

 

그림5. unstack(), stack() 활용

 

3. reset_index

 

reset_index를 이용하여 index를 다시 데이터프레임의 변수로 만든다

 

그림6. reset_index 활용

 

4. swaplevel()

 

swaplevel()하면 index level을 변경함

 

그림7. swaplevel()로 index level을 변경

 

index level 기준으로 여러 기본 연산 수행이 가능

 

그림8. index level에 따른 수학연산 예시

 

5. grouped

 

groupby 시키고 할당시키면 grouped된 형태를 만든다

 

tuple로 (groupname, datatable)

 

그림9. grouped된 데이터프레임 불러오기

 

grouped.get_group(key) 특정 그룹명 가진 그룹 데이터만 가져옴

 

그림10. get_group로 Devils라는 group명을 가진 데이터프레임 가져오기

 

grouped 상태에서 요약정보를 추출할 수 있음

 

.agg() 변수별 통계량을 group별로 출력함

 

그림11. agg를 이용해 max값을 추출

 

리스트에 여러개의 함수를 넣어 적용시킬 수도 있고 특정 칼럼에만 적용시킬 수도 있다

 

그림12. 특정 칼럼에 여러개의 통계량 함수를 적용

 

 

agg할때 ‘변수명’ : ‘ 적용함수’ 로 적을 수도 있다.

 

 

 

 

df.transform(f) 은 개별 데이터의 변환을 지원함

 

그림13. transform으로 개별 데이터의 변환을 구함

 

.filter은 특정 조건으로 데이터를 추출한다

 

그림14. filter로 특정 조건을 만족시키는 데이터 추출

 

'프로그래밍 > Pandas' 카테고리의 다른 글

데이터프레임에서 행별로 이상치 판단하기 (코딩테스트 복기)  (0) 2022.03.25
Pandas 기초 8편  (0) 2021.12.02
Pandas 기초 6편  (0) 2021.11.25
Pandas 기초 5편  (0) 2021.11.25
Pandas 기초 4편  (0) 2021.11.24
TAGS.

Comments