Pandas 기초 6편

1. describe()

 

numeric type을 요약해줌

 

문자형 데이터는 알아서 요약을 안해줌

 

etc-image-0
그림1. describe() 예시

 

2. unique()

 

(series).unique() 해당 series의 중복을 제거하고 유일한 값들을 반환

 

etc-image-1
그림2. unique() 사용 예시

 

3. 기본 수학 연산

 

sum,mean,min,max,count,var,median 등 기본 연산 지원

 

axis 가능

 

etc-image-2
그림3. 기본 수학 연산 예시

 

4. isnull()

 

df.isnull()은 NaN인 곳을 찾아 True 아니면 False로

 

df.isnull().sum() 각 변수별 NaN의 개수를 구할 때 자주 씀

 

etc-image-3
그림4.. null 값 찾는 예시

 

5. sort_values()

 

df.sort_values( (by=)[열],ascending=)

 

지정된 열 기준으로 sorting

 

 

etc-image-4
그림5. sort_values() 사용 예시

 

6. corr(),cov()

 

.corr() 두 열간 상관계수

 

.cov() 두 열간 공분산

 

etc-image-5
그림6. 두 열간 corr와 cov를 구한 예시

 

df.corr() 상관계수 행렬

 

etc-image-6
그림7. 상관계수 행렬 구한 예시

 

7. corrwith()

 

df.corrwith(변수) 해당 변수와 나머지 변수들 모두간의 상관계수 각각 구해줌

 

etc-image-7
그림8. corrwith() 예시

 

8. value_counts

 

(변수).value_counts 해당 범주형 변수의 빈도 값 제공

 

etc-image-8
그림9. value_counts() 사용 예시

 

9. 되돌아보기

 

이런 기능이 있구나 한번씩 써보고

 

필요하면 다시 그떄 그때 찾아보면 그만

 

사람이라면 다 외울수 없으니까

 

그러나 사용을 해보고 알고 있으면 다시 찾아보기가 쉽다

728x90

'프로그래밍 > Pandas' 카테고리의 다른 글

Pandas 기초 8편  (0) 2021.12.02
Pandas 기초 7편  (0) 2021.12.02
Pandas 기초 5편  (0) 2021.11.25
Pandas 기초 4편  (0) 2021.11.24
Pandas 기초 3편  (0) 2021.11.24