Pandas 기초 6편

1. describe()

 

numeric type을 요약해줌

 

문자형 데이터는 알아서 요약을 안해줌

 

그림1. describe() 예시

 

2. unique()

 

(series).unique() 해당 series의 중복을 제거하고 유일한 값들을 반환

 

그림2. unique() 사용 예시

 

3. 기본 수학 연산

 

sum,mean,min,max,count,var,median 등 기본 연산 지원

 

axis 가능

 

그림3. 기본 수학 연산 예시

 

4. isnull()

 

df.isnull()은 NaN인 곳을 찾아 True 아니면 False로

 

df.isnull().sum() 각 변수별 NaN의 개수를 구할 때 자주 씀

 

그림4.. null 값 찾는 예시

 

5. sort_values()

 

df.sort_values( (by=)[열],ascending=)

 

지정된 열 기준으로 sorting

 

 

그림5. sort_values() 사용 예시

 

6. corr(),cov()

 

.corr() 두 열간 상관계수

 

.cov() 두 열간 공분산

 

그림6. 두 열간 corr와 cov를 구한 예시

 

df.corr() 상관계수 행렬

 

그림7. 상관계수 행렬 구한 예시

 

7. corrwith()

 

df.corrwith(변수) 해당 변수와 나머지 변수들 모두간의 상관계수 각각 구해줌

 

그림8. corrwith() 예시

 

8. value_counts

 

(변수).value_counts 해당 범주형 변수의 빈도 값 제공

 

그림9. value_counts() 사용 예시

 

9. 되돌아보기

 

이런 기능이 있구나 한번씩 써보고

 

필요하면 다시 그떄 그때 찾아보면 그만

 

사람이라면 다 외울수 없으니까

 

그러나 사용을 해보고 알고 있으면 다시 찾아보기가 쉽다

'프로그래밍 > Pandas' 카테고리의 다른 글

Pandas 기초 8편  (0) 2021.12.02
Pandas 기초 7편  (0) 2021.12.02
Pandas 기초 5편  (0) 2021.11.25
Pandas 기초 4편  (0) 2021.11.24
Pandas 기초 3편  (0) 2021.11.24
TAGS.

Comments