Pandas 기초 6편

1. describe()

numeric type을 요약해줌

문자형 데이터는 알아서 요약을 안해줌

(series).unique() 해당 series의 중복을 제거하고 유일한 값들을 반환

sum,mean,min,max,count,var,median 등 기본 연산 지원

axis 가능

df.isnull()은 NaN인 곳을 찾아 True 아니면 False로

df.isnull().sum() 각 변수별 NaN의 개수를 구할 때 자주 씀

df.sort_values( (by=)[열],ascending=)

지정된 열 기준으로 sorting

.corr() 두 열간 상관계수

.cov() 두 열간 공분산

df.corr() 상관계수 행렬

df.corrwith(변수) 해당 변수와 나머지 변수들 모두간의 상관계수 각각 구해줌

(변수).value_counts 해당 범주형 변수의 빈도 값 제공

이런 기능이 있구나 한번씩 써보고

필요하면 다시 그떄 그때 찾아보면 그만

사람이라면 다 외울수 없으니까

그러나 사용을 해보고 알고 있으면 다시 찾아보기가 쉽다

728x90