Pandas 기초 6편
1. describe()
numeric type을 요약해줌
문자형 데이터는 알아서 요약을 안해줌
2. unique()
(series).unique() 해당 series의 중복을 제거하고 유일한 값들을 반환
3. 기본 수학 연산
sum,mean,min,max,count,var,median 등 기본 연산 지원
axis 가능
4. isnull()
df.isnull()은 NaN인 곳을 찾아 True 아니면 False로
df.isnull().sum() 각 변수별 NaN의 개수를 구할 때 자주 씀
5. sort_values()
df.sort_values( (by=)[열],ascending=)
지정된 열 기준으로 sorting
6. corr(),cov()
.corr() 두 열간 상관계수
.cov() 두 열간 공분산
df.corr() 상관계수 행렬
7. corrwith()
df.corrwith(변수) 해당 변수와 나머지 변수들 모두간의 상관계수 각각 구해줌
8. value_counts
(변수).value_counts 해당 범주형 변수의 빈도 값 제공
9. 되돌아보기
이런 기능이 있구나 한번씩 써보고
필요하면 다시 그떄 그때 찾아보면 그만
사람이라면 다 외울수 없으니까
그러나 사용을 해보고 알고 있으면 다시 찾아보기가 쉽다
'프로그래밍 > Pandas' 카테고리의 다른 글
Pandas 기초 8편 (0) | 2021.12.02 |
---|---|
Pandas 기초 7편 (0) | 2021.12.02 |
Pandas 기초 5편 (0) | 2021.11.25 |
Pandas 기초 4편 (0) | 2021.11.24 |
Pandas 기초 3편 (0) | 2021.11.24 |
TAGS.