(빅데이터분석기사) pandas에서 count()를 사용할 때 주의할 점
위에 제시된 데이터프레임의 행의 개수를 구할려면 어떻게 해야할까?
434개인건 명백한데 count함수를 이용하면 다음과 같은 결과가 나온다
왜 이런 결과가 나왔을까? 다음은 데이터프레임에 들어간 boston['RM'].unique() array를 len함수를 이용해서 개수를 세어본 결과이다.
그 비밀은 NA값에 있다.
행의 개수를 세야할 때 pd.DataFrame.count()로 데이터프레임의 행의 개수를 셀 수 있는데
count()함수는 NA가 아닌 값만 세는 특징이 있다.
설명을 보면 non-NA값만 개수를 센다고 나와있다.
그래서 NA값을 세야하는지 세면 안되는지에 따라 주의해서 사용해야한다.
'프로그래밍 > Python' 카테고리의 다른 글
urlopen을 할 때 HTTP Error 403: Forbidden error가 난다면 (0) | 2021.12.19 |
---|---|
list comprehension (0) | 2021.12.18 |
빅데이터분석기사 3회 대비 실전 벼락치기 (0) | 2021.12.04 |
numpy array와 pandas에서 var을 구할 때 차이점 (0) | 2021.12.01 |
python 조건문 if문 사용할 때 주의해야할 점 (0) | 2021.11.18 |
TAGS.