(빅데이터분석기사) pandas에서 count()를 사용할 때 주의할 점

그림1. 주어진 데이터프레임

 

위에 제시된 데이터프레임의 행의 개수를 구할려면 어떻게 해야할까?

 

434개인건 명백한데 count함수를 이용하면 다음과 같은 결과가 나온다

 

그림2. count함수를 사용한 행의 개수

 

왜 이런 결과가 나왔을까? 다음은 데이터프레임에 들어간 boston['RM'].unique() array를 len함수를 이용해서 개수를 세어본 결과이다.

 

그림3. len 함수를 사용한 값의 개수

 

그 비밀은 NA값에 있다.

 

그림4. NA값의 개수

 

행의 개수를 세야할 때 pd.DataFrame.count()로 데이터프레임의 행의 개수를 셀 수 있는데

 

count()함수는 NA가 아닌 값만 세는 특징이 있다.

 

그림5. pd.DataFrame.count 함수의 설명

 

설명을 보면 non-NA값만 개수를 센다고 나와있다.

 

그래서 NA값을 세야하는지 세면 안되는지에 따라 주의해서 사용해야한다.

TAGS.

Comments