Loading...
2021. 12. 23. 01:26

빅데이터 분석기사 실기를 준비하는 사람들에게 드리는 팁(3회 이후)

이번 3회 예비?합격자입니다 가끔 카페를 보는 정도만으로 이용하는데 시험이 시행된지 얼마 되지도 않았고 공부 어떻게 해야할지 모르시는 분들이 많아 몇가지 팁을 드리고자 합니다. 본인은 R을 사용하다가 Pyhon으로 넘어온 사람이라 Python위주로 설명되어 있습니다. 1. 깔끔한 시험이 아니기 때문에 확실하게 대비할 필요가 있다. ADsP나 SQLD를 보신 분들이라면 여기서 출제하는 시험이 국가공인시험이 맞는지 의심이 될 정도로 생각보다 깔끔한 시험이 아닙니다. 애초에 문제가 이상한 것 같다고 질문하면 답변도 안해줍니다. 제가 쓴 단답형이 다 맞다고도 생각하는데 뭐가 틀렸는지 잘 모르겠네요 그 외에도 자신의 능력과 무관하게 어떤 변수가 생길 수 있기 때문에 철저한 대비가 필요합니다. 2. 단답형은 필기시..

빅데이터분석기사 3회 대비 실전 벼락치기

1. 정렬하기 data.sort_values( by = (정렬기준이 되는 칼럼) , ascending =True/False) ascending =True이면 오름차순 정렬이고 ascending = False이면 내림차순 정렬 2. series는 대응하는 원소끼리 수학적 계산이 가능 단, 인덱스가 맞지 않으면 계산이 이상해질 수 있음 3. 통계량계산 data.mean() , data.median(), data.sum(), data.count(), data.std(), data.var(), .... 최빈값은 scipy 모듈을 이용해서 구할 수 있음 from scipy.stats import mode mode_data = mode(data) 4. 결측치 찾기 data.isnull().sum()을 통해 결측치가..

2021. 12. 3. 01:37

(빅데이터분석기사) pandas에서 count()를 사용할 때 주의할 점

위에 제시된 데이터프레임의 행의 개수를 구할려면 어떻게 해야할까? 434개인건 명백한데 count함수를 이용하면 다음과 같은 결과가 나온다 왜 이런 결과가 나왔을까? 다음은 데이터프레임에 들어간 boston['RM'].unique() array를 len함수를 이용해서 개수를 세어본 결과이다. 그 비밀은 NA값에 있다. 행의 개수를 세야할 때 pd.DataFrame.count()로 데이터프레임의 행의 개수를 셀 수 있는데 count()함수는 NA가 아닌 값만 세는 특징이 있다. 설명을 보면 non-NA값만 개수를 센다고 나와있다. 그래서 NA값을 세야하는지 세면 안되는지에 따라 주의해서 사용해야한다.