Loading...
2021. 12. 1. 02:45

numpy array와 pandas에서 var을 구할 때 차이점

numpy array가 다음과 같이 주어진다. 여기서 분산을 구하고자 하는데 numpy.var()을 이용하여 구할 수 있다. 그런데 위 array를 pandas의 series에 넣어본다면 이 상태에서 분산을 구할려면 .var()을 하면 구할 수 있다 두 방식에서 구한 var에 차이가 있다 분명 같은 값들이 들어간 array로 var을 구한건데 왜 차이가 있을까? 그것은 numpy array에서는 var을 biased estimator로 구하기 때문이다. 모든 데이터 편차제곱합을 개수 N으로 나눠서 구한다 반면 pandas의 dataframe에서 var은 unbiased estimator로 구하기 때문이다. 그래서 두 값이 같게 만들려면 pd.Series에서 var의 옵션에 ddof=0으로 두면 두 값이 ..

2021. 11. 18. 22:02

python 조건문 if문 사용할 때 주의해야할 점

1. 여러 조건을 사용하는 경우 무의식적으로 20 20   2. 삼항연산 조건문을 한줄로 표현하는 것을 삼항연산이라고 부름   3. 조건문을 사용할 때 주의할 점 프로그램은 기본적으로 위에서부터 아래로 순차적으로 수행함 elif와 else등을 사용하지 않고 if만 사용하면 모든 if문을 검사하기 때문에 논리적인 오류가 발생할 수 있음  score=95를 주면 grade=A가 나오도록 만들고 싶은 것인데 프로그램은 모든 if문을 검사해야해서 score=95는 score>=90에서 grade=A가 되었다가 score>=80에서 grade=B였다가 .... score >= 60이기도 해서 grade=D가 되어 최종적으로 grade에는 'D'가 저장됨 의도대로..