Loading...
2024. 1. 30. 03:03

27장 평균 인간

1. 평균이 참에 가장 가까운 이유 산업혁명이 막 동튼 19세기 초 유럽에서 확률과 통계는 젊은 학문이었다. 통계는 주로 물리학과 천문학에 이용되었다. 그런데 물리학은 실험을 3번하면 3번 모두 다른 값이 나오기 마련이었고, 천체의 움직임도 측정할 때마다 다른 결과가 나왔다. 측정할 때마다 결과가 다르지만 참값이 하나라면 어떤 값이 참값에 가장 가까운가? 빛의 속도를 측정하는 실험을 3번 반복했더니 결과가 29.6만km/s, 30만km/s, 30.1만km/s 나왔다고 하자. 가운데 값인 중앙값 30만km/s가 참인가? 또는 평균인 29.9만km/s가 참인가? 측정된 세 값의 평균을 이용하는 것이 지금은 자연스럽지만, 당시에는 받아들여지기 어려운 개념이었다. 어떤 실험에서도 평균값 29.9만km/s는 나오..

2024. 1. 29. 01:57

26장 파레토의 법칙

1. 불평등을 설명하는 파레토의 법칙 19세기 말 파리에서 태어나 이탈리아에서 활동한 경제학자 빌프레드 파레토는 권력과 부의 분배 문제에 관심이 매우 많았다. 동시대의 다른 학자들처럼 파레토는 이와 관련한 데이터를 수집했다. 스위스 바젤과 독일 아우크스부르크의 세금 납부 기록, 이탈리아, 영국, 프로이센, 아일랜드의 개인 소득 기록, 파리의 월세 기록 등 여러 유럽 국가의 재산과 소득에 관한 데이터였다. 이 데이터를 분석한 그가 발견한 법칙은 이랬다. 어떤 시대, 어떤 도시라도 80%의 부는 전체 인구의 20%가 소유하고 있다. 바로 파레토의 법칙이다. 고소득층 20명이 평균 2억 원 소득을 올린다면 나머지 80명은 평균 1250만원을 번다는 이야기이다. 20*20억: 80*0.125억 = 40억: 10..

2024. 1. 25. 02:33

25장 중심극한정리

1. 가장 자연스러운 분포, 정규분포 모든 수험생이 치른 대학수학능력시험 점수는 정규분포를 따른다. 20세 건강한 남자의 평균 키도 마찬가지다. 300ml 콜라 캔에 든 용량은 정확히 300ml가 아니다. 어떤 캔은 301ml일 수도 있고 어떤 캔은 299ml일 수도 있다. 캔마다 다른 용량의 분포도 정규분포이다. 정규분포는 통계 개념 중 가장 널리 쓰인다. 정규분포는 기준이 되는 어떤 값 평균을 중심으로 '자연스럽게' 퍼진 분포를 나타낸다. 콜라 캔에 담긴 용량이라면 300ml가 중심이다. 자연스럽게 퍼졌다는 뜻은 250ml나 330ml처럼 중심으로부터 매우 먼, 용량이 너무 적거나 많은 경우는 매우 드물다는 뜻이다. 20세 남성의 키는 중심이 되는 평균(174cm) 주변에 가장 많고 174cm에서 멀..

2024. 1. 20. 02:20

24장 90은 큰 수인가 작은 수인가

1. 평균 문맥에 따라 답은 달라진다. 90이 사람 몸무게를 나타낸다면 이 숫자는 큰 수인가? 만약 단위가 킬로그램이라면 상당히 큰 수이지만, 파운드라면 작은 수이다. 얼마나 대단한 숫자인지 이 사람의 키나 성별, 나이에 따라 그 판단은 달라진다. 어떤 수의 크고 작음은 상대적인 개념이다. 그렇다면 무엇과 비교해 크고, 작다고 하는 것일까? 남자 몸무게라면 기준이 되는 몸무게는 약 70kg이고 여자 몸무게라면 55kg이다. 몸무게가 90kg인 사람은 그 사람이 속한 집단의 평균 몸무게 70kg과 비교해 더 무겁다고 할 수 있다. 18세 남성으로 이루어진 이 집단 구성원은 대략 50kg부터 90kg까지 몸무게로 분포되어 있다. 평균 몸무게는 무수히 많은 구성원의 몸무게를 대표하는 값이다. 평균은 곧 무게중..

2024. 1. 14. 12:57

구글드라이브로 대용량 데이터를 다룰 때 필요한 테크닉(압축해제, 자동압축, 파일 크기 확인방법)

구글 드라이브의 한 폴더 내에 너무 많은 데이터가 있을 경우, colab에서 구글 드라이브로 연동할때, 파이썬이 구글 드라이브의 폴더 내의 데이터에 제대로 접근하지 못한다 그래서 한 폴더당 10000개 이내로 데이터를 분할해서 저장해두는게 유리하다 --------------------------------------------------------------------------------------------------------------------- 개인 드라이브에서 구글 드라이브로 데이터를 옮길때, 압축된 상태에서 옮기고 연동한 다음 파이썬으로 압축을 해제해서 사용하는게 유리할 수 있다 colab으로 구글 드라이브로 연동한 다음, 구글 드라이브의 zip파일을 압축해제하면 된다 https://cod..

2024. 1. 12. 02:42

22장 동전을 앞면으로 던질 확률을 높일 수 있나

1. 동전 던지기는 공평한가 불공평한가 동전 던지기는 공평하다. 동전은 던졌을 때, 앞면과 뒷면이 나올 확률이 절반이다. 그러나 던졌을 때, 한쪽 면이 더 높은 비율로 나오도록 하는 것은 그리 어렵지 않다. https://www.yna.co.kr/view/AKR20091208054500009 "동전 던지기는 불공평" | 연합뉴스 "동전 던지기는 불공평" 원하는 면 나올 확률 조작가능 www.yna.co.kr https://m.dongascience.com/news.php?idx=63007 [주말N수학] 공정하다는 착각! 동전 던지기 수학동아 제공 앞면이냐 뒷면이냐! 온전히 운에 맡긴 결정을 하고 싶을 때 우린 ‘동전 던지기’를 한다. 어떠한 편견도실력도꼼수도 통하지 않는 공정한 의사 결정 방식이란 믿음 ..