Loading...
2023. 12. 15. 01:23

12장 내일도 해는 동쪽에서 뜰까

1. 석기시대 고인돌 가족 이야기 석기시대의 고인돌 가족에게 세상은 두려움 그 자체였다. 동굴에 사는 이 가족의 막내아들은 아침 해가 동굴 앞 작은 언덕 쪽에서 솟아오르는 모습을 발견한다. 내일도 언덕 쪽에서 해가 뜰까? 엄마는 해가 항상 동쪽에서 떠오른다고 말하지만 호기심 가득한 막내아들은 곧이곧대로 믿지 않는다. 막내아들은 이렇게 생각한다. 내일 해가 언덕 쪽에서 뜰지, 거꾸로 동굴 쪽에서 뜰지는 알 수 없다. 이튿날 막내아들은 해가 언덕 쪽에서 떠오르는 것을 보고 이렇게 생각한다. 어쩌면 해는 언덕 쪽에서만 떠오를지도 몰라. 다음 날도, 그 다음 날도, 해가 언덕 쪽에서 떠오르는 광경을 본 막내아들은 결국 엄마 말이 맞았다고 생각한다. 2. 베이즈의 정리를 이용한 기술 자연현상에 대한 막내아들의 무..

2023. 12. 14. 00:36

11장 경험에 의한 믿음의 변화

1. 경험만이 가능성을 판단할 수 있다 불확실성과 가능성을 표현하는 확률은 여러 철학자의 관심을 사로잡았다. 경험주의를 완성했다고 평가받는 18세기 철학자 데이비드 흄은 에서 확률에 대한 그의 사상을 펼치면서 어떤 가능성이 다른 가능성보다 더 크다고 믿을 수단은 곧 경험뿐이라고 주장했다 같은 맥락에서 흄은 '종교적 기적'에 대해 여지없이 의문을 드러냈다. 예수의 재림을 목격하는 '경험'이 가능할 수도 있지만 실제로 인간은 한번 죽으면 다시는 살아나지 못한다는 상식과 비교하면 해가 서쪽에서 뜨는 것만큼 불가능한 일이다. 기적의 가능성은 죽으면 끝이라는 상식적인 경험의 가능성에 비해 티끌보다 작으므로 있을 수 없는 일이다. 흄의 경험주의 철학은 당대는 물론 현대 과학자들에게 매우 큰 영향을 미쳤다. 2. 베..

2023. 12. 12. 21:54

10장 확률이 0인 사건도 일어날 수 있다

1. 피아노 연주자의 조율 오케스트라가 연주를 시작하기 전에 바이올리니스트가 한 음을 내면 다른 악기 연주자들이 모두 같은 음을 낸다. 악기마다 조율된 음높이가 같은지 확인하는 과정이다. 이 음을 콘서트 음높이 또는 표준 조율음이라고 한다. 계이름으로 '라'에 해당하는 음높이이다. 국제표준화기구는 표준 조율음 '라'의 진동수를 440Hz로 정하고 있다. 1초에 440번 진동한다는 뜻이다. '도레미파솔라시도'는 음의 높이를 나타내는 이름이다. 음의 높이는 소리의 진동과 연관되는데 진동이 빠르면 높은 음이고, 느리면 낮은 음인 식이다. 그렇다면 높은 '도'의 음높이는 어떨까? 음계가 하나 올라갈 때 그 전 음의 진동수에 $2^{1/12} = 1.059463....$만큼 곱한 진동수를 가진다고 한다. 피아노 ..

2023. 12. 12. 01:44

9장 예측 불가능한 랜덤을 예측하는 방법

1. 예측 불가능한 랜덤 속에 존재하는 예측 가능성 유치원에 다니는 아들이 발표회를 한다고 했다. 그래서 물었다. "보통 엄마, 아빠가 몇 명이나 오시니?" 아들이 대답했다. "몰라" 다시 물었다. "왜 몰라? 몇 분이나 오셔?" 아들은 다시 대답했다. "그걸 어떻게 알아. 할 때마다 다른데. 랜덤이라고. 모르는게 당연하지." 핸드폰 게임과 유튜브에 익숙한 아이는 "랜덤"이란 단어를 정확히 알고있다. 아이 말에는 일리가 있다. 할 때마다 다를 수 밖에 없는 발표회 참석 인원을 정확하게 예측할 수는 없다. 그러나 유치원 선생님에게 여쭤보면 원하는 답을 얻을 수 있다. 부모와 가족 참석자는 대략 20~30명이라고 한다. 아이에게 랜덤은 예측 가능하지 않다. 그래서 아무 답도 줄 수 없다고 생각한다. 하지만 ..

2023. 12. 11. 02:46

8장 프로이센 왕국의 기병대 말 뒷발차기 사망사건

1. 확률분포란 동전 던지기를 하면 앞면이 나올지 뒷면이 나올지 예측하기 어렵다. 앞면과 뒷면이 나올 가능성이 똑같아서 특별히 하나를 골라 맞히기 어렵다. 그렇다면 동전 던지기 결과에는 아무런 패턴이 없는 것일까? 아니다. 앞면이 나올 확률이 절반, 뒷면이 나올 확률이 절반이라는 패턴이 있다. 이처럼 그 결과가 예측 불가능하고 무작위성을 띠는 사건의 패턴을 확률로 기술한 것을 '확률분포'라고 한다. 정확히 어떤 값이 나올지는 알 수 없지만 확률분포를 이용하면 그 불확실성을 체계적으로 이해할 수 있다는 뜻이다. 2. 포아송분포 19세기 프로이센 왕국은 그 당시 유럽의 여느 강대국처럼 기병대가 군대의 주력이었다. 실제로 프로이센에는 150마리의 말과 기병으로 이루어진 기병대가 55개나 있었다. 그런데 기병대..

2023. 12. 8. 01:40

정형데이터 분석에서 feature importance와 permutation importance

1. introduction target 변수를 예측하는데 얼마나 유용한지에 따라 feature에 적절한 점수를 할당하여 중요도를 측정함 model-specific한 방법은 머신러닝 모델 자체에서 feature importance를 계산하게 해주는 기능을 제공함 model-agnostic한 방법은 머신러닝 모델에서 제공하는 기능에 의존하지 않고 모델을 학습한 후에 적용되는 feature importance를 계산하는 방식 2. boosting tree model-specific feature importance 2-1) LightGBM training된 LightGBM class에 feature_importance를 호출함 importance_type을 인자로 받는데 기본값은 'split'으로 tree ..