Loading...
2023. 12. 12. 21:54

10장 확률이 0인 사건도 일어날 수 있다

1. 피아노 연주자의 조율 오케스트라가 연주를 시작하기 전에 바이올리니스트가 한 음을 내면 다른 악기 연주자들이 모두 같은 음을 낸다. 악기마다 조율된 음높이가 같은지 확인하는 과정이다. 이 음을 콘서트 음높이 또는 표준 조율음이라고 한다. 계이름으로 '라'에 해당하는 음높이이다. 국제표준화기구는 표준 조율음 '라'의 진동수를 440Hz로 정하고 있다. 1초에 440번 진동한다는 뜻이다. '도레미파솔라시도'는 음의 높이를 나타내는 이름이다. 음의 높이는 소리의 진동과 연관되는데 진동이 빠르면 높은 음이고, 느리면 낮은 음인 식이다. 그렇다면 높은 '도'의 음높이는 어떨까? 음계가 하나 올라갈 때 그 전 음의 진동수에 $2^{1/12} = 1.059463....$만큼 곱한 진동수를 가진다고 한다. 피아노 ..

2023. 11. 29. 00:09

2장 도박사의 판돈 나누기

1. 갑자기 도박이 중단되었을 때 17세기 프랑스의 한량이었던 앙투안 공보는 한창 도박을 즐기던 도중에 오늘날 '판돈 나누기'라고 불리는 문제에 직면했다. 앙투안 공보의 문제를 현대적으로 각색하면 다음과 같다. 한국의 프로야구는 매년 한국시리즈라는 7전 4선승제의 결승전을 치른다. 만약 올해의 한국시리즈에는 LG 트윈스와 KT wiz가 진출해 1차전은 kt가 승리, 2차전은 LG가 승리 3차전, 4차전을 KT가 다시 승리했다고 하자. 이 때, 코로나 바이러스의 창궐로 한국시리즈는 중단되고 남은 경기는 취소가 결정되었다. KT는 우승까지 단 1경기 남았고 현재까지 이기고 있으니 상금 10억원을 받아야한다고 주장한다. LG는 우리가 우승할 가능성이 여전히 남아있으니 공평하게 5억원씩 나눠야한다고 한다. 이런..

2023. 11. 28. 01:51

1장 확률의 정의 - 도박과 동전 던지기, 라플라스

1. 확률 - 앞으로 벌어질 사건에 대한 믿음 확률은 인류의 역사만큼이나 오래된 도박과 함께 등장했다. 도박이란 그 결과를 미리 알 수 없는 행위에 따라 승부가 결정된다. 예를 들어 동전 던지기와 주사위 굴리기처럼 앞으로 벌어질 사건에 대한 가능성이나 우리의 믿음을 숫자로 표현한 것이 곧 확률이다. 어떤 사건이 벌어질 가능성이 클수록 100%에 가까운 확률이 생기고, 반대로 가능성이 작을수록 0%에 가까운 확률이 발생한다. 이를테면 정육면체 주사위를 굴려 1이 나올 가능성은 다른 5개의 숫자가 나올 가능성과 같다. 쉽게 말해 1부터 6까지 모든 숫자가 나올 가능성이 같으므로, 그 가능성을 수로 표현한 확률 역시 모두 같은 것이다. 따라서 주사위 굴리기의 결과가 1일 확률은 1/6으로 16.7%이다. 한국..

모든 부분집합 원소의 곱의 합을 구하는 공식이 있다고?

1. 문제 9375번: 패션왕 신해빈 (acmicpc.net) 9375번: 패션왕 신해빈 첫 번째 테스트 케이스는 headgear에 해당하는 의상이 hat, turban이며 eyewear에 해당하는 의상이 sunglasses이므로 (hat), (turban), (sunglasses), (hat,sunglasses), (turban,sunglasses)로 총 5가지 이다. www.acmicpc.net 2. 풀이 경우의 수가 바로 안나오기는 한디... 경우를 나눠서 생각해보면 hat headgear sunglasses eyewear turban headgear headgear에 2가지 있고 eyewear에 1가지 있는데.. headgear에서 1가지를 뽑는 경우의 수 = 2가지 + eyewear에서 1가지 ..

자기 것을 다시 갖지 않고 나눠주는 경우의 수 교란순열(완전순열) 배우기

1. 문제 1947번: 선물 전달 (acmicpc.net) 1947번: 선물 전달 경우의 수를 1,000,000,000으로 나눈 나머지를 첫째 줄에 출력한다. www.acmicpc.net 2. 풀이 PS를 위한 수학 - 교란 순열(완전순열) - 와 이게 에러가 뜨네 (mjstudio.net) PS를 위한 수학 - 교란 순열(완전순열) 교란 순열 ps.mjstudio.net 비가 오는 날에 n명의 사람이 자기의 우산을 쓰고 한 건물에 모여있다. 모두 동시에 집에 가려고 다시 우산을 쓰고 나가려는데, 자신의 우산을 사용하지 않는 경우의 수는? n개의 물건을 n명의 사람에게 다시 분배하는데, 자기 물건을 다시 갖지 않는 경우의 수를 교란순열(완전순열, derangement)라고 부른다 점화식이 유명한데 (고등..

2022. 12. 20. 02:46

강화학습(reinforcement learning) 기본개념 익히기

1. 강화학습(reinforcement learning) 미지의 환경(environment)에서 에이전트(agent)가 임의의 행동(action)을 했을 때 받는 보상(reward)을 통해 먼 미래의 누적 보상을 최대화하고자 어떠한 행동을 할 것인지를 학습하는 알고리즘 마치 반려견을 훈련시키는 것과 유사하다. 강아지 입장에서 "앉아"라는 명령어를 들었을때, 여러 행동 중 우연히 앉았을 때 간식이라는 보상을 받게 된다. 강아지는 처음에 "앉아"를 인식하지 못한 상황에서 보상을 받았기 때문에 행동과 보상의 관계를 인지하진 못한다. 하지만 시행착오를 통해 "앉으면 간식을 받을 수 있구나"라고 학습하게 된다. 강화학습은 에이전트(agent)가 환경에서 특정 행동을 하면, 환경(environment)은 행동에 대..