주의: 이 글은 작성자가 이해한대로 쓴 글이며 학문적으로 틀린 사실이 존재할 수 있습니다

확률이란 무엇인가

확률이라는 단어는 일상생활에서 흔히 마주치는 단어다. 네이버 국어사전은 일정한 조건 아래에서 어떤 사건이나 사상(事象)이 일어날 가능성의 정도. 또는 그런 수치라고 정의하고 있다. 그렇다면 어떤 사건의 가능성을 어떻게 수치로 나타낸단 말인가. 초중고 교육과정을 거친 사람이라면 어떤 사건이 일어날 경우의 수를 일어날 수 있는 모든 사건의 경우의 수로 나누는 방법으로 확률을 구할 수 있다는 사실을 알 것이다. 그러나 현실은 그렇게 간단히 확률이 구해지지 않는다. 앞에서 소개한 방법은 일어날 수 있는 모든 사건이 독립적이라는 가정하에 정의된 확률이다. 현실에선 여러가지 사건이 얽혀 전에 일어났던 사건이 미래의 사건에 영향을 미칠 수 있는 경우가 많다. 또한 일어날 수 있는 모든 사건의 경우의 수를 구하는 것도 어렵다. 당장 어떤 학생이 대학에 합격할 확률을 구한다고 할 때, 일어날 수 있는 모든 경우의 수란 무엇인가. 공부를 열심히 하지 않을 경우, 공부를 했는데 시험장에 지각할 경우, 1차 모집에선 불합격했으나 추가 합격을 할 경우 등등 어떤 경우의 수라고 부르기도 애매한 사건들이 가득하다.

확률을 바라보는 다양한 시각

확률론에선 이러한 애매한 경우들을 모두 뒤로하고 확률을 수치로 표현할 수 밖에 없다. 그렇다면 어떻게 확률을 수치로 표현할 수 있는가? 이에 대해서 확률을 바라보는 두가지 관점이 있다. 빈도주의 관점과 베이지안 관점이 있다. 빈도주의 관점의 경우, 단어 그대로 확률을 어떤 사건이 일어나는 빈도로 생각한다. 10만명의 학생이 시험을 쳐서 그 중 5만명의 학생이 대학에 합격했다면, 빈도주의 관점에선 대학에 합격할 확률은 2분의 1이다. 빈도주의는 이 시험과 얽힌 다양한 사건과 불확실성을 고려하기보단 그저 빈도에만 관심이 있다. 베이지안 관점은 빈도주의 관점보다 좀 복잡하다. 베이지안 관점은 확률을 여러가지 사건이 얽힌 불확실성으로 표현한다. 여러 얽힌 사건들을 조건부 확률로 표현한다. 베이지안 관점에서 확률을 구하는 일반적인 방법은 관측된 데이터를 기반으로 사전확률과 우도를 구하고, 그것을 이용해 사후확률을 구하는 방법이다.

빈도주의 관점과 베이지안 관점의 차이

빈도주의 관점의 경우 확률을 구할 때 어떤 사건이 일어나는 빈도만 세면 되기 때문에 간편하다. 그러나 일어나는 빈도가 매우 적은 사건이라면 어떤가. 아니면 아직 일어나지도 않은 사건이라면? 지구의 빙하가 모두 녹을 확률은 어떨까. 빈도주의 관점에선 이 확률은 0이다. 아직 지구의 빙하가 모두 녹은적도 없기 때문이다. 그러나 지구온난화가 계속 진행중이라는 것은 사실이며 언젠가 빙하가 모두 녹을 가능성이 없다고 장담할 수 없다. 빈도주의는 이처럼 매우 드물게 일어나는 사건이나 아직 일어나지 않은 사건의 확률을 구하려고 할 때 왜곡된 확률을 도출할 가능성이 있다.

반면 베이지안 관점의 경우 빈도주의 관점에서 잡아내지 못하는 불확실성을 고려하여 확률을 표현할 수 있다. 베이지안 관점에서는 지구의 빙하가 모두 녹을 확률이 정말 낮은 확률이긴 하겠지만 확실히 0은 아닐 것이다. 베이지안 관점은 지금까지 관측된 데이터를 토대로 불확실한 확률을 추측할 수 있다.

+ Recent posts