도박꾼의 오류란
도박꾼의 오류는 어떤 것이 일정 기간 동안 정상적 빈도 이상으로 자주 발생한다면 미래에는 덜 발생할 것이라고 잘못 믿는 오류입니다. 그 반대도 마찬가지입니다.
한 쌍의 동전 던지기 도박에서 나타날 수 있는 경우는 네 가지입니다. 앞면이 두 번 나올 확률은 25%, 즉 네 번 중 한 번입니다. 수학에서는 수학의 가능성을 평가할 때 확률분모를 사용합니다. 따라서 앞면이 둘 다 나올 비율은 25/100입니다.
동전 하나를 10번 던질 때 앞면과 뒷면이 나올 확률은 각각 50%로 같습니다. 처음 4번은 모두 앞면이 나왔습니다. 나머지 6번을 던지면 어떻게 결과가 나타날까요? 앞면 3번, 뒷면 3번이 나올 확률이 가장 큽니다. 앞면이나 뒷면이 나올 확률은 이전의 상황과 관계없이 항상 50%입니다. 그러나 사람들은 10번 던지기에서 이미 앞면이 4번 나왔으므로 나머지 6번 동안 앞면보다 뒷면이 나올 확률이 높다고 믿습니다. 이렇게 동전이 앞면으로 떨어졌을 때 평균의 법칙에 의하여 다음에는 뒷면에 나올 것이라고 믿는 오류가 도박꾼의 오류입니다. 횟수는 다음번 동전을 던질 때 나올 것에 대해서는 아무것도 발해 주지 않습니다. 그것은 오직 장기적 개연성만 추측함으로써 과거에 관찰했던 것과는 반대되는 것이 미래에 일어날 것이라고 예상하는 잘못을 범합니다.
인간의 심리에 의한 오류
인간은 기계와 달라서 동일한 환경이 주어지더라도 당시의 심리 상태에 따라서 전혀 다른 행동이나 판단을 내릴 수 있습니다. 그래서 인간의 행동에 관련된 경험적 확률을 정확하게 선정하는 것은 사실상 불가능합니다. 그럼에도 우리는 자신 있게 어떤 사람은 믿을 수 있고 어떤 사람은 그렇지 못하다고 단언합니다. 예를 들어 보겠습니다.
2015년에 장길산 선수는 처음 200번 타석에서 홈런 10개를 포함하여 안타 56개를 쳤습니다. 그의 타율은 2할 8푼입니다. 대부분의 사람들은 그가 다음 200타석에서도 10개의 홈런을 포함하여 안타를 56개를 치리라고 생각할 수 있습니다. 과연 그럴까요? 메이저 리그에서는 예측할 수 없는 많은 변수들이 생길 수 있기 때문에 이런 믿음이 확실하다고 할 수는 없습니다. 그가 시즌 전반과 달리 후반에 부진에 빠질 수도 있고, 처음 200번의 타석은 특별한 운이 따른 결과일 수도 있습니다. 결국에는 상대 팀 선수와 부딪치는 사고로 시진을 마감해야 했습니다. 물론 이런 여러 가지 요인들이 배제된다면 장길산 선수는 2015년에 홈런 20개를 포함하여 2할 8푼의 타율을 유지했을 가능성이 높습니다.
경험 세계에서의 확률은 우리의 일상생활에 심각하게 영향을 끼칠 수 있습니다. 그 좋은 예들이 법원의 재판과 관련되어 나타납니다.
법정에서 제출되는 증거의 신빙성 문제는 확률과 밀접하게 관련되어 있습니다. 판사, 검사, 변화사들이 하는 일은 많은 점에서 역사가, 인류학자, 고고학자의 작업과 비슷합니다. 역사가는 과거에 발생한 사건을 재구성하는 작업을 합니다. 마찬가지로 재판 과정에 관여하는 법률가들은 어느 정도 과거에 발생한 사건을 재구성합니다. 물론 주로 증빙 자료와 같은 가시적 증거를 찾는 작업을 하지만 신뢰성이라는 점에서 역사가의 사료와 성격에 크게 다르지 않습니다. 또한 판결을 내리는 재판관의 판단은 살아 있는 사람을 상대로 하는 것이기 때문에 다른 해석의 여지가 없도록 확실해야 합니다. 이런 점에서 '죽은 사람'을 상대로 하는 역사가의 해석과는 차이가 있습니다. 증인의 진술이 판결에 결정적으로 작용할 수 있는 사건인 경우 그 신뢰성은 피고나 원고의 신상에 지대한 영향을 끼칩니다. 증인의 진술이 이론의 여지없이 확실하다면 판결은 매우 쉽고 간결할 것입니다. 그러나 경험 세계에서 확실성이란 도달할 수 없는 이상과도 같습니다. 증인은 위증을 할 수도 있고, 선입견을 품고 고의로 어느 한쪽에 불리한 진술을 할 수도 있습니다.
그런데 문제는 자연이나 인간 사회에서 일어나는 많은 현상들이 확실성과는 거리가 멀다는 점입니다. 우리 주변의 상황은 언제나 결정과 비결정이 복합 저긍로 섞여 있습니다. 비결정적 요소, 즉 미지수가 많으면 많을수록 어떤 현상을 설명하는데 실패할 확률이 높아집니다. 다시 말하면, 결정되어 있는 현상들에 관해서는 언제나 확률적 예측이 가능하지만, 비결정적 현상들에 대해서는 예측이 불가능합니다. 통계는 미지수에 관한 자료들을 정리 조직하여 확률 현상에 관한 설명을 용이하게 하는 작업입니다. 확률과 통계는 동전의 양면과 같이 매우 밀접합니다.