한국교통대 산업경영공학과 교수

통계는 우리가 불확실과 미지를 다루는 데 도움을 준다. 우리의 세계는 예측할 수 없고, 혼돈이며, 무작위인 것을 조합한 사건에 의해 의미 있게 결정된다. 우리의 능력이 미치지 않는 과정에 대해 결정하고 행동해야만 한다. 통계를 다루는데 있어서 배워야 할 가장 중요한 것 중의 하나는 상식을 사용하는 것이다. 우리가 습관적으로 공식을 따르거나 상식을 무시한다면, 부적당한 상황에서 공식을 이용하기 쉽고 우리가 우리 자신이 통계적으로 옳다고 확신하는 엉터리를 생산하기 쉽다.

자료를 설명하는 것은 통찰력으로 가득 차고 유익할 수 있다. 자료를 정돈하는 것은 우리가 탐구하고 있는 상황에 대한 배경 구조를 제안할 수 있다. 통계적 징조에 의해 나온 결과에서 배경 논리를 찾을 수 있다. 가끔 자료 분석은 어떤 행동에 대해 나올 만한 결과들이 예상과 다를 수 있음을 보임으로써 우리를 놀라게 한다.

어떤 것을 이해하는 목적 중의 하나는 무엇이 무엇을 야기하는지를 찾아내는 것이다. 따라서 우리가 두 가지 양이 연관되면서 변화하는 것을 관찰 할 때, 하나가 다른 하나의 원인인지를 의심하는 것이 합당하다. 그러나 조심하라. 단지 두 가지가 연관되면서 변화하기 때문에 하나가 어떤 다른 것을 야기한다고 추론하는 것은 잠재적인 오류의 근원이다. 우리가 한 가지를 다른 것으로부터 정확하게 예측할 수 있다 하더라도, 한 가지가 다른 것을 야기한다고 결론지을 수 없다. 한 가지가 다른 것을 따른다는 이유만으로 한 가지가 다른 것을 야기한다고 생각하는 오류는 논리적 결함이다.

몇 가지 예를 들어 보자. 모든 회사대표의 94%는 개인 비서를 두고 있다. 따라서 당신이 법인의 지도자가 되기 위해서는 비서를 고용하라. 비행기의 1등석을 타는 사람은 부자다. 따라서 우리가 1등석 좌석 표를 사면 우리는 부자다. 교도소 죄수들의 약 3분의 2는 이혼한 부모를 두었다. 따라서 이혼한 가정의 자녀들은 범죄에 쉽게 빠져든다.

우리가 하는 결정은 궁극적으로 통계에 기반을 둔다, 우리는 어떤 약이 위험한 부작용을 나타내고, 비타민 C를 복용하는 것이 우리의 수면을 늘릴 것인지에 관해 알고 싶어 한다. 우리는 포커 게임에서 카드를 언제 붙잡고 있어야 하고, 언제 접어야 하고, 언제 그만둬야 하는지 등을 알고자 한다.

이 질문들을 심도 있게 다루는 한 가지는 우리가 믿는 가정을 주장하고, 실험하고, 자료를 수집하고, 우리가 실제로 구한 자료가 가정이 옳다면 그들도 옳은 범위에 들어갈 확률을 계산함으로써 우리의 가정을 시험하는 것이다. 자료가 가정에 대응하지 못한다면, 가정이 틀릴 가능성이 있다고 결론지을 수 있다. 예를 들어 새로운 약을 개발했다고 가정하고, 이 약이 사람들을 토하게 만들 확률이 단지 10%라 주장한다. 이것이 옳은지 조사하기 위해 무작위로 선택된 대단위의 사람들에게 이 약을 복용하도록 한다. 그들의 80%가 약을 먹은 후 토했다면, 우리는 단지 10%의 사람들만 토할 것이라 주장을 강하게 의심하게 된다. 물론 약이 전체 수의 단지 10%만 실제로 아프게 할지라도 우리가 무작위로 선택한 사람들의 집단이 우연히도 보통과 다르게 민감한 위를 가지고 있을 희미한 가능성은 존재한다. 그러나 주어진 자료에서 우리는 10% 가정은 유효하지 않다고 확신을 기질 수 있다.

SNS 기사보내기
기사제보
저작권자 © 충청매일 무단전재 및 재배포 금지