베이즈 법칙 · 알고리즘, 인생을 계산하다

훅 — 베를린 장벽에 선 청년

1969년, 프린스턴 천체물리학 박사 진학을 앞둔 J. Richard Gott III가 유럽을 여행하다 베를린 장벽 앞에 섭니다. "이게 얼마나 더 갈까?" 그가 도출한 답은 충격적으로 단순했습니다 — 8년. 장벽이 8년 됐으니까요.

실제로 베를린 장벽은 1989년까지 20년 더 갔습니다. Gott의 예측은 빗나갔지만, 그 추론은 〈Nature〉에 게재되어 통계학에 큰 파장을 일으켰죠. 90세 노인이 180세까지 산다고? 6세 아이가 12세에 죽는다고?

베를린 장벽 앞 청년의 코페르니쿠스 추론 — 단 하나의 관측으로도 예측은 가능하다.

핵심 통찰

분포의 모양이 인생을 좌우한다

답은 분포의 종류에 있습니다. 같은 "지금까지 X" 정보로도, 분포가 정규/멱법칙/얼랑이냐에 따라 예측 규칙이 다릅니다.

평균 규칙

정규 분포

평균 근처에 답이 있다. 인간 수명, 영화 러닝타임.

×1.4 ~ ×2

멱법칙

오래 갈수록 더 오래 간다. 영화 흥행, 도시 인구, 부, 시(詩).

고정

얼랑 분포

과거가 미래에 영향 없음. 도박, 방사성 붕괴.

베이즈 정리 — 사전 분포(Prior) × 우도(Likelihood) = 사후 분포(Posterior).

직접 해보기

분포별 예측 시뮬레이터

🔮 분포별 예측 규칙

같은 "지금까지 X" 정보로도 분포 종류에 따라 예측이 완전히 달라집니다.

시나리오: 사람의 수명 (정규분포)

평균 76세 ± 16. 평균에 가까워질수록 곧 끝남.

현재 관측값: 40 세

예측

76.0 세까지

40세인 사람은 약 76세까지 살 것으로 예측됩니다. 정규분포는 평균(76세)을 중심으로 종형이라, 평균을 넘긴 후엔 매년 조금씩만 더 기대할 수 있습니다.

💡 좋은 예측은 좋은 사전 분포(prior)를 요구합니다. 영화 흥행을 정규분포로 착각하면 오버 평가, 사람 수명을 멱법칙으로 착각하면 비현실적 결과가 나옵니다.

핵심 인물

👤 Reverend Thomas Bayes· 1701~1761

영국 장로교 목사. 베이즈 정리는 그가 죽은 뒤 친구 Richard Price가 미발표 논문 더미에서 발견한 한 편입니다. 살아 있는 동안 한 번도 발표하지 않은 정리가 통계학을 바꿨습니다.

👤 Pierre-Simon Laplace· 1749 노르망디

아버지가 사제가 되길 원했지만 종교를 완전히 버린 수학자. 1774년 베이즈를 모른 채 독립적으로 같은 문제를 풀었습니다. Laplace의 후속 법칙: (w+1)/(n+2). 한 번 시도해 한 번 성공하면 다음 성공 확률은 2/3, 3번 시도해 3번 성공하면 4/5.

👤 세계대전 중 독일 탱크 추정· 2차 대전

연합군이 포획한 탱크의 일련번호로 독일 월간 생산량을 베이지안 추정했습니다. 결과: 매월 246대. 항공 정찰은 1,400대로 추정. 종전 후 독일 기록을 확인했더니 — 245대. 베이지안의 압승.

긴 꼬리에 살아남기

👤 Stephen Jay Gould· 하버드 생물학자

자기 형태의 암 환자가 진단 후 8개월 내 절반 사망한다는 통계를 봅니다. 그러나 분포가 우측으로 길게 늘어진 멱법칙임을 알고 안도하죠."내가 그 긴 꼬리에 있지 못할 이유가 없다." 실제로 진단 후 20년 더 살았습니다.

마시멜로 테스트의 재해석

1970년대 Walter Mischel의 스탠퍼드 마시멜로 테스트. 기다린 아이들이 SAT 성공 등에서 우월하다는 결과는 의지력의 우화로 알려졌습니다. 그런데 로체스터 대학 후속 연구가 충격을 안깁니다.

🔑환경의 신뢰성에 대한 베이지안 학습

마시멜로 테스트 전에 어른이 약속을 어기는 그룹의 아이들은 마시멜로를 더 일찍 먹었습니다. 의지박약이 아닙니다 — 멱법칙적 환경(어른이 언제 올지 모름)에서 자란 아이는 곱셈 규칙으로 "더 기다리면 더 오래 기다려야 한다"고 합리적으로 판단한 것입니다. 자기 통제는 부모의 일관성에 기반합니다.

미디어 시대의 함정

"같은 신문을 여러 부 사서 거기 적힌 게 사실인지 확인하려는 사람처럼."
— Wittgenstein

1990년대 미국 살인율은 20% 감소했지만, 뉴스의 총기 폭력 보도는 600% 증가했습니다. 2000년 이후 미국 상업 비행 사고 사망자는 카네기홀의 절반이 안 되지만, 같은 기간 자동차 사고 사망자는 와이오밍 인구 전체보다 많습니다.

좋은 베이지안이 되려면 사전 분포를 보호해야 합니다. 역설적이지만 그건 뉴스를 끄는 것을 의미할 수 있습니다.

실생활 적용

🚌 버스 정류장: 다른 사람이 7분 기다렸다면? 시간표 모르면 7분 더.
💑 연애 한 달째: 한 달 더 갈 가능성. 결혼식에 데려가는 건 시기상조.
🚧 "무사고 7일" 표지판: 짧은 일이 아니면 멀리하라.
🎬 영화 흥행 예측: 첫날 매출 × 1.4.
👶 양육: 약속을 일관되게 지켜 아이의 사전 분포를 형성하라.

💭

Reflection

고민해 볼 질문들

정답이 정해져 있지 않은 열린 질문입니다. 혼자 생각해 보거나, 가까운 사람과 함께 이야기 나눠 보세요.

01
당신의 '사전 분포'는 미디어로 얼마나 왜곡되어 있을까요? 무엇을 줄여야 진짜 세계가 보일까요?
02
당신이 정규분포로 보고 있던 것이 사실은 멱법칙(또는 그 반대)이었던 일은? 예측이 빗나갔던 이유가 분포 오인 때문이었던 적은?
03
오랜 관계, 일, 프로젝트가 '얼마나 더 갈까?' — 당신의 지금 상황에 코페르니쿠스 원리(×2)를 적용한다면?
04
마시멜로 테스트의 재해석처럼, 당신의 '의지박약'으로 보였던 행동 중 사실 합리적이었던 것은 없었나요?