기계학습, 딥러닝에서는 베이즈 정리(Bayes’ rule)에 기반한 아이디어가 많습니다. 굉장히 직관적인 개념이고 수식도 간단한데, 의외로 많은 분들이 어려워합니다. 이런 분들께 도움이 되도록 몇 번에 걸쳐 베이즈 추론을 쉽고 간략하게 설명해보겠습니다.

그럼 다음과 같은 상황을 가정해 보겠습니다. 병원에서 의사가 환자를 진단하는 사례입니다.

의사: 어디가 아프신가요?

환자: 계속 기침이 납니다.

여기서 우리가 알고 있는 정보는 기침이라는 ‘증상’이고, 알아내야 할 것은 기침의 원인 즉 ‘병명’입니다(실제 의사라면 더 많은 증상을 모아서 진단하겠지만, 여기서는 기침만 고려하겠습니다).

문제는 증상으로 기침을 하는 질병이 너무 많다는 점입니다. 그렇다면 이 상황에서 의사가 취할 수 있는 합리적인 전략은 뭘까요……..?

네, 그렇습니다. 기침이 나는 여러 질병 중에서 가장 확률이 높은 쪽으로 진단하는 겁니다. 상식적으로 이 방식이 가장 합리적인 선택이라는 점에 동의하시리라 믿습니다^^ 그림으로 표현하면 다음과 같습니다.

위의 그림에서 P(감기|기침)는 “기침을 하는 사람들 중에서 감기일 확률(비율)”을 의미합니다. 흔히들 이런 확률을 ‘조건부 확률’이라고 하지만, 지금은 전혀 신경쓰실 필요 없습니다.

P(OO|기침) = 기침하는 사람들 중에서 OO 병에 걸린 사람의 비율

설명 끝났습니다. 이상과 같은 방식으로 최종 결정(진단)을 내리는 방식을 “베이즈 추론(Bayesian inference)”이라고 합니다 🙂 정말 직관적이고 쉬운 개념 아닌가요? 일상 생활에서도 대부분 이런 과정을 거쳐 뭔가를 결정하니까요.

(‘추론’이라는 잘 안쓰는 말이 나왔는데, 결정, 진단, 판단 등으로 이해하시면 됩니다. 병을 진단하는 과정은 ‘이 환자의 병은 OO일 것이다’라는 가설을 세우고 이 가설을 검증한다고 볼 수 있기 때문에, ‘추론’이라는 말이 쓰입니다.)

그럼 이제 P(OO|기침)를 계산하는 방법만 알면 되겠네요? 오, 훌륭합니다. 다음 글에서는 이 문제를 다루겠습니다 😉

베이즈 추론 #1 – 베이즈 추론

3 thoughts on “베이즈 추론 #1 – 베이즈 추론

  • 2017-11-25 at 19:27
    Permalink

    다음 연재가 기대 됩니다 이 기사는 대표님께서 직접 작성하시나요?

    Reply
    • 2017-11-26 at 11:29
      Permalink

      네, 이건 제가 쓰는 중입니다 ㅎ

      Reply
  • 2017-11-26 at 17:52
    Permalink

    수업에서 설명하기 까다로운 부분인데 아주 명쾌하네요. 대표님 화이팅

    Reply

Leave a Reply

Your email address will not be published. Required fields are marked *