지금까지 베이즈 추론의 설명에 세 개의 확률이 등장했습니다. 이 세 확률은 워낙 유명해서 각각 이름이 붙어 있습니다.

왜 이런 이름을 붙였는지는 제게 묻지 마세요. 그냥 아주 오래 전부터 저렇게 불러왔다고 합니다 😉 (사실 한글 이름은 더 끔찍합니다. 저는 차마 입에 담지 못하겠으니 직접 찾아보세요 ㅋ)

어쨌든, 위에 정의된 이름을 들먹여 정리하면, 베이즈 추론은 결국 a posteriori 확률이 최대인 OO을 찾는 문제라고 할 수 있겠네요. 빙고! 그래서 베이즈 추론을 MAP(maximum a posteriori) 문제라고 부릅니다.

저, 질문 있습니다. 이전 설명에서 P(기침|폐암) 값은 진료기록에서 통계조사를 한다고 했는데요, 그렇다면 P(폐암|기침) 확률도 진료기록을 뒤져 통계조사를 하면 되는 거 아닌가요? 기침 증상이 기록된 환자 중에서 폐암으로 진단 받은 사람의 비율을 구하면 될 것 같은데요? 베이즈 추론에서는 왜 굳이 복잡하게 돌려서 계산하죠?

만약 통계 자료를 쉽게 구할 수 있다면 그렇게 해도 되지만, 대개는 불가능한 경우가 많습니다. 베이즈 정리는 이런 경우에 유용하게 쓰입니다. 베이즈 정리는 P(폐암|기침)처럼 직접 구하기 어려운 확률을, 이미 알고 있는 값(여기서는 P(기침|폐암))을 활용해 계산해낼 수 있기 때문입니다.

베이즈 추론은 외부로 드러난 증상에 기반해서 숨겨진 가설을 추론할 때 사용합니다. 즉, 관찰된 현상을 통해 그 속에 숨겨진 본질을 찾는 게 목표입니다. 앞의 예제는 ‘기침’이라는 증상에서 ‘질병’이라는 숨겨진 본질을 찾는 문제였습니다.

P(가설|증상)  ∝  P(증상|가설) P(가설)

반대로 가설이 확정되었을 때 어떤 증상이 나타나는지, 예를 들어 폐암에 걸렸을 때 어떤 증상을 보이는지는 추론할 필요가 거의 없습니다. 증상은 외부로 드러나기 때문에 직접 관찰(측정)하면 되니까요 🙂

 

이상으로 베이즈 추론에 대한 설명을 모두 마쳤습니다. 틀렸거나 이해가 안되는 점들은 댓글을 남겨주시면 답변 드리겠습니다. 답변이 쌓이면 기회를 봐서 FAQ을 만들어 정리해놓도록 하겠습니다.

다음 글은 베이즈 추론이 실제 연구에서 어떻게 활용되는지에 대해 설명해 볼 생각입니다. 긴 글 읽어주셔서 감사합니다~~

베이즈 추론 #4 – 세 개의 확률

6 thoughts on “베이즈 추론 #4 – 세 개의 확률

  • 2017-12-01 at 22:42
    Permalink

    정말 쉽게 설며해주셔서 도움이 많이 되었습니다 정말 완독하는데 20분 미만

    Reply
    • 2017-12-02 at 08:00
      Permalink

      저희 주장을 확인해주셔서 감사합니다 ㅋ

      Reply
  • 2018-05-28 at 09:33
    Permalink

    안녕하세요.
    베이즈 추론에 대하여 완벽하게 설명해 주셔서 감사합니다.
    너무 큰 도움이 되었고, 속이 후련하네요

    멋진 설명에 다시 감사드립니다.

    Reply
    • 2018-05-30 at 10:43
      Permalink

      도움이 되셨다니 기쁘네요^^ 글 남겨주셔서 감사합니다~~

      Reply
  • 2018-06-01 at 10:45
    Permalink

    베이즈 추론 하나도 모르는 학생이었는데, 이 포스팅들 보고 크게 배워 갑니다! 다 읽는데 몇 분 걸리지도 않았는데, 명쾌하네요!

    Reply
    • 2018-06-04 at 08:57
      Permalink

      감사합니다^^ 이제 시작이시니 더 크게 성장하시길 기원합니다~~

      Reply

Leave a Reply

Your email address will not be published. Required fields are marked *