Likelihood(가능도)와 Probability(가능성)


Reference

확률(Probability)

동전 던지기에서 나올 수 있는 경우의 수는 앞/뒷면으로 ‘공평한 동전’일 경우 앞면이 나올 확률은 1/2이고, 뒷면이 나올 확률 또한 1/2로 총 합은 1이다.

동전을 10번 던졌을 때 앞면이 0번 나올 확률은 (반올림해)0.001, 5번 나올 확률은 0.5, 10번 나올 확률은 0.001. 이런 식으로 모든 경우의 수를 합하면 총 합은 1이 된다.

연속사건의 확률

특정 사건의 확률은 모두 0이다.

앞면과 뒷면과는 다르게, 0에서 1사이의 숫자 중 무작위로 아무 숫자를 뽑는다고 했을 때 그 숫자가 정확히 0, 1일 확률은 0이다.

import random
for _ in range(10000):
    if random.random() is 0:
        print("We did it")

>> Nothing

1/∞ = 0. 연속 사건에서 그 어떤 특정한 사건이 일어날 확률은 무조건 0이다.
이 문제를 해결하기 위해 연속사건에서는 특정한 ‘구간’에 속할 확률을 계산해야 한다.

가능도(likelihood)

연속사건에서는 특정 사건이 일어날 확률이 전부 0으로 계산되기 때문에 사건들이 일어날 가능성을 비교하는 것이 불가능하며, 가능도라는 개념을 적용해야 이를 비교할 수 있다. 쉽게 말하자면 분포 그래프의 y값을 가능도로 생각하면 된다. 즉, y값이 높을수록 일어날 가능성이 높은 사건이라는 것이다. 주사위나 동전을 던지는 경우는 y값이 각 사건이 일어날 확률을 나타내었으므로 가능도=확률이 되어, 확률이 높을수록 일어날 가능성이 높은 사건이 된다. 한편 정규분포같이 연속사건인 경우는 PDF의 값이 바로 y가 되며 0에 해당하는 PDF값이 0.4로 1 에 해당하는 PDF값인 0.24보다 높아 0 근처의 숫자가 나올 가능성이 1 근처의 숫자가 나올 가능성보다 높다고 할 수 있으며, 0이 나올 확률과 1이 나올 확률이 모두 0인 것과는 대조적이다. 이를 정리하면 가능도의 직관적인 정의는 다음과 같다.

가능도의 직관적인 정의 : 확률분포함수의 y값 셀 수 있는 사건: 가능도 = 확률 연속 사건: 가능도 ≠ 확률, 가능도 = PDF값