Zadanie wstępne

Wczytaj dane naive_bayes_data.csv. Wyestymuj \(P(Y=1 \mid X_1=1, X_2=0, X_3=1)\) przy założeniu modelu naiwnego Bayesa. Do jakiej klasy zaliczysz obserwację \(x_1=1, x_2=0, x_3=1\)?

Podpowiedź:

Wiemy, że \[ P(X_1=1 | Y=1) = \frac{P(X_1=1 , Y=1)}{ P(Y=1)} \]

i mamy estymatory

\[ \hat{P}(X_1=1 , Y=1) = \frac{n(x_1=1, y=1)}{n}, \qquad \hat{P}(Y=1) = \frac{n(y=1)}{n},\]

gdzie \(n(\textrm{warunki})\) oznacza liczbę obserwacji spełniających warunki, a \(n\) oznacza liczbę obserwacji. Mamy więc

\[\hat{P}(X_1=1|Y=1) = \frac{n(x_1=1, y=1)}{n(y=1)}.\]

Podpowiedź 2:

Nie estymuj \(P(X_1=1, X_2=0, X_3=1)\). Skorzystaj z tego, że prawdopodobieństwa sumują się do \(1\).

Odpowiedź:

\[ \hat{P}(Y=1 \mid X_1=1, X_2=0, X_3=1) = 0.5892088\]

Odpowiedź pełna

\[P(Y=1 \mid X_1=1, X_2=0, X_3=1) = \frac{P(X_1=1, X_2=0, X_3=1 \mid Y=1)P(Y=1)}{P(X_1=1, X_2=0, X_3=1)} \overset{NB}{=} \frac{P(X_1=1\mid Y=1)P(X_2=0\mid Y=1)P(X_3=1\mid Y=1)P(Y=1)}{P(X_1=1, X_2=0, X_3=1)} \] Estymujemy \(P(X_1=1\mid Y=1)P(X_2=0\mid Y=1)P(X_3=1\mid Y=1)P(Y=1)\), potem estymujemy \(P(X_1=1\mid Y=0)P(X_2=0\mid Y=0)P(X_3=1\mid Y=0)P(Y=0)\), więc otrzymujemy estymatory \(P(Y=1 \mid X_1=1, X_2=0, X_3=1)*\textrm{stała}\) i \(P(Y=0 \mid X_1=1, X_2=0, X_3=1)*\textrm{stała}\) i to ta sama stała. Teraz z \(1\) można wszystko wyliczyć.

Uwaga \(\textrm{stała} = P(X_1=1, X_2=0, X_3=1)\)