Pignolik's Blog: Formula di Bayes

Il teorema di Bayes [è] uno strumento complicato, potente e spesso frainteso della teoria applicata della probabilità. (Amir D. Aczel)

Prima che fossero utilizzati i test basati sul sequenziamento del DNA, nei processi di riconoscimento di paternità erano in uso test basati sul gruppo sanguigno e altri fattori ereditari per stimare, attraverso la formula di Bayes, la probabilità che un dato uomo fosse il padre.

Problema. Supponiamo che il gruppo sanguigno del figlio sia B, che quello della madre (Alice) sia A e che quello del presunto padre (Bob) sia B. Date queste informazioni, qual è la probabilità che Bob sia il padre?

Per vedere come sia possibile rispondere, osserviamo che i geni che controllano il gruppo sanguigno possono essere di tipo 0, A oppure B e che A e B sono dominanti sopra 0, ma né A né B è dominante sopra l’altro. Si ottiene quindi la seguente tavola che mette in corrispondenza genotipi (il tipo dei due geni), fenotipi (il gruppo sanguigno osservato) e probabilità relative:

Se indichiamo con E l’evento “il gruppo sanguigno del figlio è B” e con F l’evento “Bob è il padre”, dovremo calcolare P(F|E) a partire da questi dati. Non conosciamo il genotipo di Bob, ma possiamo dire che la probabilità che Bob sia di tipo B0 sapendo che è di tipo B è 0,116/0,123; quindi P(E|F) = [(0,116)(0,5)+(0,007]/0,123 = 0,528: se Bob fosse il padre, il figlio avrebbe una probabilità appena superiore a 1/2 di avere gruppo B.

Dovremo ora calcolare P(E|non F). Ma se Bob non è il padre, chi lo è? Scegliamo una persona a caso dalla popolazione globale: allora la probabilità che questa persona abbia (con Alice) un figlio di gruppo B è: (0,116)(1/2) + 0,007 + (0,038)(1/2) = 0,084.

Per utilizzare la formula di Bayes, dobbiamo ancora stimare P(F): la probabilità a priori che Bob sia il padre. Ma, ovviamente, Alice afferma che questo numero è vicino a 1, mentre Bob ritiene che questo numero dovrebbe essere 0. La pratica comune, in questo caso, è di partire da un valore intermedio, diciamo P(F) = 0,5 = P(non F). A questo punto, la formula di Bayes ci porta a concludere che P(F|E) = 0,8628.

(I dati di questo problema sono tratti da Rick Durrett, Elementary Probability for Applications).

Problema. Il test di controllo sul gene Hiv ha una percentuale di falsi positivi (persone che vengono dichiarate infette anche se non lo sono) pari a 1/100. Qual è la probabilità di essere malato se il test a cui mi sottopongo è positivo? La risposta più completa a questa domanda, a mia conoscenza, è contenuta nel libro di Leonard Mlodinov, La passeggiata dell'ubriaco. L'autore, partendo da una esperienza personale, discute come la conoscenza delle "condizioni al contorno" faccia la differenza sulle conseguenze.

Ad esempio, secondo i dati per l’Italia del UNAIDS/WHO Global HIV/AIDS Online Database (http://www.who.int/globalatlas/defa...) dell’Organizzazione Mondiale della Sanità, si ottiene una stima di 2,6 persone malate su 1000 viventi con HIV/AIDS, per l’anno 2005. Partendo da questo valore, dopo aver ottenuto esito positivo da un test diagnostico con specificità e sensitività pari a 0,99, quindi molto buone, la probabilità di essere effettivamente malato per un italiano risulta pari a 0,21, quindi la probabilità di un falso positivo, cioè di non essere malato pur risultando positivo al test, è 0,79.

Per vedere come l'ignoranza in questo caso sia diffusa, è esemplare la storia del signor Renato Goldstaub, di Bologna (http://www.repubblica.it/2008/05/sezioni/cronaca/bo...), riportata su Repubblica. Per altre discussioni di come questa ignoranza sia diffusa anche in ambito medico si può vedere anche il libro di Gerd Gigerenzer, Quando i numeri ingannano.

Ma se la persona viene da una diversa popolazione allora i risultati possono cambiare ed anche di molto. Ad esempio, supponendo che nella popolazione gay maschile la probabilità di una infezione sia circa del 3%, si ottiene che la probabilità di essere malati, sapendo di essere risultati positivi al test, è superiore al 75%.

Pignolik's Blog

mercoledì 16 marzo 2011

Formula di Bayes

Nessun commento:

Posta un commento