Le théorème de Bayes, au calme

“Le théorème de Bayes nous donne un moyen de mettre à jour nos croyances en fonction de nouveaux éléments de preuve pertinents.”

Whaaa, ça a l’air perché ce truc ?

Ouai j’avoue, en fait le théorème de Bayes est tellement cool qu’il a sa propre chanson :

Bayes est partout

Vous venez de rechercher quelque chose sur Google ?

Le théorème de Bayes vient juste d’être utilisé pour afficher les résultats de votre recherche.

Il en va de même pour les recommandations que vous propose Netflix ou Youtube.

Anti-spams ? Voitures autonomes ?

Médecine ? Espionnage ?

Idem

À la base, le théorème de Bayes est une « simple » formule mathématique qui a révolutionné la façon dont nous comprenons et traitons l’incertitude.

Si la vie est considérée en noir et blanc, le théorème de Bayes nous aide à penser aux zones grises.

Lorsque de nouvelles preuves apparaissent, il nous aide à mettre à jour nos croyances.

Prêt à creuser et à explorer les bases du théorème qui a changé le monde ?

Allons-y !

On va commencer par le pire, l’équation du théorème de Bayes :

Courage !

A vrai dire, la première fois que j’ai vu cette équation, mon cerveau m’a dit « N’essaies même pas ».

Au lieu de s’abîmer la caboche, je propose qu’on tente ensemble de résoudre un cas pratique, histoire d’avoir une première approche, une “intuition” du théorème de Bayes.

Une première intuition…OKLM

La comicoplasmose est une maladie qui donne une envie irrépressible de lire des comics.

Je vous assure que c’est terrible, je l’ai depuis mes 5 ans. On y survie, mais on passe pour un ado attardé pour le restant de ses jours.

Il n’existe aucun traitement, vous devez succomber à la tentation.

La comicoplasmose frappe fort

Par contre nous avons des données sur cette maladie :

5 % de la population totale est infectée par la comicoplasmose.

et

Il existe un test :

. En cas de comicoplasmose, le test est fiable à 90 %

En d’autres termes, la probabilité d’avoir un test positif si l’on a la comicoplasmose est de 90% (vrai positif)

. Sur une personne saine, le test est fiable à 85 %

C’est-à-dire que la probabilité d’avoir un test négatif si l’on a pas la comicoplasmose est de 85 % (vrai négatif).

Et donc Docteur ?

Vous êtes médecin et votre patient, M. Wayne vient d’être testé positif.

Intuitivement, on commence à paniquer.

On se dit…. M. Wayne a 90% de chance d’avoir la comicoplasmose !

Fini alors les soirées à lire du Proust et du Balzac ?

Et bien…. En vérité il n’y a que 24 % de chances que M. Wayne ait la comicoplasmose.

C’est à ce moment-là qu’il faut ressortir notre bon vieux théorème de Bayes.

Initialement, nous avons la situation suivante sur l’ensemble de la population :

Nous savons que le test a les spécificités suivantes :

Si le testé a effectivement la comicoplasmose, le test revient positif 90 % du temps (et il est donc négatif 10 % du temps).

Si le porteur est sain, le test revient positif 15 % du temps (et le test revient donc négatif 85 % du temps).

A partir de là nous pouvons en déduire :

Probabilité d’avoir un vrai positif : 5% x 90% = 4,5%

On prend une personne au hasard, il y a 4,5% de chance que le test soit positif et que la personne soit atteinte de comicoplasmose.

Probabilité d’avoir un faux négatif : 10% x 5% = 0,5 %

On prend une personne au hasard, il y a 0,5% de chance que le test soit négatif et que la personne soit atteinte de comicoplasmose.

Probabilité d’avoir un faux positif : 95% x 15% = 14,25%

On prend une personne au hasard, il y a 14,25% de chance que le test soit positif alors que la personne est saine.

Probabilité d’avoir un vrai négatif : 95% x 85% = 80,75%

On prend une personne au hasard, il y a 80,75% de chance que le test soit négatif et que la personne est saine.

Récapitulons

Et maintenant nous pouvons sortir notre belle équation !

. La barre verticale | signifie « sachant que »

. P signifie probabilité

. A & B sont des événements.

. P(A|B) est la probabilité que l’événement A soit vrai sachant que l’événement B est vrai.

. P(B|A) est la probabilité que l’événement B soit vrai sachant que l’événement A est vrai

N’oublions pas notre question

Sachant que M. Wayne a été testé positif, quelle est la probabilité qu’il ait effectivement la comicoplasmose ?

Soit B la probabilité d’avoir un test positif

Soit A la probabilité d’avoir effectivement la comicoplasmose

P(A|B) signifie : quelle est la probabilité d’avoir effectivement la comicoplasmose sachant qu’on a un test positif.

Il est aussi possible d’écrire l’équation de la manière suivante :

Décomposons chacun des éléments de l’équation :

P(positif|comicoplasmose) = 90%

90 % d’avoir un test positif sachant que le patient à la comicoplasmose.

P(comicoplasmose) = 5 %

5% de la population a effectivement la comicoplasmose.

P(positif) = 18,75%

Il s’agit de la probabilité total d’avoir un test positif (vrai positif = 4,5% + faux positif = 14,25%).

Ce qui donne :

Soit 24 %

Il y a seulement 24 % de chance d’avoir la comicoplasmose sachant qu’on a un test positif.

Cet exemple se trouve dans un fichier Excel (onglet Comicoplasmose) ici :

fichier

Le fichier propose un autre exemple (onglet Ebriete)

Cette vidéo vous aidera à le résoudre :

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s