Faux positifs et Faux négatifs

Il y a deux erreurs qui reviennent souvent en arrière lorsque vous apprenez sur les tests d’hypothèse — les faux positifs et les faux négatifs, appelés techniquement erreur de type I et erreur de type II respectivement.

Au début, je n’étais pas un grand fan des concepts, je ne pouvais pas comprendre comment ils pouvaient être utiles. Au fil des ans, cependant, j’ai commencé à changer d’avis. Plus je comprenais et rencontrais ces erreurs, plus elles commençaient à m’exciter et à m’intéresser. Voir leurs applications et utilisations réelles m’a aidé à passer d’un étudiant désintéressé à un enseignant enthousiaste.

Vous connaissez ces enseignants qui parlent frénétiquement d’un sujet que personne ne comprend ou ne veut comprendre? Ouais, c’est moi maintenant! Et c’est génial, alors je veux vous amener à mon niveau d’excitation avec cet article en vous montrant comment ces deux erreurs ont des implications pratiques dans des contextes réels différents et intéressants. Ensuite, j’espère qu’après l’avoir lu, vous aurez envie de tout dire à vos proches sur les faux positifs et les faux négatifs. Chanceux!

Exclaimer: Cet article n’est pas là pour vous apprendre à faire la distinction entre les deux. Si vous souhaitez comprendre comment faire cela, j’ai fait une vidéo explicative sur le sujet ici.

Quelle erreur diriez-vous la plus grave?

Un faux positif (erreur de type I) – lorsque vous rejetez une hypothèse vraie nulle – ou un faux négatif (erreur de type II) — lorsque vous acceptez une hypothèse fausse nulle?

J’ai lu à de nombreux endroits que la réponse à cette question est: un faux positif. Je ne crois pas que ce soit vrai à 100%.

L’approche scientifique appropriée consiste à former une hypothèse nulle de manière à vous faire essayer de la rejeter, ce qui me donne le résultat positif. Donc, disons que je veux voir si cet article en particulier fonctionne mieux que la moyenne des autres articles que j’ai publiés.

Dans cet esprit, l’hypothèse nulle que je choisirai est:

« Le nombre de fois que mon article est lu sera inférieur ou égal au nombre d’articles similaires que j’ai postés »

Si je rejette l’hypothèse nulle, cela signifie l’une des deux choses.

1. Cet article a été réalisé au-dessus de la moyenne – Génial! Voilà mon résultat positif.

2. J’ai fait une erreur de type I. J’ai rejeté une hypothèse nulle qui était vraie. Mon test a montré que j’avais des résultats supérieurs à la moyenne, mais en fait, je ne l’ai pas fait. J’ai un faux positif.

Oui, ici mon faux positif a un mauvais résultat, je penserais inévitablement que mon article est meilleur qu’il ne l’est et à partir de là, j’écris tous mes articles dans le même style, ce qui nuit finalement au trafic de mon blog. Cela affectera sans aucun doute ma carrière et mon estime de soi de manière négative.

Qu’en est-il du faux négatif?

Cela se produirait si, disons, cet article était un chef-d’œuvre de l’écriture de blog mais mon test me montre qu’il n’est même pas médiocre. Bien sûr, je n’essaierai pas d’écrire des articles dans ce style de sitôt. Cependant, je suis une personne motivée qui apprend de ses « erreurs », alors essayez plutôt différentes techniques et créez potentiellement de meilleurs écrits.

Ce n’est pas le meilleur résultat, j’ai peut-être raté une occasion, mais ce n’est en aucun cas aussi dévastateur que le faux positif.

Maintenant, c’est un cas où la pire situation est le faux positif, cependant, un fait crucial est que j’ai énoncé l’hypothèse nulle d’une manière spécifique. Si j’avais échangé les hypothèses nulles et alternatives, les erreurs auraient également été échangées.

Laissez-moi vous montrer.

Ma nouvelle hypothèse nulle:

« Le nombre de fois que mon article est lu sera supérieur au nombre d’articles similaires que j’ai postés »

Dans une situation de faux positif, je rejetterais une hypothèse nulle qui est vraie. Donc, le test montrerait que mon chef-d’œuvre est en fait médiocre ou pire. Vous vous souvenez de cette phrase? C’était le faux négatif de l’exemple précédent.

Ce que cela montre, c’est que les deux erreurs sont interchangeables. Par conséquent, tout dépend de la conception de votre étude; vous pouvez changer les choses pour vous aider à éviter le plus gros problème.

Trouver le positif dans le positive positif.

Lorsque vous postulez pour un emploi dans l’industrie de la science des données, une question d’entrevue qui revient souvent est la suivante:

« Pouvez-vous fournir des exemples de situations où un faux positif a un meilleur résultat qu’un faux négatif? »(et vice versa)

Bien sûr, vous pouvez utiliser l’exemple ci-dessus, cependant, certains universitaires n’aiment pas particulièrement entendre l’idée d’échanger des hypothèses. Je voulais juste prouver un point que tout n’est pas si noir et blanc en ce qui concerne ce concept.

De plus, j’ai beaucoup d’autres exemples pour vous que vous pouvez poser sur votre employeur potentiel et leur montrer que vous connaissez vraiment vos affaires. Vous les gagnerez en un rien de temps!

Ces exemples ont des hypothèses qui ne peuvent pas être changées en raison de la science ou du droit (voir, pas si noir sur blanc). Ils nous donnent cependant des situations où avoir un faux négatif n’est pas l’idéal. Bien sûr, nous sommes toujours un peu rebelles, mais le faire dans le cadre de la science et du droit, alors, qui peut nous arrêter!

À bébé ou pas à bébé?

Lorsque vous passez un test de grossesse, vous demandez: « Suis-je enceinte? »

Dans les tests d’hypothèse, cependant, vous avez votre hypothèse nulle:

« Je ne suis pas enceinte »

Rejeter l’hypothèse vous donne un ‘+’ Félicitations! Tu es enceinte!

Accepter l’hypothèse vous donne un ‘-‘ Désolé, meilleure chance la prochaine fois!

La biologie détermine celui-ci, donc pas de changement je crains. Bien que les tests puissent mal fonctionner et que des faux positifs se produisent; Dans ce cas, un faux positif serait ce petit « + » lorsque vous n’êtes pas enceinte. Un faux négatif, bien sûr, serait le « – » lorsque vous avez un petit bébé qui grandit en vous.

C’est un bon exemple car la meilleure situation dépend entièrement de votre situation!

Imaginez que quelqu’un essaie d’avoir un enfant depuis longtemps, puis par miracle, son test de grossesse revient positif. Elles se préparent mentalement à avoir un bébé et après une courte période d’extase, d’une certaine manière, elles découvrent qu’elles ne sont en fait pas enceintes!

C’est un résultat terrible!

Un faux négatif pour quelqu’un qui ne veut vraiment pas d’enfant, n’est pas prêt pour un et lorsqu’il s’assure d’un résultat négatif, boit et fume peut être incroyablement dommageable pour elle, sa famille et son bébé.

Échangez les situations de ces femmes, cependant, et vous obtenez des résultats qui, bien qu’ils ne soient pas idéaux, sont bien meilleurs.

Temps de Trivia!

Les tests de grossesse ont avancé pour minimiser les risques de faux négatif. Cela améliore le test car s’il est peu probable que vous alliez chez un médecin pour confirmer un résultat négatif, il serait judicieux de le faire avec un résultat positif. Il existe un certain nombre de raisons médicales pour obtenir un faux positif, mais les faux négatifs n’apparaissent qu’en raison d’une mauvaise exécution du test.

Tests de SIDA

Voici un exemple plus clair.

Imaginez un patient qui passe un test de dépistage du VIH.

L’hypothèse nulle est:

« Le patient n’a pas le virus VIH. »

Les ramifications d’un faux positif seraient d’abord déchirantes pour le patient; devoir faire face au traumatisme de faire face à cette nouvelle et de le dire à votre famille et à vos amis n’est pas une situation que vous souhaiteriez à qui que ce soit, mais après être allé se faire soigner, les médecins découvriront qu’elle n’a pas le virus. Encore une fois, ce ne serait pas une expérience particulièrement agréable. Mais ne pas avoir le VIH est finalement une bonne chose.

Par contre, un faux négatif signifierait que le patient a le VIH mais le test montre un résultat négatif. Les implications de ceci sont terrifiantes, le patient manquerait des traitements cruciaux et courrait un risque élevé de propager le virus à d’autres

Sans aucun doute, le faux négatif ici est le plus gros problème. Tant pour la personne que pour la société.

Anecdotes:

De nombreux médecins appellent les résultats du sida « réactifs », plutôt que positifs, à cause de faux positifs. Avant qu’un patient ne soit définitivement déclaré séropositif, une série de tests sont effectués. Tout n’est pas basé sur un seul échantillon de sang.

Positif, jusqu’à preuve négative

Dans de nombreux pays, la loi stipule qu’un suspect dans une affaire pénale est: « Innocent jusqu’à preuve du contraire ».

Cela vient du latin

‘Ei enabit probatio, qui dicit, non qui negat; cum per rerum naturam factum negantis probatio nulla sit’.

Qui se traduit par: « La preuve repose sur celui qui affirme, pas sur celui qui nie ; puisque, par la nature des choses, celui qui nie un fait ne peut produire aucune preuve. »*

Par conséquent, l’hypothèse nulle est:

« Le suspect est innocent. »

Si simplement, un faux positif entraînerait la condamnation d’une partie innocente, tandis qu’un faux négatif produirait un verdict d’innocence pour une personne coupable.

En cas de manque de preuves, accepter l’hypothèse nulle est beaucoup plus susceptible de se produire que de la rejeter. Par conséquent, si la loi était que le suspect est « Coupable jusqu’à preuve de son innocence. »l’hypothèse étant « Le suspect est coupable. »accepter l’hypothèse nulle quand elle est fausse entraînerait l’emprisonnement de nombreux innocents.

Ainsi, protéger une personne innocente au risque (éventuellement) de laisser partir cinq personnes coupables semble en valoir la peine pour beaucoup de gens.

Avec la loi telle qu’elle est, le consensus général est que le faux positif serait le plus gros problème. L’idée de mettre une personne innocente derrière les barreaux est troublante, car prouver qu’elle est en fait innocente une fois condamnée n’est pas simple. Alors qu’un faux négatif entraînerait la libération d’un coupable, une affaire pourrait être rouverte ou, si la personne est un délinquant en série, elle sera de toute façon condamnée à une date ultérieure.

Anecdotes:

Jusqu’à récemment, le Mexique utilisait le système « coupable sauf preuve d’innocence ». En conséquence, les juges n’ouvriraient même pas la plupart des affaires pénales, car ils craignaient de mettre trop d’innocents en prison. Depuis 2008, le système de justice pénale mexicain est en transition vers « innocent, sauf preuve de culpabilité « .

Chaque respiration que tu prendras, je te regarderai.

Les alcootests sont une nuisance nécessaire. Personne ne veut être arrêté pour un test d’alcoolémie, mais personne ne veut non plus être tué par un conducteur ivre. Balançoires et ronds-points.

L’hypothèse nulle: « Vous êtes en dessous de la limite d’alcool. »

Encore une fois, tout simplement, un faux positif montrerait que vous dépassez la limite lorsque vous n’avez même pas touché à une boisson alcoolisée. Un faux négatif vous enregistrerait comme sobre lorsque vous êtes ivre, ou du moins au-dessus de la limite.

Les deux problèmes surviennent en raison de facteurs variables qui peuvent influencer les échantillons d’alcoolémie. Pour contrer les problèmes de faux positifs (perdre son permis, recevoir des amendes ou une peine de prison), la loi stipule que l’on peut fournir un échantillon de sang ou d’urine pour prouver son innocence (s’ils le sont, c’est-à-dire).

Dans cet esprit, un faux négatif est clairement le plus gros problème. Permettre aux conducteurs ivres de continuer à conduire en supposant qu’ils sont sobres est évidemment dangereux pour eux et pour les autres autour d’eux. Alors que perdre quelques heures de votre journée est un petit prix à payer si cela aide à garder plus de gens au-dessus de la limite, hors de la route.

Anecdotes:

Les taux d’alcoolémie courants auxquels les personnes sont considérées comme ayant une déficience légale pour la conduite varient de 0,00% à 0,08%. Les repères les plus courants dans le monde sont 0,00%, également connu sous le nom de tolérance zéro, et 0,05%. La limite est la plus élevée des îles Caïmans, s’établissant à 0,1 %. Cela n’implique pas une tolérance plus élevée à la conduite en état d’ébriété, donc avant de prendre la route après une bouteille de Jack Daniels, gardez à l’esprit que la police locale applique vraiment les lois avec des contrôles fréquents.

Les ordures d’une personne sont le trésor d’une autre.

La dernière chose dont je veux parler est le SPAM.

De nombreux sites Web vous diront quelque chose du type: « Veuillez vérifier votre dossier SPAM. L’e-mail que nous venons de vous envoyer peut se retrouver là. »

Les fournisseurs de messagerie utilisent de plus en plus des algorithmes d’exploration de données pour filtrer le SPAM de ce qui est recherché. C’est un sujet qui mérite un article à part entière. Cependant, nous parlons de la situation où les e-mails sont égarés.

J’ai été sidérée quand, il y a quelques semaines, j’ai envoyé un e-mail à ma sœur et son fournisseur de messagerie l’a marqué comme SPAM! Comment osent-ils! La seule explication que j’ai pu trouver était que j’ai utilisé ma boîte aux lettres personnelle pour envoyer par e-mail l’adresse e-mail de l’entreprise de ma sœur. Ainsi, l’algorithme n’a vu aucune preuve que mon e-mail serait souhaité par ma sœur (peut-être sait-il quelque chose que je ne sais pas…). Par conséquent, il a accepté l’hypothèse nulle:

« Cet e-mail est du SPAM. »

Si l’algorithme rejette l’hypothèse nulle, l’e-mail passe. Un faux positif signifierait que votre boîte de réception aurait l’étrange e-mail de princes nigérians cherchant à vous épouser, ou de parents perdus depuis longtemps demandant vos coordonnées bancaires, afin qu’ils puissent vous envoyer le gros héritage du chat de la belle-fille du cousin de votre arrière-grand-mère.

Un faux négatif pourrait très bien être le plus gros problème. Vous risquez de manquer une invitation à une entrevue ou les clichés de vacances de votre frère ou votre sœur, simplement parce qu’ils sont perdus dans les quantités abondantes de SPAM — que vous parcourez à demi-mot avant de les supprimer.

Ceci est dû à une préférence personnelle cependant, certaines personnes sont tellement exaspérées par une notification sur leur téléphone, seulement pour voir un e-mail inutile, que quelques e-mails personnels mal placés sont un petit prix à payer.

Anecdotes:

Plus de 95% des demandes d’amis que vous envoyez sur Facebook sont acceptées, car vous contactez généralement des personnes que vous connaissez. Ce n’est pas vrai pour les comptes de SPAM et c’est l’une des façons dont Facebook les détecte. Cependant, les robots ont récemment adopté une stratégie dans laquelle ils prétendent être des femmes attirantes et se concentrent sur les utilisateurs masculins en tant que victimes. Parce que les utilisateurs masculins acceptent en moyenne ces invitations d’amis, il faut beaucoup plus de temps pour détecter les robots.

Ce sont quelques exemples courants de cas où vous pouvez avoir des faux positifs et des faux négatifs. Comme vous pouvez le voir, l’erreur qui est préférable dépend vraiment de la situation elle-même, de vos préférences personnelles ou de la façon dont l’étude a été conçue (et que vous pouvez simplement changer l’hypothèse si nécessaire). Donc, j’espère que vous ne suivrez pas l’hypothèse générale selon laquelle les faux positifs entraînent de plus gros problèmes et que vous êtes maintenant mieux outillés pour produire des exemples solides pour le sauvegarder.

Maintenant, je parie que votre intérêt pour les faux positifs et les faux négatifs est passé de 0% à 100% après avoir lu cet article. Si vous voulez de la science à ce sujet, vous pouvez vérifier notre erreur vidéo de type I vs erreur de type II.

Bonne journée!

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

More: