Comment
lire un article scientifique : les biais et les pièges
Comment décoder l’information médiatique ?
C.Jamin
Paris
L’acquisition
des connaissances par le médecin prescripteur est l’aboutissement d’une chaîne
de transmissions qui a son origine dans la recherche fondamentale publiée dans
des revues spécialisées ou des colloques de chercheurs. Puis arrive le chercheur
clinicien qui tente de mettre en route des essais dont les objectifs et la méthodologie
tiennent compte des résultats de recherche fondamentale. Les résultats de ces
essais cliniques sont à leur tour publiés dans des revues ou présentés dans
des réunions médicales que lisent et auxquelles assistent rarement les thérapeutes.
Une étape intermédiaire est donc nécessaire. Elle est offerte soit par des journalistes
spécialisés, soit par des « leaders » qui assimilent l’information,
la synthétisent et la transmettent en langage clair au prescripteur. Cependant
cette chaîne est rarement aussi linéaire et les courts circuits sont nombreux.
Les chercheurs communiquent parfois directement auprès des prescripteurs avec
plus ou moins de bonheur, les leaders s’intéressent souvent à la science fondamentale,
etc…
Même dans un fonctionnement idéal, cette transmission du savoir présente un
nombre de pièges considérables liés à la qualité de l’information donnée, à
son exhaustivité, à la compréhension du sujet par chaque maillon de la chaîne
et enfin à l’interprétation que font de l’information les différents niveaux
de lecture .
Le désarroi du médecin prescripteur est grand devant la multiplicité des informations
contradictoires à sa disposition, et ce désarroi est d’autant plus justifié
que le débat fait partie du jeu intellectuel, ce jeu n’ayant rien à voir avec
la responsabilité que doit prendre le prescripteur devant le patient.
Chacun d’entre nous devrait donc être capable de se faire une idée de la qualité
de ce qu’il lit afin de pouvoir faire au mieux des choix diagnostic et thérapeutique.
Il ne sera pas traité ici de la lecture des articles fondamentaux : en
effet leur interprétation et leur critique n’est pas à notre portée en général,
ce qui est fort dommage. En effet devant l’absence de preuves cliniques si fréquente
dans notre profession, on fait souvent appel à des travaux fondamentaux pour
conforter telle ou telle hypothèse. Parfois même ces travaux viennent au premier
plan dans un débat à la place des preuves cliniques, qui étonnamment deviennent
accessoires.
Pour illustrer le problème de cette pseudo logique, prenons le cas de deux exemples
contradictoires :
Les estrogènes stimulent la prolifération cellulaire, ils ont donc obligatoirement
un rôle dans la cancérogénèse ou promotion cancéreuse mammaire.
Les estrogènes favorisent la différenciation cellulaire, ils protègent donc
indiscutablement du cancer du sein.
Ces deux phrases sans appel ont été prononcées dans un débat sur le cancer du
sein en 2000 au Congrès de Tarbes.
Ainsi, première vérité, la biologie est nécessaire à la compréhension des résultats
cliniques, parfois comme orientation dans un débat ou le doute persiste, mais
jamais au grand jamais ils ne sont suffisants pour se passer de l’expérimentation
clinique.
Petit glossaire à
l’usage des publications cliniques :
étude
de prévalence
Il s’agit d’études transversales descriptives donnant la proportion de sujets
atteints d’une maladie dans une population donnée à un instant donné.
Une évolution de prévalence est possible à mesurer en étudiant plusieurs périodes.
Attention aux extrapolations du type « la prévalence de découverte du cancer
de l’endomètre s’est accrue au même rythme que la prescription d’une estrogénothérapie
isolée de la ménopause ». L’estrogénothérapie isolée donne donc le cancer
de l’endomètre, première explication. Autre possibilité : l’estrogénothérapie
fait saigner les femmes ménopausées, les saignements entraînent des explorations,
ces explorations permettent de découvrir des cancer infra cliniques. La prévalence
apparente du cancer de l’endomètre devient égale à la prévalence observée dans
les dépistages systématiques. Quelle est la bonne réponse ?
études
pronostiques
Elles permettent de rechercher de manière prospective ou rétrospective les
facteurs pronostiques d’une maladie.
Exemple : la mortalité par cancer de l’endomètre ou du sein est plus faible
lorsque la femme est sous estrogénothérapie au moment où le cancer est découvert.
Explications possibles :
1 : les femmes traitées sont mieux surveillées
2 : les estrogènes stimulent uniquement les cancers différenciés et les
hyperplasies atypiques souvent associées à des cancers infracliniques.
3 : les estrogènes stimulent les clones différenciés, permettant de découvrir
les cancers avant le développement des clones indifférenciés.
4 : les estrogènes améliorent la différenciation des cancers
5 : les estrogènes induisent des cancers de bon pronostic
Quelle est la bonne réponse ?
études
étiologiques ou analytiques
Elles visent à rechercher les facteurs de risque associés à une maladie
. études de cohorte
prospectives ou rétrospectives
Deux populations sont étudiées : l’une malade, l’autre non (ou qui
va devenir malade ou non). On compare les caractéristiques des deux populations
et l’on s’interroge sur l’existence de différences entre les deux populations,
ces différences sont les facteurs de risque ou de protection.
La prise d’une hormonothérapie substitutive ou d’une contraception orale augmente
le risque de découverte du cancer du sein. Le sur risque augmente avec la durée
du traitement.
Questions :
Ces traitements augmentent-ils l’induction du cancer ?
Ces traitements augmentent-ils la promotion du cancer ?
Les femmes traitées appartiennent à des populations ayant un risque au départ
plus élevé de cancer, la révélation du risque ne se manifestera que plus tard,
donc après une certaine durée de traitement. Les femmes traitées sont bien surveillées,
les femmes non traitées le sont de moins en moins avec le temps alors que la
prévalence de la maladie augmente avec l’âge, l’effet dépistage devient-il ainsi
de plus en plus pertinent ?
. études cas témoin :
On apparie les sujets d’une population malade à ceux d’une population témoin
suivant le plus grand nombre de critères possibles, en particulier en prenant
des critères connus pour être associés à la maladie, âge, poids, taille, revenus,
niveau d’études, nombre de grossesse, âge des grossesses etc… et on recherche
si le facteur étudié est plus fréquent dans la population malade. Malheureusement
on ignore le plus souvent les facteurs réellement associés aux maladies dont
étudie les facteurs de risques : on ne peut donc les introduire dans le
choix des témoins. Exemple : que vaudrait une étude sur le cancer du poumon
si on ignorait le tabac ?
Ces
études permettent de calculer les risques relatifs RR et odds ratio ( plus précis
quand les maladies sont fréquentes). Il s’agit du facteur multiplicatif par
lequel le risque de maladie est multiplié en présence des facteurs incriminés.
Le RR de cancer du sein est de 1,8 chez le femmes prenant de l’alcool, de 1,1
chez les femmes ayant reçu des estrogènes en post ménopause, et de 1,8 chez
les femmes hôtesses de l’air, 1,5 chez les nullipares.
Ces chiffres sont suivis d’un intervalle de confiance lorsque le 1 est présent
entre les normes de l’intervalle de confiance exemple (0,8 – 1,7) le résultat
est dit non significatif lorsqu’il n’y est pas (1,3 – 1,9) le résultat est dit
significatif.
Les biais de ces études même les mieux faites sont souvent très importants et
il est impossible de tous les prévoir. On dit que pour tenir compte de ces résultats
et suspecter un éventuel lien causal, il faut des RR supérieurs à 3. Mais à
contrario si ce chiffre de 3 est nécessaire, il n’est souvent pas suffisant.
Certains (rares) discutent encore le lien existant entre tabagisme et cancer
du poumon alors que le RR est à 17 !
Cependant plus le RR est élevé, plus le lien de causalité est crédible.
les études expérimentales
Il s’agit des essais thérapeutiques et de prévention. Un groupe reçoit un
traitement, l’autre non. Lorsque la répartition entre les groupes est tirée
au sort on parle de randomisation. Le patient ne recevant pas le traitement
peut ou non recevoir un placebo ou un traitement de référénce. Lorsque le patient
ne sait pas s’il reçoit le traitement, il s’agit d’une étude en simple aveugle.
Lorsque le médecin ne le sait pas non plus, il s’agit d’une étude en double
aveugle.
Le nec plus ultra des essais est l’étude randomisée versus placebo. Le placebo
est souvent nécessaire : on sait par exemple que l’amélioration de l’acné
est de 30% versus placebo, et que l’efficacité placebo est meilleure lorsque
son observance est bonne !
Significativité
d’un résultat
- Si
la probabilité que la différence observée entre un groupe traité et un groupe
non traité dûe au hasard est inférieure à 5%, on admet que la différence observée
peut être attribuée au traitement (p< 0,05).
- Intervalle
de confiance
Ensemble des valeurs dans lequel se trouve la valeur exacte des paramètres considérés
avec une probabilité donnée en général 95 %. Plus l’intervalle de confiance
est étroit, plus la certitude augmente. Lorsque le 1 est entre les normes de
l’intervalle de confiance, le résultat est dit non significatif.
Le risque de cancer du sein sous estroprogestatifs dans l’étude de Berkvist
est de 4,4, mais l’intervalle de confiance va de 0,9 à 22 !
Calcul
de population
Lorsque l’on examine des essais antérieurs et des essais pilotes, les écarts
entre les résultats obtenus avec et sans traitement d’une part et la variabilité
des résultats observés permet de calculer le nombre de sujets nécessaires dans
un essai pour que la significativité apparaisse si elle existe.
Dans les études épidémiologiques, plus les résultats observés sont éloignés
des résultats observés dans la population non traitée (RR élevé) et moins la
dispersion des résultats est grande (intervalle de confiance resserré), moins
le nombre de sujets nécessaires est important. A l’inverse, pour démontrer une
différence dans le risque thrombo-embolique suivant la génération de pilule,
il faudrait près d’un million de femmes randomisées !
Méta-analyse
Procédé consistant à additionner les résultats de différents études pour augmenter
le nombre de sujets, donc augmenter la chance d’obtenir un résultat significatif.
Mais attention : on additionne les résultats mais aussi les sources d’erreur.
Parfois on donne un coefficient de valeur aux études pour privilégier les meilleures.
Seules les meta-analyses d’études randomisées ont une grande valeur. Les méta-analyses
d’études épidémiologiques sont très critiquables. Leurs résultats sont corrélés
très faiblement aux résultats que l’on obtiendrait en faisant une étude randomisée
comprenant le même nombre de sujets (35%).
Au plan
pratique :
Seules les études d’intervention prospectives randomisées versus placebo en
double aveugle permettent d’avoir les certitudes de la médecine basée sur des
évidences.
Malheureusement très rares sont les situations où ce type d’essais est possible.
Souvent on est amené à se passer du double aveugle, de l’aveugle du placebo,
etc…
On s’éloigne encore des certitudes lorsqu’on fait appel non plus à des études
expérimentales mais à des études étiologiques, analytiques ou de prévalence.
Pour que des résultats aient une certaine crédibilité on demande des risques
relatifs élevés. En leur absence on fait appel à la notion de faisceau d’arguments :
* tous les résultats vont dans le même sens
* il existe une plausibilité biologique et surtout une logique dans la démarche
sans occulter les éléments qui vont dans un sens inverse ( dans la protection
cardiovasculaire par le THS oral, que penser de l’élévation des triglycérides,
de la CRP et des facteurs de coagulation ?)
Même en gardant à l’esprit toutes ces bonnes résolutions, les plus grandes certitudes
sont parfois remises en cause avec l’amélioration des techniques d’études.
Mais le thérapeute, lui, face à ses patients, doit à chaque instant prendre
des décisions et les arguties de statisticiens ne lui sont d’aucun secours.
Ce qu’on lui demande est de
connaître les certitudes
peser en son âme et conscience le rapport bénéfice risque de chacun de ses actes
ne pas tomber dans le militantisme
et surtout avoir la volonté de faire évoluer ses pratiques
Mais les juges de tous poils (chercheurs, biostaticiens, épidémiologistes, spécialistes
des essais cliniques…) ont aussi leurs devoirs, dont l’humilité n’est pas le
moindre.
|