Bonjour,
Dans le cadre de ma thèse d’exercice en médecine générale, j’ai réalisé une étude descriptive transversale quantitative : il s’agissait d’une enquête de pratiques avec recueil des données par le biais d’un questionnaire en ligne.
L’objectif principal de mon étude était de dresser un état des lieux de ce qui était fait en termes de promotion d’un vaccin et j’avais comme objectif secondaire d’essayer de mettre en évidence des facteurs influençant l’attitude des praticiens interrogés.
Je dispose d’un effectif relativement faible : malgré plusieurs relances, je n’ai obtenu que 71 réponses sur les 930 questionnaires envoyés (la période estivale, peu propice, à laquelle j’ai effectué mon recueil de données n’a pas dû aider).
Pour satisfaire à l’objectif secondaire de mon étude, j’ai voulu réaliser des analyses bivariées pour rechercher une éventuelle association entre certaines variables recueillies et le fait d’être réticent ou non à promouvoir la vaccination étudiée. J’ai donc divisé mon effectif en 2 groupes : un groupe de sujets « réticent à promouvoir le vaccin » et un groupe « non réticent », en fonction de leur réponse à cette question. Seulement, le groupe de sujets « réticent » ne comporte que 4 individus.
J’ai présenté les résultats de ces analyses bivariées sous la forme d’un tableau et je sais que dans les tables on présente souvent les effectifs accompagnés des pourcentages entre parenthèses mais je m’interrogeais : est-il judicieux (ou en tout cas « acceptable ») de faire apparaitre les pourcentages, dans la mesure où l’effectif du groupe « réticent » n’est que de 4 individus et où on se retrouve parfois avec 2 individus qui représentent 33,3% de l’effectif ?
Pour la recherche d’une association entre la variable « âge » et le fait d’être réticent ou non à la promotion du vaccin, j’avais initialement pris le parti de résumer la variable âge en 2 groupes « 40 ans et moins » et « plus de 40 ans » pour des raisons de praticité de l’analyse. Mais je me demandais, est ce qu’il vaut mieux effectuer la comparaison en gardant la variable âge à l’état de variable quantitative à l’aide d’un test de Wilcoxon-Mann Whitney (la distribution de ma variable « âge » semblant à priori non paramétrique) ?
En sachant que la p-value devient à la limite de la significativité en utilisant cette 2ème option d’analyse et que Biostatgv ne me fournit pas de mesure de la force d’association (qui serait une différence entre les moyennes si j’ai bien compris).
Enfin, toutes mes excuses pour cette dernière question qui est probablement très simpliste mais j’ai beaucoup de mal à comprendre : pour le test d’association entre la variable « niveau de formation en vaccination » qui est une variable que j’ai rendu binaire en regroupant des valeurs numériques (faible / élevé), avec le test exact de Fisher j’obtiens une p-value de 0,033 mais un OR à 14,4 avec un IC95% contenant la valeur 1 [0,844-249,166]. Je ne sais pas quoi en conclure : faut-il conclure que comme l’IC de confiance contient la valeur 1, on ne met pas en évidence d’association entre le niveau de formation et la réticence à la promotion de ce vaccin ?