Règles de présentation des résultats petits effectifs et données manquantes

Bonjour,
désolée si c’est une question un peu bête.
Ma question porte sur la façon d’exprimer les résultats descriptifs pour une petite population (n=26 dans mon cas) et aussi en cas de données manquantes.
Par exemple je veux décrire la répartition de la sévérité de la dépression parmi une population de 26 patients. Sur ces 26 patients les données ne sont disponibles que pour 20 patients.
Si je souhaite présenter cela sous forme de tableau, est ce que je dois calculer les pourcentages relatifs sur les 26 patients en ajoutant une modalité « données manquantes ». OU est ce que j’ai le droit de calculer les pourcentages relatifs sur les 20 patients pour lesquels les données sont disponibles (en précisant que l’effectif est de 20 en raison de données manquantes) ?
Et par exemple si je veux présenter cela sous forme de diagramme en barre, est ce que comme il s’agit d’un petit effectif il faut présenter le nombre de patients et pas le pourcentage ? et est ce que ma figure doit obligatoirement porter sur les 26 patients en ajoutant une barre représentant les données manquantes ? ou est ce qu’on peut se permettre de le présenter uniquement pour les 20 patients pour lesquels ces données sont disponibles ?
Car je vois pas mal de recommandations différentes. Certains disent que pour les petits effectifs cela n’a pas de sens de présenter les pourcentages relatifs. Mais d’autres disent que par exemple pour les diagrammes en barre il faut obligatoirement présenter les pourcentage et non pas le nombre de patients.
Du coup je suis un peu perdue je ne sais pas s’il y a une règle précise à ce sujet ?

Bonjour,
Rassurez-vous il n’y a pas de question bête !
Pour ce qui est des tables, le plus classique est d’indiquer une ligne supplémentaire « Valeurs manquantes » et d’en préciser l’effectif. On calcule généralement les % sur le nombre de valeurs disponibles (dont effectif total - valeurs manquantes). Ce faisant la somme des % est toujours égale à 100%.

Attention, il en va de même pour le calcul d’un écart-type, une moyenne, etc → ne prendre que les valeurs disponibles.

Parfois il peut être utile de calculer un % par rapport à l’effectif total malgré des valeurs manquantes. Par exemple si sur 100 sujets 50 sont des hommes, 30 des femmes et on ne connait pas l’information pour les 20 restants, vous pouvez dire que :

  • dans votre échantillon 62,5% des sujets sont des hommes
  • dans l’hypothèse d’un biais de réponse lié au sexe (toutes les valeurs manquantes sont des hommes ou des femmes), votre échantllon comprend entre 50 et 70% d’hommes (selon si les valeurs manquantes sont tous des hommes ou tous des femmes).
    → si ce genre de statistique vous est utile, il est tout à fait autoriser de les mentionner. Par contre on le fera de préférence à l’écrit plutôt que dans une table.

Je n’ai pas connaissance de recommendation stricte sur la représentation d’effectif ou de % pour les diagrammes en barres. A mon avis les deux options peuvent se défendre.

Par contre il est vrai que sur des effectifs faibles le calcul de pourcentage n’est pas toujours conseillé car chaque sujet va représenter plusieurs pourcents à lui seul. Exemple caricatural de ce qu’il ne faut pas faire : « près de 70% des sujets (N=2/3) avaient… ».

Quel que soit votre choix (% ou effectif) l’écart est avant tout perçu visuellement par la taille de vos barres.

Enfin concernant l’affichage des valeurs manquantes sur votre diagramme, il vous faudra obligatoirement faire comprendre au lecteur que N valeurs sont manquantes. On considère généralement qu’une figure doit être autosuffisante (globalement compréhensible même détachée du texte). Vous devrez donc soit afficher une barre correspond aux valeurs manquantes, soit préciser cette information à l’aide d’une légende comprise dans la figure.

D’accord c’est plus clair pour moi ! Merci pour votre réponse