Normalité des variables

Lorsque on compare des variables quanti entre 2 groupes on doit choisir entre un test de Student (si distribution normale) ou un test de Wilcoxon (si distribution anormale). Est-ce bien ça ?

Je sais faire les 2 tests mais je ne sais pas dire quand ma varaible est normale ou pas. J’ai affiché des histograme avec excel mais franchement c’est pas clair clair.

Pare xmple sur cet histogramme j’ai représenté l’âge de mes patients. Et-ce quon peut parler de normalité ?

Screenshot from 2022-12-29 14-55-30

J’ai vu quon pouvait aussi obtenir la normalité avec des tests. Etce que ca n’est pas plus facile dans ce cas et comment fait on ?

Petite précision avant de répondre : on parle de distribution non paramétrique (et non anormale).

Pour répondre à la question du test de normalité : il existe bien des tests qui évaluent la normalité d’une variable. Cependant ces tests ont tous le même défaut : avec peu de sujets vous n’aurez jamais la puissance suffisante pour rejetter l’hypothèse nulle (= normalité de vos variables) et avec beaucoup de sujets vous rejetterez systématiquement l’hypothèse nulle (=distribution non paramétrique pour toutes vos variables).

C’est pourquoi l’approche par histogramme est plus intéressante à mon goût, bien qu’un peu subjective.
Si vous souhaitez tout de même explorer les tests de normalité : regardez du côté des tests de Shapiro-Wilk ou de Kolmogorov-Smirnov par exemple.

Pour votre histogramme, j’ai d’abord quelques questions :

  • le pic à 1 an as-t-il une explication particulière ?
  • y a-t-il une raison pour qu’aucun sujet ne présente un âge > 19 ans ?

[Edité suite à votre réponse]

Le pic à 1 an étant avéré, c’est en défaveur d’une distribution normale (laquelle tend normalement vers 0 aux extrémités). De même le cutoff à 19 ans coupe brutalement votre histogramme . Même s’il y avait une distribution normale, ce cutoff rend votre distribution non paramétrique.

→ Je concluerais ici à une distribution non paramétrique.

PS : rappelez vous que dans le doute, en considérant une variable comme non paramétrique (et donc en utilisant un test de Wilcoxon) pour êtes certain de ne pas faire d’erreur.