Se connecter

Savoir & Culture

Cours et Devoirs

Sujet : Interprétation d'un diagramme Box Plots
1
PoucavePuceau
Niveau 40
21 janvier 2020 à 18:36:36

Bonjour à tous :-)

Voilà, c'est la première fois que je poste ici car je ne trouve rien sur Internet pour répondre à ma question. Voilà, pour ceux qui connaissent un peu les statistiques, vous devez sans doute connaître les Box Plots (ou boîtes à moustache dans leur définition française). Pour mon mémoire, j'ai dû en effectuer pour comparer deux populations d'échantillon afin de visualiser leurs disparités. Trois paramètres étaient retenus : l'intensité de marquage de l'anticorps, le pourcentage d'expression de l'anticorps, chacun allant de 1 à 3, et le SCORE total qui résultait de l'addition de ces deux paramètres avec une échelle allant de 1 à 6. Dans le logiciel SPSS, les échelles en ordonnée mentionnaient deux valeurs pour chaque valeur maximale (donc 3 pour l'intensité et le pourcentage et 6 pour le score total). Pour faire simple, en ordonnée, j'avais deux valeurs de 3 pour intensité et % et deux valeurs de 6 pour le score. Après question au prof, il m'a expliqué que le logiciel SPSS ne prenait pas en compte les décimales, ce qui voulait dire que, par exemple, le premier 3 était 2,5.

Je me pose toutefois la question du pourquoi de l'intérêt de recourir à ce que je suppose être une échelle logarithmique. Est-ce pour éviter un écrasement des Box Plots qui nuiraient à la compréhension et à la pertinence de leur interprétation ? Donc si jamais, il y a des statisticiens qui se baladent à cette heure-ci, je leur en serai extrêmement reconnaissant s'ils apportent des mots sur mon interrogation.

En espérant avoir été bien clair et merci d'avance :-)

blue-tamere
Niveau 12
21 janvier 2020 à 19:13:08

Je ne comprends pas l'explication de ton boxplot, ni ou intervient l'echelle logarithmique (c'est la question que tu poses mais tu n'en parles pas avant). Une echelle logarithmique sur des valeurs de 1 a 6 ca parait pas forcement tres pertinent, mais en meme temps ca change pas grand chose...

Ca serait peut etre plus clair si tu faisais un schema de ton graph?

PoucavePuceau
Niveau 40
21 janvier 2020 à 21:00:25

https://www.noelshack.com/2020-04-2-1579636805-ao2.png

Voilà comment mes graphiques se présentent :hap:

blue-tamere
Niveau 12
21 janvier 2020 à 23:49:52

Ah oui ok, c'était peut être clair mais j'avais pas compris ça.
Non je ne pense pas que ça ait un lien avec une échelle logarithmique, par contre je ne sais pas non plus ce que c'est censé vouloir représenter, c'est la première fois que je vois ça aussj

blue-tamere
Niveau 12
22 janvier 2020 à 00:18:27

Mais déjà le fait que ton logiciel arrondisse les valeurs c'est assez foireux. Je sais pas si il y a une raison pour ces données en particulier, mais c'est pas quelque chose de standard non plus.

PoucavePuceau
Niveau 40
22 janvier 2020 à 11:19:44

Le 21 janvier 2020 à 23:49:52 blue-tamere a écrit :
Ah oui ok, c'était peut être clair mais j'avais pas compris ça.
Non je ne pense pas que ça ait un lien avec une échelle logarithmique, par contre je ne sais pas non plus ce que c'est censé vouloir représenter, c'est la première fois que je vois ça aussj

En gros, ça compare les disparités des échantillons de tissus cancéreux en fonction de l'intensité du marquage de l'anticorps (0 = pas de marquage, 1 = faible marquage, 2 = modéré, 3 = intense). A droite, on a juste le Score total qui est une combinaison du pourcentage d'expression de l'anticorps (0 = 0% de marquage, 1 = 26 - 50%, 2 = 51 - 75%, 3 = 76 - 100%) et de l'intensité. Ce qui explique que l'on somme les deux échelles pour avoir un Score compris entre 0 et 6.

On voit qu'il y a des disparités entre les lésions bénignes (symbolisées par le chiffre 1 en abscisse) et les lésions malignes (le chiffre 2) comme nous le voyons avec la position de la médiane.

Je précise que ce n'est pas moi qui ai fait les tests :hap:

1
Sujet : Interprétation d'un diagramme Box Plots
   Retour haut de page
Consulter la version web de cette page