Bonjour à tous
Voilà, c'est la première fois que je poste ici car je ne trouve rien sur Internet pour répondre à ma question. Voilà, pour ceux qui connaissent un peu les statistiques, vous devez sans doute connaître les Box Plots (ou boîtes à moustache dans leur définition française). Pour mon mémoire, j'ai dû en effectuer pour comparer deux populations d'échantillon afin de visualiser leurs disparités. Trois paramètres étaient retenus : l'intensité de marquage de l'anticorps, le pourcentage d'expression de l'anticorps, chacun allant de 1 à 3, et le SCORE total qui résultait de l'addition de ces deux paramètres avec une échelle allant de 1 à 6. Dans le logiciel SPSS, les échelles en ordonnée mentionnaient deux valeurs pour chaque valeur maximale (donc 3 pour l'intensité et le pourcentage et 6 pour le score total). Pour faire simple, en ordonnée, j'avais deux valeurs de 3 pour intensité et % et deux valeurs de 6 pour le score. Après question au prof, il m'a expliqué que le logiciel SPSS ne prenait pas en compte les décimales, ce qui voulait dire que, par exemple, le premier 3 était 2,5.
Je me pose toutefois la question du pourquoi de l'intérêt de recourir à ce que je suppose être une échelle logarithmique. Est-ce pour éviter un écrasement des Box Plots qui nuiraient à la compréhension et à la pertinence de leur interprétation ? Donc si jamais, il y a des statisticiens qui se baladent à cette heure-ci, je leur en serai extrêmement reconnaissant s'ils apportent des mots sur mon interrogation.
En espérant avoir été bien clair et merci d'avance
Je ne comprends pas l'explication de ton boxplot, ni ou intervient l'echelle logarithmique (c'est la question que tu poses mais tu n'en parles pas avant). Une echelle logarithmique sur des valeurs de 1 a 6 ca parait pas forcement tres pertinent, mais en meme temps ca change pas grand chose...
Ca serait peut etre plus clair si tu faisais un schema de ton graph?
Voilà comment mes graphiques se présentent
Ah oui ok, c'était peut être clair mais j'avais pas compris ça.
Non je ne pense pas que ça ait un lien avec une échelle logarithmique, par contre je ne sais pas non plus ce que c'est censé vouloir représenter, c'est la première fois que je vois ça aussj
Mais déjà le fait que ton logiciel arrondisse les valeurs c'est assez foireux. Je sais pas si il y a une raison pour ces données en particulier, mais c'est pas quelque chose de standard non plus.
Le 21 janvier 2020 à 23:49:52 blue-tamere a écrit :
Ah oui ok, c'était peut être clair mais j'avais pas compris ça.
Non je ne pense pas que ça ait un lien avec une échelle logarithmique, par contre je ne sais pas non plus ce que c'est censé vouloir représenter, c'est la première fois que je vois ça aussj
En gros, ça compare les disparités des échantillons de tissus cancéreux en fonction de l'intensité du marquage de l'anticorps (0 = pas de marquage, 1 = faible marquage, 2 = modéré, 3 = intense). A droite, on a juste le Score total qui est une combinaison du pourcentage d'expression de l'anticorps (0 = 0% de marquage, 1 = 26 - 50%, 2 = 51 - 75%, 3 = 76 - 100%) et de l'intensité. Ce qui explique que l'on somme les deux échelles pour avoir un Score compris entre 0 et 6.
On voit qu'il y a des disparités entre les lésions bénignes (symbolisées par le chiffre 1 en abscisse) et les lésions malignes (le chiffre 2) comme nous le voyons avec la position de la médiane.
Je précise que ce n'est pas moi qui ai fait les tests