Test de Kruskal-Wallis avec des détails sur les comparaisons par paires
La norme stats::kruskal.module de test permet de calculer le test kruskal-wallis sur un jeu de données:
>>> data(diamonds)
>>> kruskal.test(price~carat, data=diamonds)
Kruskal-Wallis rank sum test
data: price by carat by color
Kruskal-Wallis chi-squared = 50570.15, df = 272, p-value < 2.2e-16
C'est correct, c'est de me donner une probabilité que tous les groupes dans la base de données ont la même moyenne.
Cependant, je voudrais avoir les détails de chaque paire de comparaison, comme si les diamants de couleur D et E ont la même moyenne de prix, comme certains autres logiciels ne (SPSS) lorsque vous demandez un test de Kruskal.
J'ai trouvé kruskalmc de l'emballage pgirmess qui me permet de faire ce que je veux faire:
> kruskalmc(diamonds$price, diamonds$color)
Multiple comparison test after Kruskal-Wallis
p.value: 0.05
Comparisons
obs.dif critical.dif difference
D-E 571.7459 747.4962 FALSE
D-F 2237.4309 751.5684 TRUE
D-G 2643.1778 726.9854 TRUE
D-H 4539.4392 774.4809 TRUE
D-I 6002.6286 862.0150 TRUE
D-J 8077.2871 1061.7451 TRUE
E-F 2809.1767 680.4144 TRUE
E-G 3214.9237 653.1587 TRUE
E-H 5111.1851 705.6410 TRUE
E-I 6574.3744 800.7362 TRUE
E-J 8649.0330 1012.6260 TRUE
F-G 405.7470 657.8152 FALSE
F-H 2302.0083 709.9533 TRUE
F-I 3765.1977 804.5390 TRUE
F-J 5839.8562 1015.6357 TRUE
G-H 1896.2614 683.8760 TRUE
G-I 3359.4507 781.6237 TRUE
G-J 5434.1093 997.5813 TRUE
H-I 1463.1894 825.9834 TRUE
H-J 3537.8479 1032.7058 TRUE
I-J 2074.6585 1099.8776 TRUE
Toutefois, cette formule ne permet qu'une variable catégorique (par exemple, je ne peux pas étudier le prix regroupés par couleur et par carat, comme je peux le faire avec de kruskal.de test), et je ne sais rien à propos de la pgirmess paquet, s'il est maintenu ou pas, ou si il est testé.
Pouvez-vous me recommander un package pour exécuter le test Kruskal-Wallis qui renvoie des détails pour chaque comparaison? Comment géreriez-vous le problème?
source d'informationauteur dalloliogm | 2010-03-19
Vous devez vous connecter pour publier un commentaire.
Une autre approche, en plus de kruskal::agricolae mentionné par Marek, est le Nemenyi-Damico-Wolfe-Dunn test mis en œuvre dans la page d'aide pour oneway_test dans la pièce de paquet qui utilise multcomp. À l'aide de hadley de l'installation et de la réduction de la B= valeur de l'approximatif() fonction de sorte qu'il se termine en un temps fini:
Des résultats plus stables sur que le plus grand ensemble de données peut nécessiter l'augmentation de la valeur B et l'accroissement de l'utilisateur de la patience.
Jan: 2012: Il y avait récemment un message sur le R-aider à réclamer des résultats inattendus à partir de cette méthode, j'ai donc envoyé cet e-mail à la responsable. Marque Difford a dit qu'il avait confirmé les problèmes et proposé un autre essais avec le nparcomp package: https://stat.ethz.ch/pipermail/r-help/2012-January/300100.html
Il y avait aussi dans la même semaine, un couple de d'autres suggestions sur rhelp post-hoc des contrastes KW tests:
kruskalmc proposé par Mario Escudero Garrido et
rms::polr
suivie parrms::contrasts
suggéré par Frank Harrell https://stat.ethz.ch/pipermail/r-help/2012-January/300329.htmlNov 2015: d'Accord avec toto_tico que la page d'aide du code de la monnaie package a été modifié dans les années intermédiaires. Le
?independence_test
page d'aide de l'offre à présent un multivariée-KW test et la?oneway_test
page d'aide a remplacer sa précédente mise en œuvre avec le code ci-dessus en utilisant lesindependence_test
fonction.Vous pouvez utiliser PMCMR paquet. Il y est plus d'informations à ce sujet.
Les deux méthodes ci-dessus donnent les mêmes résultats.
Malheureusement, je ne sais pas d'une fonction comme celle-ci. Si il n'y a pas déjà un, ce serait un travail intéressant de construire une fonction qui retourne une matrice avec toutes les paires de traitement des comparaisons. Le contraste est considérée comme significative si l'inégalité suivante est satisfaite
le texte d'alt http://www.statsdirect.com/help/image/stat0199_wmf.gif
où T est le test de Kruskal-Wallis pour k échantillons, S^2 est le dénominateur de la statistique T, N est le nombre total (tous les ni) et Ri est la somme des rangs (à partir de tous les échantillons mis en commun) pour le ième échantillon, et t est un quantile à partir du t de Student de distribution sur N-k degrés de liberté.
Je sais que je n'ai pas beaucoup d'aide 🙂
Je suis également en attente d'une meilleure réponse
J'aurais pensé que vous seriez en mesure de faire ce qui suit:
Mais il semble comme
multcomp
ne prend pas en chargecoin
objets (encore?).