Comment calculer ces statistiques?
Je suis en train d'écrire une application pour aider à faciliter la recherche, et cela implique d'une part de faire quelques calculs statistiques. Maintenant, les chercheurs à l'aide d'un programme appelé SPSS. Une partie de la sortie qu'ils se soucient de ressemble à ceci:
Ils sont vraiment seulement préoccupés par la F
et Sig.
valeurs. Mon problème est que je n'ai pas de formation en statistique, et je ne peux pas comprendre ce que les tests sont appelés, ou la manière de les calculer.
Je pensais que le F
la valeur pourrait être le résultat de la F-testmais après avoir suivi la procédure donnée sur Wikipédia, j'ai eu un résultat différent de ce que SPSS
donne.
source d'informationauteur Ryan Fox
Vous devez vous connecter pour publier un commentaire.
Ce site internet pourrait vous aider un peu plus. Aussi cette une.
Je suis en train de travailler à partir d'un assez rouillé mémoire d'un cours de statistiques, mais ici, rien ne va:
Lorsque vous êtes en train de faire l'analyse de la variance (ANOVA), vous avez réellement calculer la statistique F comme le ratio de la moyenne des carrés des écarts "entre les groupes" et de la moyenne des carrés des écarts "au sein des groupes". Le second lien ci-dessus semble assez bon pour ce calcul.
Ce qui rend la statistique F de mesurer exactement la puissance de votre modèle, parce que le "entre les groupes de" variance est la puissance explicative, et "dans les groupes de" variance d'erreur aléatoire. Haute F implique un modèle.
Comme dans beaucoup d'opérations statistiques, vous en arrière-déterminer Sig. à l'aide de la statistique F. C'est là que votre Wikipedia l'information arrive légèrement à portée de main. Ce que vous voulez faire est de - en utilisant les degrés de liberté donnée à vous par SPSS - trouver la bonne valeur de P au cours de laquelle un F table vous donnera la statistique F vous avez calculé. La valeur de P où cela se produit [F(table) = F(calculé)] est la signification.
Sur le plan conceptuel, d'une réduction de valeur de signification montre une très forte capacité à rejeter l'hypothèse nulle (ce qui signifie pour déterminer votre modèle a un pouvoir explicatif).
Désolé pour toute les mathématiques gens si rien de tout cela est faux. Je vais vérifier en arrière pour faire des modifications!!!
Bonne chance à vous. Les Stats, c'est amusant, juste peut-être pas cette partie. =)
Je suppose que de votre question que vos collègues de recherche souhaitez automatiser le processus par lequel certaines analyses statistiques sont effectuées (c'est à dire, ils veulent processus de traitement par lots d'ensembles de données). Vous avez deux options:
1) SPSS est maintenant par le biais de scripts python (version 15) - aller à spss.com et de recherche pour python. Vous pouvez écrire des scripts python pour automatiser les analyses de données et extraire les valeurs de clé de tableaux croisés dynamiques, puis de traiter les réponses de toute façon vous le souhaitez. Cela a l'avantage de permettre une comparaison exacte entre les résultats à partir de votre script python et la main-calcul des efforts dans SPSS de vos collaborateurs. Ainsi, vous n'aurez pas vraiment de savoir les statistiques pour faire ce travail (ce qui est un avantage clé)
2) Vous pourriez le faire dans R, un gratuit des statistiques de l'environnement, qui pourrait probablement être scripté. Ceci a l'inconvénient que vous aurez à apprendre les statistiques pour s'assurer que vous le faites correctement.
Statistiques est dur :-). Après une année de lecture et re-lecture de livres et de papiers et ne peut dire avec confiance que j'comprendre les bases.
Vous pourriez souhaiter pour enquêter sur les prêts des bibliothèques pour n'importe quel langage de programmation que vous utilisez, parce qu'ils sont nombreux gotcha en mathématiques en général et des statistiques (notamment les erreurs d'arrondi d'être un exemple évident).
Comme un exemple, vous pouvez prendre un coup d'oeil à le projet Rqui est à la fois un environnement interactif et d'une bibliothèque que vous pouvez utiliser à partir de votre code C++, distribué sous la licence GPL (c'est à dire si vous l'utilisez à l'intérieur, et de ne publier que les résultats, vous n'avez pas besoin d'ouvrir votre code).
En bref: à ne pas faire à la main, lien/l'utilisation de logiciels existants. Et sain_grocen la réponse est incorrecte. 🙁
Ce sont tous les tests de significativité des estimations des paramètres qui sont généralement utilisés dans Multivariée réponse Régressions Multiples. Ce ne serait pas simple les choses à faire à l'extérieur de statistique environnement de programmation. Je dirais soit en obtenant la sortie de la pré-programme de la statistique, ou en utilisant l'un que vous pouvez accéder à et utiliser ce code.
J'ai peur que la première réponse (sain_grocen) vont vous conduire sur le mauvais chemin. Son explication est probablement un cas particulier de ce que vous êtes vraiment affaire avec. L'analyse de variance expliqué dans ses liens, c'est pour une seule variable aléatoire de réponse, dans un design équilibré. Ce ne sont pas les statistiques F vous voyez. Les noms de votre sortie (Pillai Trace, Trace de Hotelling,...) sont quelques-uns des la disposition multivariée versions. Ils ont F distributions sous certaines hypothèses. Je ne peux pas expliquer un texte de livres de dollars de matériel ici, je vous conseille de commencer par regarder
"Appliqué l'Analyse Statistique Multivariée" par Johnson et Wichern
Pouvez-vous expliquer plus en détail pourquoi SPSS lui-même n'est pas une amende solution au problème? Est-ce qu'il génère des tableaux croisés dynamiques en sortie qui sont difficiles à manipuler? Est-ce le coût du programme?
F-statistiques peuvent provenir de n'importe quel nombre d'essais. Le F est une distribution (vaguement: une description de la "fréquences" de groupes de valeurs), comme une Normale (Gaussienne), ou de l'Uniforme. En général, ils surviennent à partir de ratios des variances. Avis: beaucoup de statisticiens (moi y compris), trouver F-basé sur des tests pour être instable (jargon: non-robuste).
La sortie des statistiques (Pillai trace, etc.) suggèrent que l'analyse initiale est une MANOVA exemple, qui, comme d'autres affiches de décrire est compliquée et difficile à obtenir le droit de procédure.
Je suis suppose aussi que, sur la base de la MANOVA, et l'utilisation de SPSS, c'est une psychologie ou de la sociologie de projet... si non, merci de les éclairer. Il se pourrait que d'autres, des modèles plus simples pourrait en fait être plus facile à comprendre et plus reproductible. Consultez votre représentant local de l'université de consultation statistique de groupe, si vous en avez un.
Bonne chance!
Voici une explication de la MANOVA ouptput, à partir d'un très bon site sur les statistiques et sur SPSS:
Sortie de l'explication:
http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm
Comment et pourquoi MANOVA ou multivariée GLM:
(même voie que ci-dessus, mais se terminant par '/manova.htm')
D'un logiciel d'écriture à partir de zéro pour calculer ces résultats seraient à la fois longue et difficile;
il y a beaucoup de problèmes d'arithmétique et de la matrice des inversions de le faire.
Comme Henry dit, l'utilisation de scripts Python, ou R. je vous suggère de travailler avec quelqu'un qui sait SPSS si les scripts.
En outre, SPSS lui-même est capable d'exporter les tableaux de sortie pour les fichiers à l'aide de quelque chose qui s'appelle le SGD.
Un script dans SPSS peuvent le faire.
Savoir qui, dans votre groupe de recherche sait SPSS et de travailler avec eux.