logistique multinomiale les modèles multiniveaux dans la R

Problème: j'ai besoin d'estimer un ensemble de logistique multinomiale les modèles multiniveaux et ne peut pas trouver un package R. Quel est le meilleur package R pour estimer ces modèles? STATA 13 récemment ajouté cette fonctionnalité à leurs niveaux multiples effets mixtes modèles de sorte que la technologie de l'estimation de ces modèles semble être disponible.

Détails: Un certain nombre de questions de recherche nécessitent l'estimation de la régression logistique multinomiale des modèles dans lesquels la variable de résultat est catégorique. Par exemple, les biologistes pourraient être intéressés à étudier le type d'arbres (par exemple, de pins, d'érables, de chênes) sont les plus touchées par les pluies acides. Des chercheurs du marché susceptible d'être intéressé de savoir si il existe une relation entre l'âge des clients et de la fréquence de shopping chez Target, Safeway, ou Walmart. Ces cas ont en commun que la variable de résultat est catégorique (non ordonnée) et de la logistique multinomiale les régressions sont la méthode préférée de l'estimation. Dans mon cas, je fais des recherches sur les différences entre les types de migrations humaines, avec la variable de résultat (mig) code: 0=pas migré, 1=migration interne, 2=la migration internationale. Voici une version simplifiée de mon jeu de données:

migDat=data.frame(hhID=1:21,mig=rep(0:2,times=7),age=ceiling(runif(21,15,90)),stateID=rep(letters[1:3],each=7),pollution=rep(c("high","low","moderate"),each=7),stringsAsFactors=F)

   hhID mig age stateID pollution
1     1   0  47       a      high
2     2   1  53       a      high
3     3   2  17       a      high
4     4   0  73       a      high
5     5   1  24       a      high
6     6   2  80       a      high
7     7   0  18       a      high
8     8   1  33       b       low
9     9   2  90       b       low
10   10   0  49       b       low
11   11   1  42       b       low
12   12   2  44       b       low
13   13   0  82       b       low
14   14   1  70       b       low
15   15   2  71       c  moderate
16   16   0  18       c  moderate
17   17   1  18       c  moderate
18   18   2  39       c  moderate
19   19   0  35       c  moderate
20   20   1  74       c  moderate
21   21   2  86       c  moderate

Mon but est d'estimer l'incidence de l'âge (variable indépendante) sur la cote de (1) la migration interne et non de la migration, (2) la migration à l'échelle internationale et non de la migration, (3) la migration interne contre la migration internationale. Une complication supplémentaire est que mes données opérer à différents niveaux d'agrégation (par exemple, la pollution de l'opère au niveau de l'état) et je suis également intéressé à la prédiction de l'impact de la pollution de l'air (pollution) sur les chances de s'embarquer sur un type particulier de mouvement.

Maladroit solutions: On peut estimer un ensemble de séparer les modèles de régression logistique par la réduction de l'ensemble de données pour chaque modèle à deux types de migration (par exemple, le Modèle 1: seuls les cas codés mig=0 et mig=1; Modèle 2: seuls les cas codés mig=0 et mig=2; Modèle 3: seuls les cas codés mig=1 et mig=2). Ce simple modèle de régression logistique multiniveau pourrait être estimée lme4 mais cette approche n'est pas idéale, car elle ne tient pas dûment compte de l'impact de la omise cas. Une deuxième solution serait d'exécuter logistique multinomiale les modèles multiniveaux dans MLWiN par R à l'aide de la R2MLwiN paquet. Mais depuis MLWiN n'est pas open source et les objets générés difficile à utiliser, je préfère éviter cette option. Après une vaste recherche sur internet, il semble y avoir une certaine demande pour de tels modèles, mais je ne suis pas au courant d'une bonne R de package. Donc, ce serait formidable si certains experts qui ont réalisé de tels modèles pourraient fournir une recommandation et, s'il y a plus d'un paquet peut indiquer quelques avantages/inconvénients. Je suis sûr que ces informations seraient très utiles pour plusieurs R utilisateurs. Merci!!

Meilleur,
Raphaël

  • deux suggestions: (1) examiner les MCMCglmm paquet; (2) votre "maladroit méthode" est en fait la méthode standard (voir, par exemple, Dobson et Barnett Introduction aux Modèles Linéaires Généralisés, 3d ed.); un paramètre d'un modèle multinomial de la série du binôme de contraste (niveau 1 ou de niveau 2, niveau 1 ou de niveau 3) et fit une série de modèles. C'est en fait un modèle complet car tous les deux-catégorie sous-ensemble d'un modèle multinomial est conditionnellement binomiale (c'est à dire si vous savez que c'est A ou B, alors A est un binôme de l'échantillon à partir de (A+B)); tous ensemble complet de paires est valable de paramétrage.
  • Dans ton cas, puisque les catégories sont un peu commandé je serais probablement paramétrer comme (pas de migration et la migration interne ou internationale), (internes et migrations internationales); cela vous met en place pour une comparaison avec un modèle ordinal (voir la ordinal package).
  • Merci beaucoup, Ben Bolker! Les deux suggestions sont en effet très utiles et je vais les explorer davantage.
InformationsquelleAutor Raphael | 2014-01-13