Modèle mixte linéaire

Si cela semble déroutant, ne pas s`inquiéter-lme4 poignées partiellement et complètement croisé des facteurs bien. Ils n`ont pas à être hiérarchiques ou «multiniveau» par la conception. Toutefois, la même spécification de modèle peut être utilisée pour représenter les facteurs (partiellement) croisés ou imbriqués de sorte que vous ne pouvez pas utiliser les spécifications du modèle pour vous dire ce qui se passe avec les facteurs aléatoires: vous devez examiner la structure des facteurs dans les données. Pour simplifier les choses, coder correctement vos données et éviter l`imbrication implicite. Vous ne savez pas quelle imbrication implicite est? Lisez la suite. Les GLMMs fournissent un large éventail de modèles pour l`analyse des données groupées, puisque les différences entre les groupes peuvent être modélisées comme un effet aléatoire. Ces modèles sont utiles dans l`analyse de nombreux types de données, y compris les données longitudinales. [4] mais nous pouvons aller de l`avant et adapter un nouveau modèle, celui qui prend en compte à la fois les différences entre les chaînes de montagnes, ainsi que les différences entre les sites dans ces chaînes de montagnes en utilisant notre variable échantillon. S`il vous plaît être très, très prudent quand il s`agit de la sélection du modèle. Concentrez-vous sur votre question, ne branchez pas simplement et déposez les variables d`un modèle au hasard jusqu`à ce que vous faites quelque chose “significatif”. Toujours choisir des variables basées sur la biologie/écologie: je pourrais utiliser la sélection de modèle pour vérifier un couple de paramètres non-focale, mais je garde le “noyau” du modèle intact dans la plupart des cas. Définissez vos objectifs et vos questions et concentrez-vous là-dessus. Aussi, ne pas simplement mettre toutes les variables possibles dans (c.-à-d.

ne pas surajuster). Rappelez-vous qu`en règle générale, vous avez besoin de 10 fois plus de données que les paramètres que vous essayez d`estimer. Bien! Toujours avec moi? Nous avons une variable de réponse, le score de test et nous essayons d`expliquer une partie de la variation de la note de test par la longueur du corps de raccord comme un effet fixe. Mais la variable de réponse a une certaine variation résiduelle (c.-à-d. variation inexpliquée) associée aux chaînes de montagnes. En utilisant des effets aléatoires, nous modélisons cette variation inexpliquée par la variance. Maintenant, il est évident que nous avons 24 échantillons (8 chaînes de montagnes x 3 sites) et pas seulement 3: notre échantillon est un facteur de 24 niveaux et nous devrions utiliser que, au lieu d`utiliser le site dans nos modèles: chaque site appartient à une chaîne de montagnes spécifiques. Une façon d`analyser ces données serait d`adapter un modèle linéaire à toutes nos données, en ignorant les sites et les chaînes de montagnes pour l`instant. Quand il s`agit de tels effets aléatoires, vous pouvez utiliser la sélection de modèle pour vous aider à décider ce qu`il faut garder. Suivant les conseils de zuur, nous utilisons des estimateurs REML pour la comparaison des modèles avec des effets aléatoires différents (nous gardons des effets fixes constants).

(Zuur: “deux modèles avec des structures aléatoires imbriquées ne peuvent pas être faits avec le ML parce que les estimateurs pour les termes d`écart sont biaisés.”) NOTE 3: il n`y a pas vraiment un moyen convenu de traiter de la variance des effets aléatoires dans les modèles mixtes quand il s`agit d`évaluer l`importance. Les valeurs de p et les tailles d`effet ont des problèmes, bien que d`après ce que je rassemble, les valeurs p semblent causer plus de désaccord que les tailles d`effet, du moins dans la communauté R. Si vous êtes familier avec les modèles linéaires, conscients de leurs lacunes et heureux avec leur raccord, alors vous devriez être en mesure de passer très rapidement à travers les cinq premières des sections ci-dessous. Je suis cependant les inclure dans l`intérêt de l`exhaustivité et dans une tentative de répondre à un public plus large.