您的位置:

广义线性混合模型

一、简介

广义线性混合模型是一种统计模型,在许多实际问题中都有广泛的应用。该模型的主要特点是可以同时处理连续型变量、二元型变量、计数型变量以及其他类型的变量。同时,广义线性混合模型还考虑了来自不同来源的数据之间的相关性,可以用于分析重复测量、观察数据、长期追踪数据等问题。本文将从多个方面对广义线性混合模型进行详细的阐述。

二、数据类型和模型形式

广义线性混合模型可以处理许多不同类型的数据,包括二进制、计数和连续型数据,以及一些其他特殊类型的数据。模型形式包括人口平均模型、条件模型和随机效应模型等。

1. 二进制数据

二进制数据是指只有两种取值的数据,例如,喜欢或不喜欢、成功或失败等。在广义线性混合模型中,二进制数据的响应变量一般服从伯努利分布或二项分布。这些模型通常包括一个线性预测子,在这个预测子中,自变量的系数可以被认为是“对数几率”的函数。


library(lme4)
fit <- glmer(response ~ predictor + (1|group), family = binomial(link = "logit"), data = mydata)

2. 计数数据

计数数据是指只能够取非负整数的数据,例如计数型数据、记分型数据等。在广义线性混合模型中,计数数据的响应变量可以服从泊松分布或负二项分布。这些模型通常包括一个线性预测子,在这个预测子中,自变量的系数可以被认为是“期望计数”的函数。


fit <- glmer(count ~ predictor + (1|group), family = poisson(link = "log"), data = mydata)

3. 连续型数据

连续型数据是指能够取任意实数值的数据,例如身高、体重等。在广义线性混合模型中,连续型数据的响应变量可以服从正态分布、指数族分布、伽马分布等。这些模型通常包括一个线性预测子,在这个预测子中,自变量的系数是作为响应变量的期望值。


library(lme4)
fit <- lmer(y ~ x1 + x2 + (1|subject) + (1|item), data = mydata)

三、模型解释和评估

广义线性混合模型可以用来解释变异性和协方差结构,当评估这些模型时,需要考虑多种因素。其中最常使用的方法是统计量估计和假设检验,选择合适的拟合信息准则也是一个重要的问题。

1. 统计量估计和假设检验

估计和检验参数是对广义线性混合模型进行评估的基本方法。广义线性混合模型使用最大似然估计的方法进行参数估计,随机效应的方差和协方差结构则使用另外的方法进行估计。进行统计检验可以得到显著性水平和置信区间,从而可以对模型系数的显著程度进行评估。


summary(fit)
anova(fit)

2. 拟合信息准则

选择合适的拟合信息准则对于广义线性混合模型的评估也非常重要。最常见的准则是AIC和BIC,这些准则考虑了模型的拟合程度以及模型中的自由度。


AIC(fit)
BIC(fit)

四、模型应用举例

下面是一个广义线性混合模型的实际应用案例:

1. 研究设计

一个假想的研究涉及到两个固定因素,分别为眼睛的位置和屏幕亮度,以及一个随机因素,为被试的Id。研究目的是研究阅读速度的变化。

2. 数据收集和处理

从20个被试中,每个被试读取同样的10段文本,每个文本分别使用了不同的眼睛位置和屏幕亮度。收集数据后,需要将数据进行转换,变成二进制数据或者计数数据。

3. 分析模型

进行广义线性混合模型的分析,可以使用下面的代码:


library(lme4)
fit <- glmer(response ~ position * brightness + (1|subject), family = binomial(link = "logit"), data = mydata)
summary(fit)
plot(fit)

4. 结果解释

通过模型估计得到的数据,可以从多个角度进行解释。变量系数、偏差、置信区间、显著性水平等都是需要解释的数据。其中最为重要的是变量系数和相关的置信区间,这对于研究结果的解释具有非常大的意义。