Meta-回归模型的统计诊断方法研究 摘要 Meta-分析是一种对多个独立的研究结果进行统计分析的方法,其对研究结果间差异的来源进行检验,并对具有足够相似性的结果进行定量合成(Porta M.,2008)。Meta-分析能从统计学角度达到增大样本含量,提高检验效能的目的,尤其是当多个研究结果不一致或都没有统计学意义时,采用Meta-分析可得到更加接近真实情况的综合分析结果。实际工作中,在经历了提出问题、检索相关研究文献、制定纳入和排除标准、描述基本信息等一系列的基本步骤之后,如何依据科学有效的统计学理论方法对多个研究结果进行系统定量分析是极其关键的。针对meta-分析中原始数据的特殊性,多年来有不少学者一直致力于构建meta分析统计学理论的体系,如Dersimonian 和Laird,1986;Sidik 和Jonkman,2007; Hoeksema,et al.,2010 等。在评价Meta分析时必须要处理三个问题:纳入研究的质量、个体间的异质性、各种偏倚。对Meta分析的结果需要严谨的科学态度进行解释,探索个体间的异质性的来源是重中之重。Meta分析涉及到多项研究结果效应合并,必须明确只有那些具有同质的研究才能合并,若研究间差异过大,就不能合并在一起。虽然在Meta分析时,通过制定严格同一的纳入和排除标准,只有具有相同研究目的、高质量的研究才能纳入分析,可以在一定程度上确保纳入研究的同质性,但是由于一些潜在的混杂因素的存在,仍能出现一些研究不同质的情况,因此,在对各个独立研究的结果进行合并前应该进行异质性检验,相关研究中已发展了如Q检验、 检验、H检验等统计量检验法以及如森林图、星状图、拉贝图、加尔布雷斯图等图示检验法。 在通过检验识别出异质性后,对异质性进行有效的处理,是保证Meta-分析结果准确度的一个重要环节,通常的做法之一是采用Meta-回归模型(Meta-regression model)进行处理。Meta-回归模型是通过建立回归方程,来反映一个或多个解释变量(explanatory variable)与结果变量(outcome variable)之间的线性关系,以试图明确个体间异质性的来源,从而筛选出导致异质性的重要影响因素(Borenstein M.,2009)。在实际研究中,不可能存在完全相同的研究,或多或少总存在着一些差别,由此构成异质性的来源,若这些因素能够准确测量并能全部解释变异时,采用Meta-回归分析,就能在控制这些变异因素的影响后,估计单纯的合并效应量,同时给出异质性的估计。Meta-回归模型已被广泛应用于如临床实验、生物学、生态学、管理学、经济学等各类不同的科学研究领域。 与其他各种统计模型一样,Meta-回归模型对于数据集中的异常点和强影响点同样敏感,因此需要发展相应的统计诊断方法来识别或检测这些特殊的观测值。对于Meta-回归模型异常点的检测和诊断问题,长期以来已有较多的研究,比如Viechtbauer等(2010),Beath(2014)和 Mavridis 等(2016)等。但在强影响点的诊断领域,相关研究非常稀少,而且暂时还未形成系统性的结论。本文的主要目的是填补Meta-regression模型在强影响点诊断理论方面的空白,研究该模型在数据删除方法和局部影响分析两种框架下的诊断理论。本文的创新之处主要有两个方面:一是在数据删除框架下,本文推导了基于广义Cochran异质性统计量(涵盖常见五类估计方法)、最大似然估计(ML)和限制最大似然估计(REML)等不同估计方法下参数 和 的估计、 的子集删除公式及单个数据点的影响度量。二是在局部影响分析方面,本文探讨了在数据加权扰动、响应变量扰动、方差加权扰动等不同机制下的meta-回归模型的局部影响分析理论,并引入一种方法获得局部影响度量并进行比较。最后通过两个实例分析验证了方法的有效性,并通过模拟研究得出各类估计方法的差异和稳健性等相关结论。 关键词:Meta分析,Meta回归模型,统计诊断,影响点,数据删除,局部影响分析,扰动模式,模拟 |
Meta-回归模型的统计诊断方法研究【硕论】
更新时间:2019-06-12
上一篇:多元函数最值问题研究
下一篇:不变子空间间直和分解