Meta-Analysis

Meta-Analysis Reporting Standards: Writing Requirements for PRISMA Flowcharts and Effect Size Expressions

根据对2023年PubMed收录论文的统计，约12%的已发表荟萃分析存在PRISMA流程图关键信息缺失（如未注明排除原因），另有约8%的研究错误使用了Cohen’s d与Hedges’ g的混用标准（来源：BMJ 2023, *Reporting Quality of Meta-Analyses in High-…

根据对2023年PubMed收录论文的统计，约12%的已发表荟萃分析存在PRISMA流程图关键信息缺失（如未注明排除原因），另有约8%的研究错误使用了Cohen’s d与Hedges’ g的混用标准（来源：BMJ 2023, Reporting Quality of Meta-Analyses in High-Impact Journals）。英国国家健康与临床优化研究所（NICE）2022年在其指南制定手册中明确要求，所有纳入决策的荟萃分析必须附带完整的PRISMA 2020流程图及95%置信区间表达。这些数据表明，PRISMA流程图与效应量表达已成为学术评审中拒稿率最高的两项技术细节。对于正在撰写系统综述的研究生和科研人员，掌握这两项规范的精确写法，直接关系到论文能否通过同行评议。

PRISMA 2020流程图的核心结构要求

PRISMA流程图是荟萃分析透明性的第一道门槛。2020年更新的PRISMA声明（Page et al., 2021, BMJ）将流程图从原来的4阶段扩展为6阶段，新增了“重复记录剔除”和“自动化工具筛选”两个节点。每个阶段必须包含绝对数字而非百分比——例如“通过数据库检索获得n=1,247条记录”，而不是“约1200条”。同时，每个排除步骤后必须注明排除原因及对应文献数量，例如“因非随机对照设计排除n=89篇（参考文献列表见附录A）”。在LaTeX中，推荐使用tikz或prisma2020宏包绘制，确保节点间的箭头逻辑连贯。

阶段1：检索记录与去重

记录检索阶段需注明数据库名称、检索日期及检索式。例如：“PubMed（2023年1月1日检索）：(meta-analysis OR systematic review) AND (diabetes) AND (RCT)”。去重阶段必须区分自动去重（如EndNote内置算法）与手动去重（人工核对标题/摘要）。根据Cochrane手册（2023版），自动去重后仍可能残留3%–5%的重复记录，因此建议两者结合。在流程图中，去重后的记录数应明确标注为“去重后保留n=XX篇”。

阶段2：筛选与全文获取

标题/摘要筛选由至少两名独立评审员完成，一致性系数（Cohen’s kappa）需≥0.80。若kappa值低于0.80，需在流程图中注明“第三评审员介入仲裁”。全文获取阶段需区分“成功获取全文n=XX篇”与“无法获取全文n=XX篇（因权限/撤稿等原因）”。无法获取的文献应记录在补充材料中，并说明是否尝试联系作者。

阶段3：纳入与排除

纳入定性/定量分析的文献数需与后续森林图中的研究数严格一致。排除的每篇全文文献必须列出具体原因，常见类别包括“非RCT设计”“结局指标不匹配”“数据重复发表”等。PRISMA 2020要求至少列出5种排除原因，且每种原因对应的文献数之和等于“全文筛选后排除总数”。

效应量选择与标准化表达

效应量（effect size）是荟萃分析的核心输出，其选择直接决定合并结果的解释。连续变量常用标准化均数差（SMD），包括Cohen’s d、Hedges’ g和Glass’ Δ。Cohen’s d适用于样本量≥20的研究，但存在小样本偏差；Hedges’ g通过校正因子J（J ≈ 1 - 3/(4df-1)）修正此偏差，是主流期刊推荐标准（参照 Nature 2022, Reporting Standards for Meta-Analyses）。二分类变量则使用比值比（OR）或风险比（RR），其中RR更适用于前瞻性研究，OR适用于病例对照研究。

连续变量：Cohen’s d与Hedges’ g的转换

当原始研究仅报告t值或F值时，需通过公式转换为d值：d = 2t/√df。但此方法会低估小样本的效应量。Hedges’ g = d × J，其中J = 1 - 3/(4df-1)。例如，若df=18，J=0.96，则g=0.96×d。在R语言中，使用metafor包的escalc()函数可自动完成转换，并输出95%置信区间。务必在方法部分注明“使用Hedges’ g校正小样本偏差”。

二分类变量：OR与RR的异质性处理

**比值比（OR）**在低事件率（<10%）时近似于RR，但高事件率时两者差异显著。例如，若对照组事件率为40%，干预组为20%，OR=0.38，RR=0.50，差异达24%。异质性（I²统计量）≥50%时，建议使用随机效应模型（DerSimonian-Laird法），并报告τ²值。在PRISMA流程图中，若纳入研究间异质性高，需在“纳入定量分析”节点旁标注“I²=XX%”。

森林图的构建与标注规范

森林图（forest plot）是效应量可视化的标准形式。横轴为效应量尺度（如log OR），纵轴列出各研究及合并结果。每项研究需包含：研究ID、效应量点估计值、95%置信区间、权重百分比。合并菱形（diamond）的宽度代表合并效应的置信区间，其中心点位于点估计值处。在LaTeX中，推荐使用forestplot包（forestplot）或R的forestplot包导出SVG格式。

权重分配与亚组分析

权重通常基于逆方差法，即权重=1/SE²。若使用随机效应模型，需在权重中纳入研究间方差τ²。亚组分析时，应在森林图中用分隔线区分不同亚组，并分别报告亚组内I²和合并效应。例如“按地区分亚组：亚洲I²=30%，欧洲I²=55%”。交互作用检验（Q检验）的p值需在森林图下方标注。

发表偏倚的漏斗图与Egger检验

漏斗图（funnel plot）以效应量为横轴，标准误为纵轴。若漏斗图不对称，需进行Egger回归检验，其p值<0.10视为存在发表偏倚。在PRISMA流程图中，若纳入研究≥10篇，应在“纳入定量分析”节点后添加“发表偏倚评估”子节点。Egger检验的截距项和95%CI需在正文中报告。

异质性来源的探索与报告

异质性（heterogeneity）是荟萃分析中不可回避的问题。I²统计量代表研究间变异占总变异的百分比，I²≥50%时需进行亚组分析或元回归。元回归（meta-regression）可检验连续变量（如平均年龄、随访时间）对效应量的调节作用。在R中，使用metafor包的rma()函数，设置mods=~变量名。结果需报告回归系数β、95%CI及p值。若I²仍高，建议在讨论部分解释可能的临床异质性。

敏感性分析：留一法与影响分析

留一法（leave-one-out）逐一剔除每项研究后重新合并效应量，观察结果是否稳健。若剔除某研究后合并效应量方向改变或置信区间跨越1（OR）或0（SMD），则该研究为影响点。在PRISMA流程图中，可在“纳入定量分析”节点旁标注“敏感性分析结果见附录”。影响分析（influence analysis）使用metafor包的influence()函数，输出Cook距离和DFFITS值。

小样本效应与Trim-and-Fill法

小样本效应（small-study effect）指小规模研究倾向于报告较大效应量。Trim-and-Fill法（Duval & Tweedie, 2000）通过不对称漏斗图估计缺失研究的数量，并校正合并效应量。例如，若原始合并OR=1.25（95%CI: 1.10-1.42），校正后OR=1.18（95%CI: 1.02-1.36），说明发表偏倚可能高估了效应。该方法在R中通过metafor包的trimfill()函数实现。

软件工具与代码示例

R语言的metafor包和meta包是荟萃分析的标准工具。以下是一个基础代码模板，用于计算Hedges’ g并绘制森林图：

library(metafor)
# 数据准备：假设有研究ID、均值、标准差、样本量
dat <- data.frame(
  study = c("Study1", "Study2"),
  m1i = c(5.2, 6.1), sd1i = c(1.3, 1.5), n1i = c(30, 25),
  m2i = c(4.0, 4.8), sd2i = c(1.1, 1.2), n2i = c(30, 25)
)
# 计算Hedges’ g
res <- escalc(measure="SMD", m1i=m1i, sd1i=sd1i, n1i=n1i,
              m2i=m2i, sd2i=sd2i, n2i=n2i, data=dat)
# 随机效应模型
fit <- rma(yi, vi, data=res, method="REML")
# 森林图
forest(fit, slab=dat$study, xlab="Hedges’ g")

RevMan 5.4（Cochrane官方工具）提供图形化界面，适合无编程经验的研究者。但需注意，RevMan内置的效应量计算仅支持Cohen’s d（无Hedges’ g校正），因此建议在R中完成计算后导入RevMan。

常见错误与审稿人拒稿点

审稿人最常指出的问题包括：效应量单位不一致（如部分研究使用SMD，部分使用原始均数差）、置信区间缺失、PRISMA流程图排除原因不完整。根据2024年对JAMA、BMJ、The Lancet三本期刊的拒稿分析（来源：Journal of Clinical Epidemiology 2024, Common Pitfalls in Meta-Analysis Submissions），约34%的拒稿与效应量表达错误直接相关。具体表现为：未注明SMD类型（Cohen’s d vs. Hedges’ g）、混淆OR与RR的适用场景、未报告I²的95%CI。

误区1：忽略小样本校正

当纳入研究的总样本量<200时，Hedges’ g比Cohen’s d偏差更小。例如，若某研究n=15，d=0.80，则g=0.80×0.96=0.77，差异达3.75%。在方法部分应明确写“效应量以Hedges’ g报告，并附95%CI”。

误区2：未处理多重比较

若同一研究中报告多个结局指标（如抑郁量表、焦虑量表），需进行多重比较校正（如Bonferroni法或Benjamini-Hochberg法）。否则，可能因多重检验而夸大效应。在PRISMA流程图中，若纳入研究涉及多个结局，应在“数据提取”节点注明“提取主要结局指标”。

FAQ

Q1：PRISMA流程图必须包含多少条排除原因？

根据PRISMA 2020声明（Page et al., 2021），流程图需至少列出5种排除原因，且每种原因对应的文献数之和必须等于“全文筛选后排除总数”。例如，若全文筛选后排除50篇，则需分解为“非RCT设计15篇”“结局不匹配12篇”“数据重复8篇”“语言限制5篇”“其他10篇”。缺失任何一项都可能导致拒稿。

Q2：Hedges’ g与Cohen’s d何时必须使用？

当纳入研究的单个样本量<30或总样本量<200时，必须使用Hedges’ g进行小样本校正。例如，一项包含10个RCT的荟萃分析，若每个RCT的平均样本量为25，则所有效应量应报告为Hedges’ g，并注明校正因子J。若不校正，合并效应量可能被高估约5%–10%（来源：Psychological Methods 2020, Small Sample Bias in Meta-Analysis）。

Q3：森林图中合并菱形如何解读？

合并菱形（diamond）的中心点代表合并效应量的点估计值，菱形宽度代表95%置信区间。若菱形完全位于无效线（OR=1或SMD=0）的同一侧，则结果有统计学意义。例如，若菱形位于OR=1.2（95%CI: 1.05-1.38），则说明干预组效应显著优于对照组。若菱形跨越无效线，则无统计学差异。

参考资料

Page, M. J., et al. (2021). The PRISMA 2020 statement: an updated guideline for reporting systematic reviews. BMJ, 372, n71.
Borenstein, M., et al. (2021). Introduction to Meta-Analysis (2nd ed.). Wiley.
英国国家健康与临床优化研究所 (NICE). (2022). Guideline Development Manual: Systematic Reviews and Meta-Analyses. NICE.
世界卫生组织 (WHO). (2023). Handbook for Guideline Development (3rd ed.). WHO Press.
UNILINK Research Database. (2024). Meta-Analysis Reporting Compliance Dataset (internal reference).