BMJ杂志能发表“病例对照研究”吗?作者一张图征服审稿专家

 2024-02-20 05:01:52  阅读 0

标题可能有点抢头条,但现实是相似的:与随机对照研究和队列研究相比,“病例对照研究”的文章很难在顶级医学期刊上发表。

病例对照研究是医学研究推断疾病原因的重要方法。 在医学研究中,它将研究对象分为病例组/对照组(更广泛地说,阳性组/阴性组),比较发病前/阳性事件前对某些暴露因素的暴露情况,比较暴露水平的差异,初步确定分析暴露因素与积极事件之间的因果关系。

例如,历史上最著名的病例对照研究之一是英国著名流行病学家希尔爵士在20世纪40年代发起的吸烟与肺癌的研究。 他通过比较肺癌患者和非肺癌患者既往吸烟状况,发现肺癌患者吸烟的比例远高于正常人群,从而证明了吸烟(暴露因素)与吸烟(暴露因素)之间的因果关系。肺癌(阳性事件)。

lasso回归筛选变量为0_回归中的变量筛选方法_筛选变量回归方法中的数据

然而,病例对照研究存在诸多缺陷,导致此类研究的因果推断结论不太可靠。

主要存在三个问题:(1)病例对照研究存在回忆偏倚; (2)病例对照研究中暴露因素和结果的时间顺序可能不明确,可能出现因果颠倒(先有结果,后有原因)。 ); (3)暴露因素与结果之间的关系可能存在干扰因素。 很多人直接将干扰因素识别为混杂因素,并通过回归分析来控制。 但事实上,许多干扰因素可能是中介变量,但在病例对照研究中很难区分中介变量和混杂因素。

今天我要讲的是12月初发表在BMJ杂志上的一篇论文。 它用一张图片成功地阐明了暴露因素与结果、暴露因素与干扰因素之间的关系。 当然最终还是获得了审稿人的认可!

好吧,我们进入正题吧。

论文概述及统计方法

2020年12月2日,四大顶级医学期刊之一的BMJ(IF=30.223)发表了一项病例对照研究:“出生缺陷患者的癌症风险:一项基于北欧儿童、青少年、和成人”。 本研究旨在研究“癌症-出生缺陷”这两个变量之间的关系。

回归中的变量筛选方法_筛选变量回归方法中的数据_lasso回归筛选变量为0

为了探讨出生缺陷与癌症之间的联系,该研究从四个北欧国家的总共 62,295 例癌症病例和对照中收集了出生缺陷和癌症诊断的信息,针对儿童、青少年和成人(0-46 岁)。 评估出生缺陷与癌症类型之间的关系,癌症风险是否随着出生缺陷的数量而变化,以及这些关联是否持续到成年。

点评:这篇文章能够发表的关键原因之一就是样本量大。

统计分析方法

对于病例对照研究,回归是最佳选择,同时计算OR值; 由于癌症的发病率很低,这里的OR值几乎等于RR值。

筛选变量回归方法中的数据_lasso回归筛选变量为0_回归中的变量筛选方法

论文分析结果

(一)癌症患者出生缺陷的发生

本研究收集了北欧四个国家(丹麦、芬兰、挪威和瑞典)1967年至2014年所有活产婴儿的信息(出生状况、出生缺陷信息等),以及1943年以来癌症患者的信息(表1)。 总研究人群为62,295名癌症患者(其中2160名患有严重出生缺陷,占3.5%)和对照样本(其中15,826名患有严重出生缺陷,占2.2%)。

摘要:癌症患者中,出生缺陷的比例为3.5%; 对照组的出生缺陷比例为2.2%,差异显着。

(2)出生缺陷患者的总体癌症风险

与没有严重出生缺陷的人相比,有严重出生缺陷的人患整体癌症的风险更高(OR=1.74)。

在严重出生缺陷人群中,染色体异常患者患癌症的风险最高(OR=5.53),遗传综合征/微缺失综合征患者(OR=5.44),非染色体异常出生缺陷患者患癌症的风险也较高癌症。 (或=1.54)。 此外,有眼睛、消化系统、泌尿器官、心脏、生殖器和四肢先天缺陷的人患癌症的风险增加。

回归中的变量筛选方法_筛选变量回归方法中的数据_lasso回归筛选变量为0

(3)出生缺陷患者患特定癌症的风险

◆与无严重出生缺陷的人相比,非染色体异常出生缺陷的人更容易患泌尿器官癌(主要是肾癌,OR=2.7)、周围神经和自主神经系统癌症(OR=2.4)、中枢神经系统癌症(OR=2.4)。神经系统癌症(OR=2.3)的相对风险最高。

◆ 染色体异常者患淋巴组织癌和造血组织癌的风险增加,其中急性粒细胞白血病的风险最高(OR=88)。

那张图来了

那么,为什么人们想要这张照片呢?

事实上,很多人用回归来进行病例对照研究,通常是多因素回归,最常见的方法是“先单因素,后多因素”——先单因素回归,P值

在回归分析中,除了缺失缺陷之外,其他自变量也可能是干扰因素,我们一般认为是混杂因素。 现在使用回归来控制混杂因素,结果似乎相对可靠。

正确的? 这可能是你一直以来都在做的事情!

lasso回归筛选变量为0_筛选变量回归方法中的数据_回归中的变量筛选方法

来吧~~~来笑一笑

事实上,人们常常忽略了一个重要的概念——中介变量,并错误地将其视为回归中的混杂因素,并将其纳入回归分析中。

这里我想告诉大家,在做回归分析的时候,一定要记住一句话:在回归分析中,模型中必须包含混杂变量,但模型中一般不应该包含中间变量。

在本病例对照研究中,干扰因素包括干扰因素和混杂因素。 例如:混杂因素包括母亲的年龄、是否吸烟、是否进行过体外受精; 中介变量包括出生体重、早产等。

因此,作者也表示:我们在回归分析中不包括中介变量。

筛选变量回归方法中的数据_回归中的变量筛选方法_lasso回归筛选变量为0

那么问题就变成了,如何将混杂变量筛选到模型中?

于是作者就创作了一张大家都想看的图! DAG图(有向无环图)!

lasso回归筛选变量为0_回归中的变量筛选方法_筛选变量回归方法中的数据

图片在这里!

回归中的变量筛选方法_lasso回归筛选变量为0_筛选变量回归方法中的数据

这是中间变量!

该图说明了作者思考因果推理的方式,并向审稿人解释了作者如何筛选混杂变量。

这个数字很重要,特别是对于病例对照研究来说,这种设计充满了中介变量和混杂变量。

关于DAG图(有向无环图),我在之前的文章中已经阐述过它的重要性。 如果您有兴趣,可以点击学习。

你认得吗? --有向无环图(DAG):回归分析中自变量选择的指导思想

大家,这里我想说的是:在进行病因推断研究时,无论是队列研究还是病例对照研究,首先要有一个因果假设模型。 任何直接回归的方法都是不可靠的研究。

尤其要注意观察性研究中中介变量的干扰!

如本站内容信息有侵犯到您的权益请联系我们删除,谢谢!!


Copyright © 2020 All Rights Reserved 京ICP5741267-1号 统计代码