产后抑郁症(PPD)是女性产后最常见的情绪障碍。 它会给母亲、伴侣和婴儿带来多种心理健康问题,并对家庭和社会产生深远的影响。 PPD的发生通常涉及生物学、心理和社会环境等多维度危险因素[1,2,3,4]。 临床预测模型[5]是指应用多因素回归建立统计模型,用于评估具有某些特征表型的特定群体,预测(诊断)某种疾病的存在或预测(诊断)某种结果的概率疾病未来发生的事件。 模型建立后,可以通过评估偏倚风险来评估和验证预测模型的准确性和适用性[6]。 近年来,临床预测模型在医学领域得到了广泛的应用。 根据患者当前的健康状况,医护人员可以量化患者未来患某种疾病的风险,并为患者提供个性化的医疗建议,这有助于降低医疗成本,甚至影响患者的健康状况。 诊断和结果[7]。
女性从怀孕到分娩的时间跨度较长,是一个通常伴随着心理困扰和较大心理应激反应的特殊时期[8]。 负性心理应激反应与产后抑郁症密切相关,因此产前临床应用预测模型预测产后抑郁症风险,可以为产后抑郁症的早期识别和干预提供时间和空间,有助于促进临床医疗决策,减少产后抑郁症的发生。不良后果。 本文旨在对不同类型的PPD预测模型进行分类和比较,为PPD研究提供更广阔的视角,为产前预防和干预工作提供科学依据。
1文献检索策略
本研究检索了中国学术期刊全文(CNKI)数据库。 使用医学主题词(MeSH)、标题和摘要中的单词以及关键词的组合,“post-natal/post-//”和“risk/model/model”被用作英文检索词,“”被用作英文检索词。抑郁/产后 “抑郁”、“风险预测/预测模型”为中文检索词,采用主题词和关键词组合进行检索,并手动检索收录文献的参考文献。英文检索公式:post-产后OR或AND风险OR模型OR模型;中文检索式:“产后抑郁症”OR“产后抑郁症”AND“风险预测”OR“预测模型”。纳入标准:(1)研究对象为年龄≥18岁;(2)研究内容为产后抑郁症风险预测模型,有完整的模型建立、验证和评估过程;(3)研究类型包括前瞻性队列研究、回顾性队列研究、病例对照研究研究和横断面研究。 排除标准:(1)仅研究产后抑郁症的预测因子和影响因素,未构建预测模型; (二)综述、系统评价、荟萃分析、理论研究等类型的研究; (3)重复发表,质量差,缺乏可用原始数据的研究; (4) 模型包含少于 2 个预测变量。
2PPD 概述
PPD的概念最早由PITT[9]于1968年提出,PPD被归类为产后非典型抑郁症状。 美国精神病学协会出版的《精神疾病诊断与统计手册》第四版(DSM-4)将产后抑郁症定义为既往无精神疾病史的女性在产后 4 周内出现明显的抑郁症状或并发症。 有典型的抑郁发作持续至少两周,导致母亲严重的功能障碍,通常需要专业治疗[10]。 DSM-5 中增加了围产期抑郁症的概念,定义为妊娠期间或产后 4 周内发生的抑郁症状[11],使得 PPD 的概念和诊断更加科学和现实。
一项覆盖全球 56 个国家 296,284 名女性的系统评价显示,17.7% 的女性患有产后抑郁症 [12]。 由于新型冠状病毒肺炎(COVID-19)在全球大流行,超过四分之一的孕妇在COVID-19流行期间出现了比以前更多的临床抑郁症状,围产期抑郁症患病率高达25.6%[ 13]。 由于财力不足、卫生系统薄弱等多种因素,发展中国家PPD患病率高于发达国家[14]。 近年来,中国大陆女性围产期抑郁症综合患病率为16.3%,其中产前抑郁症(PND)患病率为19.7%,PPD患病率为14.8%[15],呈逐年上升趋势。逐年趋势。 [16]。
作为世界上人口最多的国家,为积极应对人口老龄化,进一步优化生育政策,我国实施了“二孩”、“三孩”政策。 这有利于改善人口结构,但也意味着产后女性可能承担更多育儿任务,面临更大的家庭和工作压力,存在心理健康风险。 同时,由于缺乏本土化的产后抑郁症诊断标准和指导孕期心理健康的指南,心理咨询服务的可及性仍然有限[17],因此产后抑郁症的发病率逐年上升。 PPD的早期预测并为孕妇提供有效的预防和治疗服务尤为重要,这对于制定具有当地文化背景的医疗制度和卫生保健政策并提供重要的循证信息。
3PPD预测模型的分类
PPD的发生涉及生物、心理和社会多维度因素的共同作用。 随着医疗模式的变革和个性化医疗的进一步推进,面对孕妇的海量诊疗信息和不同的临床症状体征,必须选择密切相关的风险。 将因素纳入预测模型并选择最合适的模型构建方法对于准确个体化预测PPD尤为关键。 一般采用回归分析等传统逻辑回归方法构建PPD参数预测模型,预测内容包括PPD的诊断和预后[18]。 随着大数据挖掘和分析的发展,应用非参数模型,即非参数机器学习算法来构建预测模型越来越流行。 机器学习算法一般包括决策树、支持向量机(SVM)和K近邻算法(K-NN)[19]。 应用机器学习算法构建PPD预测模型,为PPD的早期预测提供了新的途径。
3.1 PPD参数化模型
目前,大多数PPD参数预测研究都将PPD的发生作为二元结果变量,然后利用回归分析方法探索PPD的危险因素,根据危险因素预测PPD发生的概率,并分析关联强度预测因素与 PPD 之间通过 OR 值进行比较。
参数模型可以根据PPD相关变量的偏回归系数构建风险评分公式。 根据该公式,可以计算出产后抑郁症的风险,以便及早识别有产后抑郁症倾向的母亲。 [20]根据伊朗农村卫生中心6627名母亲收集的横截面自我报告问卷数据,使用参数回归模型分析了问卷中的变量。 结果显示,抑郁史、受教育程度、意外怀孕是影响产后抑郁症的因素。 主要危险因素。 基于这些风险因素构建的风险评分公式形式简单、易于理解,易于医护人员使用。 可见,应用参数模型预测PPD具有良好的可解释性,为医护人员评估PPD是否发生提供了证据支持。
参数模型还可以通过计算风险因素与PPD之间的相关强度来预测对PPD的影响程度。 [21] 回顾性分析2020年日本爱知县2013年7月至2015年6月妊娠第11周内、产后14天内、产后1个月内1050例妇幼保健服务案例,并收集数据分娩后3个月进行回归分析。 暴露因素与 PPD 之间的关联由 OR 值和 95% 置信区间确定。 结果显示,PPD的产前预测因素包括产前精神疾病[OR= 4.84, 95%CI (2.09, 11.19)]、缺乏社会支持[OR=4.93, 95%CI (1.54, 15.74)]、年龄OR=2.43 , 95% CI (1.37, 4.30)]。 通过分析危险因素与产后抑郁症的相关性强弱,可以及时筛选出产后抑郁症高危人群,为针对性的预防和干预奠定基础。
值得注意的是,在构建参数预测模型时,还必须考虑模型的使用条件以及变量之间的相关性,以避免过度拟合[22]。 Ç[23]采用前瞻性队列研究设计,收集研究对象孕晚期和产后6~8周的一般人口学信息和妊娠心理社会健康评估量表(PPHAS)评分,并构建两个时间点的回归模型; 结果 研究表明,在怀孕期间遭受丈夫或其他家庭成员暴力、有婚姻问题、经历产前抑郁、焦虑和高感知压力的母亲患产后抑郁症的风险较高,可作为产后抑郁症的预测因子。其中在怀孕期间遭受丈夫或其他家庭成员暴力的妇女 遭受家庭成员暴力的妇女产后抑郁症发生率高于未受暴力影响的妇女[OR=0.056, 95%CI= (0.014, 0.236)]。但由于研究中使用的PPHAS量表总分与其他变量的相关性较高[r≥0.800,P3.2PPD的非参数模型
近年来,非参数机器学习算法已成为医学预测领域的流行方法。 临床医学研究数据具有体量大、混乱、随机性等特点。 使用传统的统计方法来预测疾病的发生往往具有一定的局限性。 非参数机器学习算法可以根据数据的类型完全或半自动地在数据中搜索数据。 瞄准内容,挖掘有用知识,反复总结规律,帮助研究人员做出决策或预测。 这种通过大数据挖掘进行疾病预测的方法满足了循证医学和精准医学的要求。 目前使用非参数机器学习算法建立PPD预测模型的方法包括基于决策树的算法、基于朴素贝叶斯的算法、基于支持向量机的算法和基于人工神经网络的算法。
3.2.1 基于决策树的算法
决策树[25]是一种简单但广泛使用的分类器,因其树结构类似于流程图并且可以模仿人类决策的过程而得名。 可以构建决策树来对新数据进行分类。 随机森林(RF)[26]是一种专门为决策树分类器设计的集成学习方法。 它包含多个决策树。 每棵“树”具有相同的分布,其预测结果结合了多个决策树的分类。 因此,最终结果将更加可靠[27]。 同时,RF还可以更好地处理数据的默认值问题,具有更高的分类精度[28],因此RF算法更受到研究者的青睐。 肖美丽等. [29]利用RF算法对406名孕妇根据是否患有产后抑郁症进行决策分类。 他们从人口统计信息、生物心理社会等多个维度整合影响因素,按照变量重要性得分进行排序,并列出排名。 在前10个重要预测变量中,模型的预测准确率为80.10%。
除了RF算法之外,梯度提升树(tree,GBDT)算法也是一种基于决策树的集成学习方法。 该算法也是由多棵决策树组成,但最终的结果是所有决策树的预测结论的累加,因此通过 GBDT 算法构建的模型更加复杂。 为了控制模型的复杂度,CHEN等人。 [30]以GBDT为框架,在目标函数中加入正则化项,建立了极限梯度()算法。 [31]基于以色列最大医疗机构的电子健康记录数据库,利用算法构建预测模型,评估产后1年内产后抑郁症的风险。 结果显示,ROC曲线下面积(AUC)为0.712[95% CI(0.690),0.733)],表明该模型具有中等水平的预测性能。 应用算法可以自动解释自变量之间的相互作用,同时通过处理每个决策树分支的缺失数据来评估不同子集上的模型性能。 通过算法构建PPD预测模型,分析PPD预测因素的重要性,并对其进行排序,可以将孕妇按照不同的危险人群进行分层,有助于PPD的早期发现和干预。
3.2.2 基于朴素贝叶斯的算法
朴素贝叶斯[32]起源于经典数学理论。 它是一种稳定、结构简单且非常高效的分类算法。 其原理基于条件独立假设,即所有预测变量相互独立。 当面对高维、有多个分类数据集时,朴素贝叶斯可以快速对数据集进行分类。 JIMÉNEZ 等人。 [33]以西班牙7家综合医院的1397名孕妇的产前数据为数据集,选取11个变量建立模型,并用其预测产后第一周是否发生PPD。 结果在Naive 训练集上斯里兰卡模型在敏感性、特异性和准确性之间取得了很好的平衡,AUC为0.75,表现出最好的预测性能。 朴素贝叶斯算法简单,可以处理多个分类任务,执行速度快,并且易于解释。 然而,当变量分布不平衡时,朴素贝叶斯算法的分类效果较差。 因此,在使用朴素贝叶斯算法之前需要考虑变量分布。 平衡避免预测结果不佳的问题[34]。
3.2.3 基于SVM的算法
SVM具有强大的学习功能[35],是机器学习中最常用的线性和非线性分类方法。 其基本原理是利用合适的核函数寻找一个超平面来分隔数据类别,使得训练集中的点与超平面之间存在最大可能的距离,从而达到数据分类的目的。 张等人。 [36]通过收集508名孕妇孕期信息,采用专家对应法和过滤法两种特征选择方法,开发了基于SVM的PPD预测模型; 结果显示,预测模型筛选出最重要的3个首要预测因素,分别是心理适应能力、妊娠晚期抑郁症和月收入水平。 两种特征选择方法的模型预测性能有效性没有显着差异,但采用过滤方法进行特征选择的SVM模型具有更好的预测结果(灵敏度=0.69,特异性=0.83,AUC=0.78)。 除了特征选择方法之外,样本量的大小也会影响PPD预测模型的性能。 由于SVM是一种基于结构风险最小化准则的算法,当样本量较小时,SVM算法可以避免过拟合。 此外,利用SVM算法构建预测模型具有更好的泛化能力[37]。
3.2.4 基于人工神经网络
人工神经网络(ANN)是从信息处理角度理解和抽象人脑的神经元网络[38]。 它可以建立简单的模型,根据不同的连接方式形成不同的网络。 多层感知器(MLP)是一种前馈人工神经网络模型[39],它在单层神经网络的基础上引入一个或多个隐藏层,并采用标准反向传播算法(BP)[40]训练多层神经网络感知器,使多层神经元协同工作并从数据集中学习。 [41]提出了一种通过社交媒体平台上用户的文本信息来预测PPD的新方法,利用“ and Word Count(LIWC)软件提取社交媒体上生成的语言特征,利用MLP算法对一般性讨论、PPD和结果表明,MLP预测模型的准确率为80.36%,精确度为75.11%,MLP可以根据输入特征集推导出高级特征,并得到了发现该算法更适合从海量复杂数据中过滤出有价值的信息[39]。
4 PPD预测模型比较 4.1 基于机器学习算法的PPD预测模型比较
申等人。 [42]选取美国疾病预防控制中心PRAMS 2012年至2013年的28,755名孕产妇妊娠数据,使用9种不同的机器学习算法构建PPD预测模型,包括RF、随机梯度提升(模型,GBM)、SVM ,递归分区和回归树(RPART),朴素贝叶斯,k-NN,自适应算法(,算法),回归和ANN,并使用10折交叉验证进行评估; 结果显示:9各预测模型的AUC均大于0.5,表现出良好的预测效果。 其中,RF算法的AUC较高,为0.884(敏感性=0.732,特异性=0.865),其次是SVM,AUC为0.864(敏感性=0.791,特异性=0.865)。 0.788)。 [43]根据瑞典人口队列研究中4277名女性的数据(包括人口统计数据、临床和心理测量数据),通过机器学习算法建立了PPD预测模型。 模型包括:岭回归、Lasso回归、GBM、分布式RF、极端随机树(XRT)、朴素贝叶斯和堆叠组合模型( ),并评估了不同机器学习算法预测模型的性能。 所选机器学习算法的分类性能在准确性、阴性预测值和 AUC 方面没有显着差异。 然而,敏感性、特异性和阳性预测值存在显着差异。 XRT 提供高精度、平衡的敏感性和特异性预测性能(准确度:73%,敏感性:72%,特异性:75%,阳性预测值:33%,阴性预测值:94%,AUC:81%)。 XRT筛选出的相对贡献度高于0.9的主要影响因素是孕期抑郁和焦虑。 选择使用不同的机器学习算法来构建预测模型是一个复杂的过程。 应使用统计软件并使用性能指标来判断预测模型的预测准确性。 同时,还需要根据医学专业知识和临床实际情况进行判断,并考虑模型实施的多个方面。 因素。
4.2 PPD参数与非参数预测模型比较
应用参数和非参数机器学习算法构建PPD预测模型,可以有效预测产妇产后PDD风险,且大多数预测模型准确率较高,有利于医护人员及时做出医疗决策。 传统的参数模型包括线性回归和逻辑回归,它们可以通过描述结果指标与一个或多个解释变量之间的关系来分析预测结果[44]。 参数化模型形式简单、易于理解、具有良好的可解释性。 通过预测因素的权重可以看出不同预测因素对PPD的影响。 PPD参数预测模型以概率的形式输出结果,可以对不同类型孕妇的风险进行分层,辅助有针对性的决策。 因此更适合医务人员的临床应用,但参数模型的使用需要考虑数据的特点。 分布和共线性问题。
由于从怀孕到产后的时间跨度较长、影响PPD的因素众多、数据结构复杂,利用传统的参数化建模方法来预测PPD的发生可能存在很大的局限性。 这时,面对复杂的变量,非参数预测模型就更有优势了。 有许多非参数机器学习算法。 基于决策树的算法是一种分类精度较高、表达相对简单的算法[45]。 它可以以图形方式显示,增加了临床适用性,但它不能给出明确的公式,而且由于它对数据的变化非常敏感,因此稳定性比参数模型差。 另一种广泛使用的非参数分类模型是朴素贝叶斯模型。 其算法比较简单,执行速度较快,但需要计算先验概率。 如果变量之间存在相关性,则其预测效果较差。 如果数据存在非线性问题,可以使用SVM算法。 当数据量较大时,算法相对复杂,训练时间较长。 因此,SVM更适合为小样本数据提供高效计算,避免过度拟合,从而产生更准确的结果。 良好的预测结果[46]。 与回归和决策树等算法相比,ANN 是一种复杂的非参数算法,通常需要大量参数。 它是多种多样的并且难以解释。 很难得出医学结论来支持临床决策。 然而,ANN 适合大样本的临床数据。 积分功能优势强,诊断和分类的准确性高,并且具有高速计算能力,可以快速找到复杂问题的最优解。 此外,ANN还可以通过影像数据筛选出具有诊断和鉴别意义的特征,因此未来的研究可以通过ANN结合影像特征来预测PPD。
PPD预测模型的建立,关键是数据处理、特征分析、模型选择和算法应用。 由于研究方法和评价标准不同,不同机器学习算法预测模型的预测效果也不同。 因此,评估每个模型的效果并选择最佳的预测模型至关重要。 未来的研究应基于研究队列对最终模型进行外部验证,并分析模型的临床有效性。 值得注意的是,大多数应用机器学习算法预测 PPD 的研究都包含涉及社会人口学和心理社会因素的预测因子,但很少有研究结合生物遗传因素进行预测。 因此,构建一个结合 PPD 生物、心理、社会三个维度因素的模型至关重要。 还应该指出的是,使用大数据集可以减少估计方差,从而提供更好的预测性能,而应用具有少量预测因素的预测模型而不改变预测性能意味着可以减轻收集信息的负担,使此类预测模型更易于实施和推广。 总之,随着信息科学技术的不断发展和数据的不断完善,未来研究可以结合生物-心理-社会预测因素三个维度,利用机器学习算法开发PPD综合预测模型,作为准确的PPD预测模型。产后抑郁症的预测工具。 。
5研究展望
现阶段,PPD预测模型的研究正如火如荼地进行。 在“二孩”、“三孩”政策背景下,高危孕妇数量将持续增加。 有必要对参数和非参数PPD预测模型进行分类和比较,以选择合适的模型构建。 方法很关键。 值得注意的是,在比较参数模型和非参数模型的过程中,作者发现,无论哪种模型都有其相应的适用范围,在选择合适的模型时还应考虑模型的实用性。 因此,建议在今后的研究中构建PPD预测模型时应注意以下几点。
首先,预测变量的维度影响PPD预测模型的稳定性和准确性。 一方面,由于PPD的影响因素复杂多样,模型包含的预测因素参差不齐,模型拟合和模型优化选择存在差异,可能会遗漏一些重要的影响因素。 因此,全面、多维度地确定预测因素至关重要。 重要的。 另一方面,使用高维预测变量会导致模型过于复杂,预测变量缺乏代表性,实际应用中难以获取,不利于相关预测模型在孕妇中的推广和使用。 因此,在选择多维预测变量时,应考虑变量是否存在严重的信息重叠,并采用适当的方法(如正则化技术)进行降维。 考虑到从怀孕到产后的时间跨度较长,还应动态监测孕妇从怀孕到产后的社会环境、心理和相关生物预测因素,设置更多获取母体数据的测量时间点,并设置预测变量进行深入探讨。 相互之间的作用机制,以便纳入最佳的预测变量。
其次,样本量的准确估计是PPD预测模型可靠性和重复性的重要保证。 无论使用哪种模型,当样本量不足时,都容易出现过拟合,即基于小样本量构建的PPD预测模型很难在较大人群中得到验证。 对于PPD预测模型的开发来说,选择大样本、多中心数据将有助于提高PPD预测模型的预测效果和泛化能力。 但还应考虑研究效率和成本等实际问题,因此应同时确定样本量。 有效性和可行性。 在样本量计算方面,RILEY 等人。 [47]提供了如何计算临床预测模型所需样本量的方法学指导,但不建议数据分割。 相反,应使用重采样方法进行内部验证。 除了计算样本量外,还需要关注纳入研究的孕妇的代表性,以及母亲群体特征偏差对PPD预测模型的影响需要进一步研究。
最后,模型验证是实现预测的必要步骤,即评估模型的判别性和校准性。 完整的预测模型应包括模型的内部和外部验证。 然而,目前大多数PPD预测模型研究仅通过随机分割数据进行内部验证。 这种方法减少了开发队列的样本量,并可能降低模型的性能。 ,表现出更高的变异性[48]。 更好的内部验证方法是k折交叉验证和方法,但这两种方法在许多PPD预测模型中经常被忽略。 同时,内部验证本身并不能保证结果的普适性,因此还需要大样本量的外部验证来更好地验证模型的性能[49]。
综上所述,选择合适的模型构建方法至关重要。 参数模型易于解释,侧重于线性变量的预测,而非参数模型在预测非线性变量方面具有更好的优势。 对于文本和图像数据,应用深度学习算法进行分析可能是更好的选择。 因此,模型的选择应根据各种算法的功能和特点,综合考虑研究目的、变量类型、维度、样本量、预测变量与结果指标之间关系的复杂程度等。在PPD预测方面研究人员应更加关注母体PPD风险预测模型,并关注该模型的概括能力。 在考虑模型的准确性时,他们还应根据临床适用性和实际应用的便利性选择适当的模型。 ,避免盲目追求统计优化并采用不必要的复杂模型。
本文没有利益冲突。
省略了参考
本文的来源:Wang ,Qi ,Wang 等。 产后预测模型的分类和比较[J]。 中国通用医学,2022,25(24):3036-3042。 (单击标题以查看原始文本)