中国癌症防治杂志 ›› 2025, Vol. 17 ›› Issue (3): 335-340.doi: 10.3969/j.issn.1674-5671.2025.03.11
摘要: 目的 采用机器学习方法开发区分胰腺癌与胰腺良性病变的鉴别模型。方法 研究对象为2018年1月至2023年12月期间在南昌大学第二附属医院接受治疗的251例胰腺疾病患者。研究中构建了6种机器学习模型,包括逻辑回归、随机森林、极端梯度提升树(eXtreme gradient boosting,XGBoost)、支持向量机、多层感知器和高斯朴素贝叶斯等,以区分胰腺癌与胰腺良性病变。通过受试者工作特征(receiver operating characteristic,ROC)曲线评估各模型的区分能力,校准曲线评估模型的一致性,决策曲线评估模型的临床适用性,并通过SHapley加性解释(SHapley Additive exPlanations,SHAP)方法对模型进行解释。结果 在251例胰腺疾病患者中,100例被诊断为胰腺癌,151例被诊断为胰腺良性病变。成功构建6种机器学习模型,其中随机森林、XGBoost、支持向量机、多层感知器模型的ROC曲线下面积(area under the curve,AUC)优于糖类抗原19⁃9(carbohydrate antigen 19⁃9,CA19⁃9)(均P<0.05)。特别是,XGBoost模型的AUC值最高(AUC=0.886),通过决策曲线和校准曲线的分析进一步证实了其显著的临床净收益和较好的一致性。SHAP分析显示,CA19⁃9是XGBoost模型中最重要的贡献者。结论 利用肿瘤标志物和临床检测数据开发的XGBoost模型,显著提高了区分胰腺癌与胰腺良性病变的鉴别能力,显示出其在临床应用的潜力。
中图分类号: