摘要:目的 构建并验证基于极端梯度提升(XGBoost)的预测模型,用于早期识别精神分裂症患 者对奥氮平治疗在8 周时的治疗失效风险,以期为个体化治疗决策提供辅助支持。方法 纳入2023 年 1 月—2024 年12 月在厦门市仙岳医院受奥氮平治疗且完成8 周随访的200 例精神分裂症患者为研究对 象。治疗失效定义为治疗8 周后阳性与阴性症状量表(PANSS)评分减分率< 30%。收集受试者人口学 资料(年龄、性别、病程等)、临床资料(基线PANSS 评分、合并症、既往用药史)、实验室指标[血常规、肝 肾功能、血清白细胞介素6(IL-6)等]及基因标记(DRD2 rs1076560)等候选预测因子。对缺失值采用多 重插补(MICE,m=5)。将样本按7∶3 随机分为训练集(n=140)与测试集(n=60)。训练集中采用5 折交叉 验证并通过网格搜索调优XGBoost 超参数;必要时对类别不平衡采用合成少数类过采样技术(SMOTE)。 模型性能在独立测试集中以曲线下面积(AUC)、敏感度、特异度、准确度、校准曲线(Hosmer-Lemeshow 检验)及决策曲线分析(DCA)评估,并采用SHAP值解释变量重要性。统计分析使用Python(XGBoost、 Scikit-learn)与R 软件完成。结果 训练集与测试集的患者在性别、年龄、病程、基线PANSS 评分、共病 焦虑障碍比例、血清IL-6水平及DRD2基因rs1076560位点多态性方面差异均无统计学意义(均P>0.05)。 XGBoost 模型在训练/ 验证过程中筛选出5 个重要预测因子:基线PANSS 阳性症状评分、病程、血清IL-6 水平、DRD2 基因rs1076560 位点多态性与合并焦虑障碍。测试集中模型表现为:准确度0.833,敏感度 0.794,特异度0.885,AUC=0.897(95%CI:0.808~0.986);Hosmer-Lemeshow检验P=0.620,校准良好。DCA表 明,当阈值概率> 0.25 时,模型相较单一预测指标具有更高的临床净获益。结论 XGBoost 预测模型在 本队列中能较好地识别奥氮平治疗8 周失效的高危患者,所识别的关键因子涉及症状严重度、病程、炎 症指标、基因多态性与共病。模型需在外部队列验证后方可用于临床辅助决策。