Accurate and Early Diagnosis of NSCLC Using Aberrant Fragmentomic Features of Circulating Cell-Free Mitochondrial DNA.
研究背景
非小细胞肺癌(NSCLC)是癌症死亡主因之一,早期诊断对提高生存率至关重要。当前低剂量计算机断层扫描区分良恶性肺部疾病能力有限,血清生物标志物敏感性和特异性不足,循环细胞游离线粒体DNA(ccf - mtDNA)片段组学在NSCLC诊断中的作用待探索。本研究旨在评估其在NSCLC早期诊断和良恶性肺部疾病鉴别诊断中的价值。
方法速览
研究纳入2306名参与者,含1357名NSCLC患者、432名良性肺部疾病(BLD)患者和517名健康对照。收集血浆样本进行ccf - mtDNA测序,用随机森林算法基于ccf - mtDNA片段组学特征构建差异诊断模型(DBM)和早期诊断模型(EDL),通过十折交叉验证评估性能,并在内外验证队列中验证。
主要发现
- ccf - mtDNA片段组学特征改变:NSCLC患者ccf - mtDNA片段组学特征与BLD患者和健康对照显著不同,短片段比例更高,片段大小分布更集中,5’端基序多样性评分增加,为其作诊断生物标志物提供理论基础。
- DBM模型性能:区分NSCLC与BLD,内部验证队列AUC值0.9551,灵敏度90.12%,特异性90.82%,小于1厘米小结节中AUC为0.9151。外部验证队列1和2的AUC值分别为0.9620和0.9692。模型可分患者为低、中、高风险组,减少误诊和延误治疗风险。
- EDL模型性能:区分NSCLC与健康对照,内部验证队列AUC值0.9881,0 - Ⅰ期NSCLC的AUC值为0.9841,灵敏度超80%,特异性超96.67%。外部验证队列1和2的AUC值分别为0.9816和0.9759。在不同分期和组织学类型NSCLC患者中AUC值均超0.9759,灵敏度和特异性高。
总结展望
本研究首次系统评估ccf - mtDNA片段组学在NSCLC早期诊断和良恶性肺部疾病鉴别诊断中的价值,开发两种高性能机器学习模型,有重要临床意义。但样本主要来自中国非吸烟人群,需全球多中心验证模型普适性,且研究为回顾性设计,需前瞻性试验验证临床应用效果。