ROC曲线的ROC分析

2024-04-29

1. ROC曲线的ROC分析

SPSS 9.0以上版本可进行ROC分析,操作步骤如下:1.定义列变量,并输入数据(1)诊断分类值或检测结果(test):多个诊断试验则定义test1,test2,...(2)金标准类别(group):1=病例组,0=对照组(3)分类频数(freq),需要进一步执行第二步2.说明频数变量 路径:Data\Weight Case..., 选项:Weight case by, 填表:Freqency Variable (freq)3.ROC分析:路径:Grahps\Roc Curve... 填表:Test Variable(test), State Variable (group), Value of state variable,选项包括:(display) ROC Curve,with diagonal reference line (机会线), standard error and confidence interval (面积的标准误,及其可信区间), Coordinate points of the ROC curve (ROC曲线的坐标点), options:test direction (如果检测值小划归为阳性,则需要选), cofidence level (%):需要除95%以外的可信度,可在此定义。如果是连续型测量资料,则不需要第1步的(3)及第2步。

ROC曲线的ROC分析

2. 分析技术 | 建立预测模型及模型的ROC曲线绘制

2020/5/27,受一名同学所托,为他的肿瘤Hub基因分析文章做一个预测模型和模型的ROC曲线、AUC值来验证Hub基因的可靠性。如果Hub基因有意义的话,用Hub基因作为特征建立的预测模型就应该能有效地分类癌组织或者正常组织。
  
 本文结构如下:
  
 首先,数据清洗和Hub基因筛选,他们已经把Hub基因找到了,换句话说可以直接跳过数据清洗和特征工程阶段。
                                          
 一共10个关键基因,分为三类,高恶度癌(3)、低恶度癌(2)、正常对照组织(1),分别为9、20、20个样本。
  
 首先创建两个.txt文件分别储存图2的特征值内容和标签内容,features.txt 和 label_2.txt(当然也可以直接用Pandas读取表格,个人习惯)然后用Python读入数据。
                                                                                                                          
 我在这里定义了一个函数,需要用主函数设置which_class,选择绘制哪一类的ROC
                                                                                  
 ROC、AUC、micro/macro-average ROC curve的理论部分可以看这个 ROC理论 ,本节简要解读一下多类别ROC图的结果:
   这个是直接三分类的训练集:测试集=1:1的ROC曲线,class0代表鉴别正常组织和两种癌组织,class1代表鉴别低恶度癌和另外两种组织,class2代表鉴别高恶度癌和另外两种组织,可以看出class2的AUC值为1,表明Hub基因建立的模型确实可以有效鉴别ATC和另外两种预后较好的组织。
  
 [1]  sklearn中文官方文档:支持向量机 
   [2]  Receiver Operating Characteristic (ROC) 
   [3]  Receiver Operating Characteristic (ROC) with cross validation
最新文章
热门文章
推荐阅读