一个比较典型的segmentation file格式如下:
> head(segfile) # A tibble: 6 x 6 Sample Chromosome Start End Num_Probes Segment_Mean <chr> <int> <int> <int> <int> <dbl>1 TCGA-DK-A1A6-01A-11D-A13V-01 1 3218610 14449771 5840 -0.133 2 TCGA-DK-A1A6-01A-11D-A13V-01 1 14450545 14453003 2 -1.94 3 TCGA-DK-A1A6-01A-11D-A13V-01 1 14455748 31677633 9063 -0.114 4 TCGA-DK-A1A6-01A-11D-A13V-01 1 31682380 31736123 40 -0.558 5 TCGA-DK-A1A6-01A-11D-A13V-01 1 31740706 31750640 4 0.184 6 TCGA-DK-A1A6-01A-11D-A13V-01 1 31751191 31829873 35 0.468
根据Segment_Mean
列计算拷贝数及拷贝数Ratio(Tumor vs. Normal)呢?
算拷贝数我使用2 * 2 ^ Segment_Mean
,拷贝数Ratio的话就是2 ^ Segment_Mean
。
但我在看了ABSOLUTE包的源码后,我很崩溃
然后它算出来的拷贝数ratio是下面这样的:
> head(segtab2) # A tibble: 6 x 16 sample Chromosome Start.bp End.bp n_probes length seg_sigma W copy_ratio modal_cn expected_cn subclonal <chr> <int> <int> <int> <int> <int> <dbl> <dbl> <dbl> <int> <dbl> <int> 1 solid… 1 3218610 1.44e7 5840 1.12e7 0.00164 0.00394 0.456 2 2.08 0 2 solid… 1 14450545 1.45e7 2 2.46e3 0.0884 0 0.131 0 0.583 0 3 solid… 1 14455748 3.17e7 9063 1.72e7 0.00131 0.00604 0.462 2 2.11 0 4 solid… 1 31682380 3.17e7 40 5.37e4 0.0198 0.00002 0.340 1 1.48 0 5 solid… 1 31740706 3.18e7 4 9.93e3 0.0625 0 0.568 3 2.69 0 6 solid… 1 31751191 3.18e7 35 7.87e4 0.0211 0.00003 0.692 3 3.52 0
谁可以告诉我真相是什么? :cry:
刚好2倍的差别~
作者:王诗翔
链接:https://www.jianshu.com/p/a47f5f5b1885