手记

难道我一直没理解segmentation文件的拷贝数计算?

一个比较典型的segmentation file格式如下:

> head(segfile)
# A tibble: 6 x 6
  Sample                       Chromosome    Start      End Num_Probes Segment_Mean  <chr>                             <int>    <int>    <int>      <int>        <dbl>1 TCGA-DK-A1A6-01A-11D-A13V-01          1  3218610 14449771       5840       -0.133
2 TCGA-DK-A1A6-01A-11D-A13V-01          1 14450545 14453003          2       -1.94 
3 TCGA-DK-A1A6-01A-11D-A13V-01          1 14455748 31677633       9063       -0.114
4 TCGA-DK-A1A6-01A-11D-A13V-01          1 31682380 31736123         40       -0.558
5 TCGA-DK-A1A6-01A-11D-A13V-01          1 31740706 31750640          4        0.184
6 TCGA-DK-A1A6-01A-11D-A13V-01          1 31751191 31829873         35        0.468

根据Segment_Mean列计算拷贝数及拷贝数Ratio(Tumor vs. Normal)呢?

算拷贝数我使用2 * 2 ^ Segment_Mean,拷贝数Ratio的话就是2 ^ Segment_Mean

但我在看了ABSOLUTE包的源码后,我很崩溃

然后它算出来的拷贝数ratio是下面这样的:

> head(segtab2)
# A tibble: 6 x 16  sample Chromosome Start.bp End.bp n_probes length seg_sigma       W copy_ratio modal_cn expected_cn subclonal
  <chr>       <int>    <int>  <int>    <int>  <int>     <dbl>   <dbl>      <dbl>    <int>       <dbl>     <int>
1 solid…          1  3218610 1.44e7     5840 1.12e7   0.00164 0.00394      0.456        2       2.08          0
2 solid…          1 14450545 1.45e7        2 2.46e3   0.0884  0            0.131        0       0.583         0
3 solid…          1 14455748 3.17e7     9063 1.72e7   0.00131 0.00604      0.462        2       2.11          0
4 solid…          1 31682380 3.17e7       40 5.37e4   0.0198  0.00002      0.340        1       1.48          0
5 solid…          1 31740706 3.18e7        4 9.93e3   0.0625  0            0.568        3       2.69          0
6 solid…          1 31751191 3.18e7       35 7.87e4   0.0211  0.00003      0.692        3       3.52          0

谁可以告诉我真相是什么? :cry:

刚好2倍的差别~



作者:王诗翔
链接:https://www.jianshu.com/p/a47f5f5b1885


0人推荐
随时随地看视频
慕课网APP