这段基因数据的意思是?

问题描述:

这段基因数据的意思是?
STANFORD UNIVERSITY HGDP-CEPH SNP GENOTYPES FLAT FILES DATASET 2:
HGDP00448 HGDP00479 HGDP00985 HGDP01094 HGDP00982 HGDP00911 HGDP01202 HGDP00927 HGDP00461 HGDP00451 HGDP00986 HGDP00449
rs3094315 CC TC TT TC CC TC CC CC CC CC TC TC
rs12562034 GG GG GG GG GG GG GG GG GG GG GG AG
rs3934834 TT TC TC TC TC CC CC TT TC CC TC CC
rs9442372 AG AG AG AG AG GG GG AA GG AA GG GG
rs3737728 CC CC TC TC CC CC TC CC CC TT CC CC
rs11260588 GG GG GG GG GG GG AG GG GG GG GG AG
rs9442398 AG AG AG AG GG GG AG AA GG AA GG GG
rs6687776 CC CC CC CC TC CC TC TT CC CC TC TC
rs9651273 GG AG GG GG GG GG GG GG GG GG GG AG
rs4970405 AA AA AA AA AA AA AA AA AA AA AA AA
rs12726255 AA AG AG AG GG AA GG AG AA AA AG AG
rs7540009 GG AG GG GG AG GG AG AG GG GG GG GG
rs11807848 CC CC TT TC TC TT CC TC TC CC CC TT
rs9442373 CC CC AC AC CC AA CC AC AC AA CC AA
rs2298217 CC CC CC CC CC CC CC CC CC CC CC CC
rs12145826 GG GG GG GG GG GG GG GG GG GG GG GG
rs4970357 AA AA AC AA AA AA AA AA AA AA AA AA
rs9442380 CC CC CC CC TC CC CC CC CC CC CC CC
rs7553429 CC AC AC CC AA AC CC CC AC CC CC AA
rs4970362 AA AA GG GG AG AG AA AA AG GG AA AG
rs9660710 AC CC CC CC CC AC CC AA AC CC AC CC
rs4970420 AG AG AG AG AG AG GG AA AA AA AA AA
HGDP0XXXX是人的编号
rsxxxxxxx是基因的位置
请问每个位置上的两个字母是什么意思?是指染色体的两条分支么?
为什么每个基因位置上只出现了3种情况,而不是4X4=16种?
1个回答 分类:综合 2014-10-16

问题解答:

我来补答
我想尝试解释一下你的两个问题.
首次,我们先看一下title,了解一下这组数据是关于什么的.这组数据是比较不同人之间某个基因的差异的.
SNP是指Single Nucleotide Polymorphisms,单核苷酸的多态性(SNP),是指不同个体某个基因之间的差异,这种差异大多数表现为单个碱基上的变异,而事实上,SNP 在CG序列上出现最为频繁,而且多是C转换为T,原因是CG中的C常为甲基化的,自发地脱氨后即成为胸腺嘧啶.有这组数据可以看得出.
分析完这些之后,我再回答你的第一个问题,每个位置上的两个字母就是这个基因上出现SNP的碱基.跟染色体没有关系.
其实突变(碱基替换)出现的频率不是那么高的,也不是我们想的那样可以随便突,尤其是人或者大型哺乳动物,每生产一代才有可能发生突变,而由于基因修复功能很强大,突变本身的概率都是非常低的,而且有些突变直接导致后代死亡或者不育,这进化上是没有意义的.还有就是突变之后,又突变回去了.
第二个问题,我们浏览一下这组数据,就可以发现其实并不是,也不可能突变成任意碱基,一般就是CC突变成TC或TT;CC突变成AC或AA;GG突变为AG或者AA.
呼哧呼哧.说清楚真心不容易.
有问题我们再讨论.
 
 
展开全文阅读
剩余:2000