怎么找基因序列?
据基因的构成原理寻找基因序列,如下:A、C、G和T分别代表组成DNA的四种核苷酸——腺嘌呤,胞嘧啶,鸟嘌呤,胸腺嘧啶。每个字母代表一种碱基,两个碱基形成一个碱基对,碱基对的配对规律是固定的,即是:A-T,C-G。典型的他们无间隔的排列在一起,例如序列AAAGTCTGAC。任意长度大于4的一串核苷酸被称作一个序列。关于它的生物功能,则依赖于上下文的序列,一个序列可能被正读,反读;包含编码或者无编码。DNA序列也可能包含“junk DNA”。注:带有遗传讯息的DNA片段称为基因,其他的DNA序列,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。组成简单生命最少要265到350个基因。扩展资料:基因诊断当环境中的有害物质进入受精卵或母体,当父母有一定的共同血缘或有一定相同数目的遗传基因关系,在这些情况下,后代的基因组里的基因会发生缺陷,产生疾病。通过使用基因芯片等技术分析人类基因组,可找出致病的遗传缺陷基因区域。癌症、糖尿病等,都是遗传基因缺陷引起的疾病。医学和生物学研究人员将能在数秒钟内鉴定出最终会导致癌症等的突变基因。借助一小滴测试液,医生们能预测药物对病人的功效,可诊断出药物在治疗过程中的不良反应,还能当场鉴别出病人受到了何种细菌、病毒或其他微生物的感染。利用基因芯片分析遗传基因,将使10年后对糖尿病的确诊率达到50%以上。未来人们在体检时,由搭载基因芯片的诊断机器人对受检者取血,转瞬间体检结果便可以显示在计算机屏幕上。利用基因诊断,医疗将从千篇一律的“大众医疗”的时代,进一步精确到依据个人遗传基因而异的“定制医疗”的时代,也可以抽羊水进行产前基因诊断。参考资料来源:百度百科-DNA序列
基因的蛋白质编码序列是什么序列?
基因的蛋白质编码序列是CDS序列,可以叫coding segment或coding sequence。这条序列从ATG启动密码子开始,终止密码子结束。所有的CDS都是ORF(开发阅读框 open reading framework),ORF就是ATG开始,终止密码子结束的一条序列,但ORF不一定编码蛋白,这是它和CDS的区别,只有编码蛋白的ORF才是CDS。对于真核生物来说,mRNA是由外显子组成的。真核生物在转录后产生核不均一RNA(hnRNA)经过修饰加工可变剪切(除去内含子)形成成熟mRNA。原核生物则不需要。所以在生物信息学中单纯使用查找ATG的方式找ORF只适合原核生物或mRNA,真核有专门的基因预测软件。基因(遗传因子)是产生一条多肽链或功能RNA所需的全部核苷酸序列。基因支持着生命的基本构造和性能。储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息。环境和遗传的互相依赖,演绎着生命的繁衍、细胞分裂和蛋白质合成等重要生理过程。生物体的生、长、衰、病、老、死等一切生命现象都与基因有关。它也是决定生命健康的内在因素。因此,基因具有双重属性:物质性(存在方式)和信息性(根本属性)。