分子进化
简介
分子进化 molecular evolution 生物进化过程中生物大分子的演变,包括前生命物质的演变;蛋白质分子和核酸分子的演变以及细胞器和遗传机构(例如遗传密码)的演变。分子进化的研究可以为生物进化过程提供佐证,为深入研究进化机制提供重要依据。
广义的分子进化有两层含义,一是原始生命出现之前的进化,即生命起源的化学演化;二是原始生命产生之后生物在进化发展过程中,生物大分子结构和功能的变化以及这些变化与生物进化的关系,这就是通常所说的分子进化。[1]
核酸进化
量的变化 核酸是遗传物质,可以明显地看到在生物进化过程中各种生物每一基因组的核酸的量在总的趋势上逐渐增加。
从总的趋势来看,愈是低等生物DNA量愈少,愈是高等则愈多。但是这规律对于某些生物显然并不适用,原因是多方面的。一般生物愈是高等则所需要的基因愈多(见基因),可是进化达到某一阶段以后,基因的数目便不再相应地增加。细菌的呼吸代谢和氨基酸、核苷酸代谢途径与人没有多大差别,这一事实足以说明有关的酶的结构基因没有太大的增加。倍性对于每一细胞中的DNA的含量有很大的影响。纤毛虫的DNA含量特别高便是由于这一原因。例如双小核草履虫(Paramecium aurelia)的大核是860倍体,梨形四膜虫(Tetrahymena pyriformis)的大核是100倍体。被子植物的每一细胞中的DNA含量较高也是由于这一原因(见染色体倍性)。各种生物的不编码蛋白质的重复序列和内含子的量不同是使 DNA含量不同的另一原因。
质的变化 生物进化过程中 DNA的质也在发生变化。用分子杂交方法可以分析各种生物的DNA的相似程度。
对于某一类生物来讲,例如在灵长类动物和细菌等生物中都可以用同样的方法来测定它们的亲缘关系。
进化中的保守性 分子杂交测定的结果只能说明两种生物的DNA的相同或不同程度,通过DNA顺序分析才能知道它们怎样相同或不同。对于大肠杆菌和λ噬菌体等的46个启动区进行核苷酸顺序分析,发现在每一个基因的mRNA转录位置前面相隔10个碱基对的地方有一个称为普里布诺顺序的保守区,它包括核苷酸顺序TATAATG。这里面特别是从左面开始第1、第 2和第6这几个碱基如果变为G或C就会导致转录效率下降,尤其是第6位上的T,在46个例子中从没有发现过例外。在高等生物中存在着的类似保守区称为霍格内斯顺序。
在 5个肠道杆菌科(Enterobacteriaceae)细菌中曾经分析了它们的染色体DNA复制起点的245个核苷酸的顺序,发现它们的相同的顺序可以多达85%,同样说明这一顺序具有很强的保守性。
这一类保守区的存在说明这些结构对于各自的功能是十分重要的,因而在生物进化过程中不容轻易改变。至于个别基因或染色体片段的位置改变则在进化过程中可以发生而保存下来。个别核苷酸的改变同样可以发生而保存下来,这些变化可以清楚地反映在各种近缘生物的染色体和遗传学图的比较研究中,也可以反映在蛋白质的比较研究中。
蛋白质进化
蛋白质差异 可以用免疫学方法测定各种生物的蛋白质的亲缘关系,例如用人的清蛋白注射家兔,从家兔取得抗血清,把抗血清分别和人、大猩猩、黑猩猩等的清蛋白进行沉淀反应测定,可以看到愈是亲缘关系相近的清蛋白沉淀反应愈强。
同工酶的电泳测定是70年代发展起来的可以用来比较生物蛋白质的亲缘关系的方法。同工酶是功能相同而一级结构不相同的酶。一种蛋白质中任何一个氨基酸的替代,只要它带来用电泳方法可以区分的电荷差别就可被检出,但如果没有带来电荷差别便不能检出。由于这一方法简便、快速,所以在分子进化的研究中常被采用。例如曾用电泳方法对包括魏氏果蝇 (Drosophila wil-listoni)在内的9种果蝇14个亚种的 36种酶的同工酶进行分析,根据分析的结果可以绘制出它们的系谱图。
前生命进化
地球的历史约有50亿年。60年代末在南部非洲的前寒武纪地层中发现了一种古老的细菌化石,它的生存年代约在32亿年之前,另外还发现一些更古老的类似原藻类的微小生物化石,它的生存年代约在34亿年以前,这是地球上发现得最早的生命的记录。
关于地球以及其他天体上的生命进化的研究方面,1936年苏联生物化学家 A.И.奥帕林提出的团聚体理论、1952年英国生物物理学家J.D.贝尔纳提出的粘土表面理论、1959年美国学者S.W.福克斯和K.原田馨提出的类蛋白微球体理论、1969年江上石二夫提出的海生颗粒理论等都各自具有独特的见解。1975年美国物理化学家和生物化学家M.卡尔文在总结各家学说的基础上提出一个模型,认为最初覆盖于地球上的那些致生元素先是形成各种原始的致生分子(甲烷、硫化氢等)。致生分子在许多种能源(包括太阳的紫外线、电离辐射能和陨石冲击波等)的影响下进一步形成低分子有机化合物,以后再从低分子有机化合物过渡到高分子有机化合物。大约在40亿年前才由大分子有机化合物形成了最初的具有生命形态的有机体。[2]
关于生命起源的原始环境条件,奥帕林曾有专著论述。第一个尝试用实验论证奥帕林理论而获成功的是美国人H.C.尤里和S.L.米勒。他们在1952年首先模仿生命前时期的环境条件,在甲烷、氨、氢和水的混合物中通过放电反应形成多种产物,包括有各种氨基酸、嘌呤、嘧啶和一些简单的糖类分子。以后在另一些条件下发现核苷的磷酸化现象。从1968年以来人们发现在星际空间同样存在有类似的有机化合物分子,在太空陨石以及月球尘埃中有些迹象显示甚至有氨基酸的存在。1958年福克斯的实验证实了无水氨基酸混合物在高于 100℃的温度下缩合成为类蛋白。类蛋白在水和高浓度的盐溶液中能形成直径约0.5~3微米的微球体。微球体甚至能以出芽的方式进行“繁殖”。核酸同样也可以在模拟的实验室条件下由核苷酸形成。所有这些实验结果都说明生物大分子可以在原始的地球表面不通过酶促反应而在生物体外形成。蛋白质和核酸在前生命进化阶段中哪一种出现在先以及他们的相互依赖关系究竟怎样,都是研究和争论中的问题。
氨基酸差别
氨基酸分析结果可以为生物的亲缘关系的研究提供更多的资料。细胞色素 C是从人到酵母菌中都存在的一种蛋白质,便于进行广泛的比较。细胞色素C由140个氨基酸构成。把各种生物的细胞色素 C的氨基酸成分和人的相比较,可以看到亲缘关系愈近的生物的细胞色素 C和人的愈相近似。在血红蛋白、血纤维蛋白中都进行过同样的研究。根据多种动物中这三种蛋白质的氨基酸成分的研究结果,还可以看到生物进化过程中细胞色素C的进化速率最低。纤维蛋白的进化速率最高,血红蛋白则介于两者之间,也就是说细胞色素 C是最保守的蛋白质。例如人和猕猴的共同祖先生活在4000~5000万年以前,而到现在这样长的时间内,细胞色素C中只有一个氨基酸发生了变化。染色体中的组蛋白是一类更为保守的蛋白质。
成人的血红蛋白由两个 α链和两个β链构成,胎儿的血红蛋白由两个 α链和两个γ链构成。α、β和γ链都由146个氨基酸构成,而且许多氨基酸都是相同的,并且和肌红蛋白也非常近似。根据对于许多种动物的血红蛋白和肌红蛋白的研究,可以画出血红蛋白分子的进化树。
变化的来源
在漫长的进化过程中生物的 DNA经历了各种各样的变化。包括基因突变、基因重组、染色体易位等。
碱基置换突变常导致蛋白质中一个氨基酸的改变。例如正常血红蛋白第 6位的谷氨酸改变为缬氨酸便成为镰形细胞贫血症的血红蛋白 HbS,为赖氨酸替代则成为HbC,前者的碱基是从GAA(谷氨酸)→GUA(缬氨酸),后者是 GAA(谷氨酸)→AAA(缬氨酸)。已经发现的由α链上单个氨基酸的改变而造成的异常血红蛋白不下40种,由β链上单个氨基酸改变而造成的异常血红蛋白在80种以上。
DNA 分子的重复也是蛋白质分子发生改变的重要原因。例如血红蛋白中的 α、β、γ、δ 4种多肽链相互关系便是如此。
易位是又一种导致蛋白质分子中氨基酸顺序改变的原因。例如有一种称为Lepore的贫血症,患者的一个血红蛋白链的氨基端相同于δ链的氨基端,它的羧基端相同于β链的羧基端。
缺失在蛋白质分子进化中经常发生。例如血红蛋白第22位残基根据不同类型多肽链的前后顺序对应比较,可以肯定人和马的α链的差别由一个缺失造成。
还有一种情况是链的延伸,例如血红蛋白HbCS是一种具有正常 α链的变种,它从正常 α链羧基端的精氨酸上又延伸出31个附加的氨基酸残基,成为具有172个氨基酸的肽链,附加的氨基酸序列与 α链的其他部分或其他的血红蛋白链毫无关系。
遗传密码的进化 现有的生物的核基因密码都是相同的(见遗传密码),说明遗传密码体系在生物进化过程中早已固定。
1979年在三个实验室中分别发现遗传密码的统一性原则不适用于线粒体基因。例如人和酵母菌的线粒体中的UGA并不是终止密码子而是色氨酸密码子,AUA在人的线粒体中不是异亮氨酸而是甲硫氨酸密码子。这些事实说明在生物进化过程中遗传密码确实发生过变化。
哺乳动物的线粒体DNA的全部顺序已经分析清楚,这里面可以找到有23个编码转运核糖核酸(tRNA)的顺序。酵母菌的线粒体 DNA用顺序分析和分子杂交方法也得到和哺乳动物线粒体大约相同数目的tRNA顺序。染色体基因所编码的tRNA至少有50种。线粒体中的tRNA种类少于染色体基因所编码的tRNA种类。这一事实说明线粒体的密码体系是比较原始的状态。
原则
三维结构原则 对于各种生物物种的每一个蛋白质,用每一个位点每年发生的氨基酸替换的次数为标准衡量分子进化的速率是大致恒定的,只要该分子的功能和三维结构保持不变;
分子主次原则 功能上较次要的分子或分子的区域的进化速率(按突变替换数/每位点/每年计算)要比功能重要的分子或分子的部分的进化快。
破坏力原则 对现存分子的结构或功能破坏较小的那些突变替换(即保守性替换)要比破坏力较大的突变替换的进化来得频繁。
基因更新原则 基因复制总是在获得一个新功能之前就已发生