在20世纪初,生物学家普遍认为蛋白质是生物的遗传物质。不久后,人们开始认识DNA的分子结构,有科学家认为DNA是遗传物质。为了确认究竟哪种大分子是遗传物质,生物学家完成了下面两个经典的实验。
1928年,英国细菌学家格里菲斯进行了“格里菲斯”实验,即肺炎双球菌的体内转化实验。肺炎双球菌分为两种类型:S型菌有多糖荚膜,所以菌落表面光滑,能够引发败血症,具有致死性;R型菌没有多糖荚膜,自我保护能力差,无法致病。
格里菲斯分别进行了四组实验。在前两组实验中分别用R型活菌和S型活菌注射小鼠,发现注射R型活菌的小鼠不死亡,注射S型活菌的小鼠死亡,并且可以从体内分离出S型活菌。这说明单纯的R型活菌对小鼠没有致死性,单纯的S型活菌对小鼠能导致小鼠死亡。
第三组实验中,格里菲斯给小鼠注射加热杀死的S型菌,发现小鼠不死亡。第二组和第三组实验共同说明,只有活的S型菌才能导致小鼠死亡。
第四组实验,格里菲斯将加热杀死的S型菌和活的R型菌混合后,给小鼠注射。结果小鼠死亡,并且在死亡小鼠体内分离出S型活菌。在前三组实验中已经证明,导致小鼠死亡的既不可能是R型活菌,也不可能是S型死菌,那么就只能是S型活菌。从第四组死亡小鼠体内分离出S型活菌也印证了这一点。同时,S型活菌的出现必然源于S型死菌和R型活菌的混合。于是,格里菲斯推论:被加热杀死的S型菌中,必然含有某种物质,促使R型活菌转化成了S型活菌。格里菲斯将这种物质称为“转化因子”
美国细菌学家艾弗里在格里菲斯实验的基础上,通过体外实验继续探究“转化因子”的化学本质。。通过分离和提纯,艾弗里从加热杀死的S型菌中提取出了蛋白质、DNA和多糖等物质。他将这些物质分别加入R型活菌的培养基中,结果发现,只有加入DNA,R型活菌才能转化成S型活菌。基于这一结果,艾弗里认为,DNA是携带遗传信息的物质。
尽管艾弗里的实验证明了DNA可以使R型活菌发生变化,但学界依然存在诸如“四核苷酸假说”的其他意见。20世纪中,赫尔希和蔡斯利用放射性同位素标记技术,又一次验证了DNA是遗传物质。这一实验彻底消除了人们关于遗传物质本质是DNA还是蛋白质的争议。
T2噬菌体是感染大肠杆菌的病毒。它的外壳都是由蛋白质构成的,分为头部和尾部。头部壳内含有DNA,尾部负责黏附在大肠杆菌表面。T2噬菌体感染大肠杆菌后,会在遗传物质的指导下,利用大肠杆菌细胞内的物质,合成自身组分,产生大量新生的噬菌体。最终,被感染的大肠杆菌死亡裂解,释放新生的噬菌体。
赫尔斯和蔡斯利用放射性同位素分别标记蛋白质和DNA。使用35S标记蛋白质(蛋白质中甲硫氨酸和半胱氨酸残基都含有硫元素,而DNA中不含有硫元素),使用32P标记DNA(DNA中磷酸二酯键上含有大量磷元素,而蛋白质不含有磷元素)。具体方法是分别在含有两种放射性元素的培养基中培养大肠杆菌,再用这些大肠杆菌培养噬菌体。因为噬菌体属于病毒,无法独立繁殖,所以不能直接用非生物培养基培养噬菌体。
在实验中,分别用32P或35S标记的噬菌体侵染没有放射性标记的大肠杆菌。经过一段时间的保温培养后,搅拌、离心。搅拌是为了让噬菌体外壳与大肠杆菌分离,离心是为了让噬菌体外壳与大肠杆菌在培养液中进一步分层。离心后,较轻的噬菌体外壳位于上层,较重的大肠杆菌位于下层。此时,检查离心后的放射情况,发现:35S标记的一组,放射性主要集中在上层,32P标记的一组,放射性主要集中在下层。
这说明噬菌体外壳中35S标记的蛋白质并没有进入到大肠杆菌体内。而32P标记的DNA进入了大肠杆菌的体内,发挥了遗传物质的作用,在噬菌体代际间传递。这个实验更加完善的证明了DNA才是遗传物质。
后来,生物学家发现, RNA也可以在烟草花叶病毒,艾滋病病毒等部分种类的病毒中充当遗传物质。但在除了病毒以外的所有生物里,DNA都是唯一的遗传物质。所以我们说:绝大多数生物的遗传物质是DNA,DNA是主要的遗传物质。
尽管一系列的实验证明的DNA是遗传物质,但是人们对于DNA的结构依然一无所知,也就无法进而了解DNA是如何储存遗传信息的。
通过化学手段,科学界已经了解到DNA是由脱氧核糖核苷酸单体聚合而成。一个核苷酸单体由三部分组成:脱氧核糖,磷酸和碱基,其中碱基有四种:A(腺嘌呤),T(胸腺嘧啶),G(鸟嘌呤),C(胞嘧啶)。但人们并不知道它们是以什么结构组合在一起的
1951年,英国晶体学家富兰克林通过X射线衍射得到了DNA分子的衍射照片。衍射照片可以反映出DNA的晶体结构。这张照片给正在研究DNA分子结构的科学家沃森和克里克非常大的启发。由此他们认定DNA一定是螺旋结构。而查戈夫通过化学方法测定,DNA分子中,A与T的总量相等,G与C的总量相等。根据这些信息,沃森和克里克尝试将DNA分子中的A与T配对,G与C配对,在他们的办公室里兴高采烈地用铁皮和铁丝搭建着模型。1953年2月28日,第一个DNA双螺旋结构的分子模型终于诞生了。这个成果被发表在Nature上并且与1960年获得诺贝尔生理学或医学奖。
双螺旋结构是这样的,脱氧核糖核苷酸分子通过聚合形成长链,两条链按照反向平行的方式盘旋形成双螺旋。脱氧核糖与磷酸交替连接排列在外侧,构成DNA分子的基本骨架;内侧的碱基按照A-T,G-C的碱基互补关系,两两通过氢键相连,使两条单链结合在一起。
在DNA分子中,磷酸和脱氧核糖交替排列的骨架是固定的,只有碱基的种类是可变的。遗传信息储存在碱基里。每个位置上碱基的种类都有四种可能性,N个碱基的随机排列就具有4^N种可能性。而通常一个DNA分子具有上亿个碱基对,因此从数量上来看DNA上碱基对的排列足够容纳生物的遗传信息。由于碱基序列的不同,每一条DNA分子都是独一无二的,具有特异性。
生物的遗传信息被分为很多个片段地被记录在DNA上。每一个具有遗传效应的DNA片段就叫做基因。如果用碱基对的个数衡量DNA片段的大小。一般一个基因包含几千到几百万个碱基对,而一条双链DNA有上亿个碱基对。从数量上来看,一个DNA分子上可以编码许多的基因。基因在DNA分子上是线性排列的,每个基因都由一段连续的碱基编码。这个基因的编码结束后,下个基因的编码才可能开始