High throughput Sequencing
高通量测序技术
基因组计划:Human Genome Project, HGP
人类基因组计划与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划,是人类科学史上的又一个伟大工程,被誉为生命科学的“登月计划”
2000年6月草案HGP,序列以千分之一的错误率覆盖了 90% 的基因组,但有超过 150,000 个缺口,只有 28% 的基因组达到了最终标准。
2003年4月的版本中,只有不到400个空位,并且 99% 的基因组以每 10,000 个碱基对不到一个错误的准确率完成。
中国参与基因组研究计划的组织是:
Beijing Genomics Institute/Human Genome Center, Institute of Genetics, Chinese Academy of Sciences, Beijing, China
1999年11月10日,1%计划被列入中国国家项目,并确定由北京华大基因研究中心(华大基因)牵头,国家基因组南方中心、北方中心共同参与,承担全部工程1%的测序工作。2000年4月,中国完成了人第3号染色体上3000万个碱基对的工作草图。
北京基因组研究所
HGP项目发起组织National Human Genome Research Institute Home | NHGRI
HGP计划的分段目标
基因组测序方法
- Chromosomal walking(染色体步移)
- Shotgun methods(全基因组鸟枪法、分级鸟枪法)
2.1 鸟枪法测序
准确率:HGS 胜出
==对重复序列的组装是WGS最大的劣势:重复序列相似度越高、长度越长,WGS组装效果越差==
速度、成本:WGS胜出
全基因组鸟枪法测序策略 |
---|
(1)将整个基因组DNA打碎成便于测序的小片段(10kb) |
(2)依据片段间可能的重叠区实现各片段的有序排列 |
(3)完成全长的组装 |
分级鸟枪法测序策略 |
---|
(1)将整个基因组DNA==先分成大片段== |
(2)对大片段构建文库,并对其先实现有序拼接,形成所谓叠群图谱(contigmap) |
(3)用鸟枪法对每个大片段进行测序组装 |
(4)将所有大片段序列实现最后组装 |
==A图就是WGS,B图就是HGS==
2.2 新兴的测序技术
==最早的测序手段==,但是又化学上的危害性,现在不怎么把它叫做第一代测序,Maxam-Gilbert测序法[编辑]
主条目:马克萨姆-吉尔伯特测序
马克萨姆-吉尔伯特测序(英语:Maxam-Gilbert sequencing)是一项由阿伦·马克萨姆与沃尔特·吉尔伯特于1976~1977年间开发的DNA测序方法。此项方法基于:对核碱基特异性地进行局部化学改性,接下来在改性核苷酸毗邻的位点处DNA骨架发生断裂[13] 。
==普遍认为的第一代测序方法==Sanger测序法[编辑]
主条目:桑格测序
Sanger(桑格)双脱氧链终止法是弗雷德里克·桑格(Frederick Sanger)于1975年发明的。测序过程需要先做一个聚集酶链式反应(PCR)。PCR过程中,双脱氧核苷酸可能随机地被加入到正在合成中的DNA片段里。由于双脱氧核糖核苷酸又少了一个氧原子,一旦它被加入到DNA链上,这个DNA链就不能继续增加长度。最终的结果是获得所有可能获得的、不同长度的DNA片段。目前最普遍最先进的方法,是将双脱氧核糖核苷酸进行不同荧光标记。将PCR反应获得的总DNA通过毛细管电泳分离,跑到最末端的DNA就可以在激光的作用下发出荧光。由于ddATP, ddGTP, ddCTP, ddTTP(4种双脱氧核糖核苷酸)荧光标记不同,计算机可以自动根据颜色判断该位置上碱基究竟是A,T,G,C中的哪一个[14]。
下面是上课的板书
第一代测序技术
上课的板书
第二代测序技术
焦磷酸测序法(pyrosequencing)
双脱氧链终止法采用DNA复制原理。 Sanger测序反应体系中包括目标DNA片段、脱氧三磷酸核苷酸(dNTP)、双脱氧三磷酸核苷酸(ddNTP)、测序引物及DNA聚合酶等。 测序反应的核心就是其使用的ddNTP:由于缺少3’-OH基团,不具有与另一个dNTP连接形成磷酸二酯键的能力,这些ddNTP可用来中止DNA链的延伸。此外,这些ddNTP上连接有放射性同位素或荧光标记基团,因此可以被自动化的仪器或凝胶成像系统所检测到。
上课的板书
拍照的位置是确定的,读同一个位置,一直读,==AGT==、GAC、ACG
例如目的基因长1000bp,测序长度是300bp,那R1测300,R2测300,还剩400没测到,中间就没有overlap
目的基因长500bp,测序长度是300bp,R1测300bp,R2测300bp,overlap就有100bp。
==从下往上测==,因为它不是直的,从下往上更稳定,质量更好,从上往下他随风摇摆,不好测。
DNA bead + pyrosequencing
Illumina一次只能测一个碱基==SOLID一次可以测好几个碱基==,价格的问题。
==Illumina Sequencing by Synthesis==
第三代测序技术
第四代测序技术
==NANOPORE四种碱基信号对应的电信号不一样,DNA穿过的时候,电信号就可以转换成碱基信号。这种技术就可以直接测RNA。==它理论上可以测很长很长,就是money的问题。
Pacific Biosciences可以==测碱基上的修饰==
纳米孔测序比较贵,一个细菌可能就四五万。