Genomics复习(2) — 基因组组织
困难:
RNA拼接:基因内区和外显子
开始和结束信号
非翻译区域:5UTR,3UTR
控制信号
结构化DNA
重复的区域,基因和伪基因
DNA包装影响基因表达
人类基因组:约有3*10pow9个碱基对
基因组VS后基因组时期:
2001年之前属于基因组时期:大多数的目标是测序
2001年之后属于后基因组时期:重要的目标包括分析和更有效的测序
DNA测序:传统和现代方法
传统:Sanger方法
工作流为:提纯基因组片段,扩大增强片段,测序片段,集合片段(集合片段是最难的部分)
将DNA片段裂解为单股,
现代:454方法,Shendure and Hanlee方法
下一代测序方法:
综合测序包括许多成像,需要耗费很多时间,数据管理问题,昂贵的原始数据归档费用,一般很难完成
对读取长度很小的算法需要花费相当的计算来集合
在基因组测序中的基本问题:
只能测序小片段,重复部分很困难,数据中有错误
问题1:大小分别
人类的基因组总数为3*10pow9个碱基,而Sanger方法只能测序500-1000碱基,下一代测序方法让不同更为明显,454测序只能250个碱基而其他的只能25-40个碱基
基因集成方法:层次集合,Shotgun测序
问题2:重复区域
30%的人类基因组是重复的,重复使得集成十分困难,散布的重复:SINES和LINES,串联重复
重复是近似的
问题3:错误
湿实验室更容易造成错误,如果序列的比较是近似的,它是重复区域?还是实验室错误?处理中的错误。
集成中的算法考虑:
错误,重复,准确估计,方向,覆盖率,不同片段的连接,效率
This entry was posted on Saturday, May 23rd, 2009 at 7:04 pm and is filed under 生物 . You can follow any responses to this entry through the RSS 2.0 feed. You can leave a response, or trackback from your own site.




Hypotheken? Heel veel hypotheek informatie: verschillende hypotheekvormen, hypotheekrentes, nationale hypotheek garantie, hoe een hypotheek te vergelijken.
Lenen zonder BKR toetsing gaat vandaag heel gemakkelijk. Binnen een paar uur geld lenen zonder BKR toetsing doet u hier, lees snel verder
Migraine is een bonzende hoofdpijn die meestal voorkomt aan één kant van de schedel. De pijn is heftig en houdt 4 tot 72 uur aan.