人類基因組
维基百科,自由的百科全书
人類基因組(英語:Human genome)是智慧人種(Homo sapiens)的基因組。共組成24個染色體,分別是22個體染色體、X染色體與Y染色體。含有約30億個DNA鹼基對(以氫鍵相結合的兩個含氮鹼基),其中一部分的鹼基對組成了大約20000到25000個基因。
全世界的生物學與醫學界在人類基因組計畫中,調查人類基因組中的真染色質基因序列。發現人類的基因數量比原先預期的更少,其中的外顯子,也就是能夠製造蛋白質的編碼序列,只佔總長度的1.5%[1]。
目录 |
[编辑] 特色
[编辑] 染色體
人類擁有24種不同的染色體,其中有22個屬於體染色體,另外還有能夠兩個決定性別的性染色體,分別是X染色體與Y染色體。1號到22號染色體的編號順序,大致符合他們由大到小的尺寸排列。在人類個體的體細胞中,通常含有來自親代的1到22對體染色體,再加上來自母親的X染色體,以及來自父親的X或Y染色體,總共是46個(23對)染色體。
[编辑] 基因
人體內估計約有20000到25000個蛋白質編碼基因。原本這個估計的數目超過100000,在更好的基因組序列品質與基因識別技術出現之後,才逐漸向下修正為現在的數字。
雖然人類的基因數量比起某些較為原始的生物更少,但是在人類細胞中使用了大量的選擇性剪接,這使得一個基因能夠製造出多種不同的蛋白質,且人類的蛋白質組規模也較前述的兩個物種更龐大。
物種 | 鹼基對數量 | 基因數量 |
---|---|---|
Mycoplasma genitalium 黴漿菌(生殖器支原體) |
580,000 | 500 |
Streptococcus pneumoniae 肺炎雙球菌 |
2,200,000 | 2,300 |
Haemophilus influenzae 流感嗜血桿菌 |
4,600,000 | 1,700 |
Escherichia coli 大腸桿菌 |
4,600,000 | 4,400 |
Saccharomyces cerevisiae 釀酒酵母 |
12,000,000 | 5,538 |
Caenorhabditis elegans 秀麗隱杆線蟲 |
97,000,000 | 18,250 |
Arabidopsis thaliana 阿拉伯芥(擬南芥) |
125,000,000 | 25,500 |
Drosophila melanogaster 黑腹果蠅 |
180,000,000 | 13,350 |
Oryza sativa 亞洲稻 |
466,000,000 | 45,000-55,000 |
Mus musculus 家鼠 |
2,500,000,000 | 29,000 |
Homo sapiens 人類 |
2,900,000,000 | 27000 |
大多數人類基因擁有許多的外顯子,且人類的內含子比位在其兩端的外顯子更長。這些基因參差不齊地分佈在染色體中,每一個染色體皆含有一些基因較多的區段與基因較少的區段。這些區段的差異,則與染色體帶(chromosome bands)及GC含量相關。基因密度所顯現的非隨機模式之涵義與重要性尚未明瞭。
除了蛋白質編碼基因之外,人類的基因組還包含了數千個RNA基因(由RNA組成),其中包括轉運RNA(tRNA)、核糖體RNA(rRNA)與信使RNA(mRNA),以及其他非編碼RNA基因。
[编辑] 調控序列
人類基因組含有許多不同的調控序列,並以此來控制基因表現。這些序列是典型的短序列,會出現在靠近基因的位置。由於高通量表達(high-throughput expression;指利用電腦與機器輔助以進行大量的序列分析)技術與比較基因組學研究的出現,人們開始系統性地了解這些調控序列,以及它們共同構成的基因調控網路(gene regulatory network)。
人們之所以能夠辨認哪些基因序列是調控序列,是因為生物在演化過程中對基因的保留。以大約7千萬年前到9千萬年前分支的人類與老鼠為例[4]:若以電腦比較兩者的基因序列,並且將兩者皆保有的非編碼序列辨識出來,就可以知道哪些基因序列可能對於基因調控來說相當重要[5]。
人類所擁有的調控序列所在位置,可以利用河豚的基因定位出來。因為河豚與人類擁有相同的基因,同時也擁有和人類相同的調控序列,但是「垃圾」基因比人類更少。如此較為簡潔的DNA序列,使得調控基因的位置較容易定位[6]。
[编辑] 其他DNA
蛋白質編碼序列(也就是外顯子)在人類基因組中少於1.5%[1]。在基因與調控序列之外,仍然有許多功能未知的廣大區域。科學家估計這些區域在人類基因組中約占有97%,其中許多是屬於重複序列(repeated sequence)、轉位子(transposon)與偽基因(pseudogene)。除此之外,還有大量序列不屬於上述的已知分類。
這些序列大多數可能是演化的產物,現在已經沒有作用,也因此有時會被稱作是「垃圾DNA」(junk DNA)[7]。不過有一些跡象顯示,這些序列可能會經由某些仍然未知的方式產生作用。最近一些使用微陣列技術所作的實驗發現,大量非基因DNA事實上會被轉錄成為RNA[8],這顯示轉錄作用背後可能還存在一些未知的機制。此外,不同種類的哺乳動物在演化的過程中共同保留了這些序列,也顯示基因組中還有很多作用未知的部分[9]。人類基因組內大量功能未知的序列,是目前科學研究的重點之一。
[编辑] 變異
大多數對於人類遺傳變異的研究集中在單一核苷酸多型性(single nucleotide polymorphisms;SNPs),也就是染色體中,個別鹼基(DNA序列的組成單位)的變換。科學家分析估計,在人類的真染色質(富含基因的染色質)中,平均每100到1000個鹼基中,會出現1個SNPs,不過並沒有均勻的密度。由於SNPs的存在,大多數遺傳學家對於如「所有人類的基因有99%都是相同的」一般的聲稱,皆會有所保留。國際人類基因組單體型圖計劃(International HapMap Project),便是爲了要將人類基因組中的SNP變異作編錄,而組成的一個大規模合作計畫。
基因組中有一些小型的重複序列,它們所擁有的基因座與基因長度,在不同的人類個體之間有很大的變異性。這也是DNA指紋(DNA fingerprinting)與親子鑑定(paternity testing)技術得以應用的基礎。異染色質(heterochromatin)是人類基因組的一些部分,總共包括有數百萬個鹼基對,這些鹼基對在人類族群之中的變異性也相當大。而且由於異染色質的重複性很高而且長度很長,因此目前的技術仍然無法精確地解出它們的序列。此外異染色質不含基因,對於表現型也沒有顯著的作用。
配子細胞中大多數的基因組突變,可能會造成胚胎不正常發育,而人類的一些疾病也與大尺度的基因組異常有關。例如唐氏症、透納氏症(Turner Syndrome),以及許多其他疾病,是染色體的不分離(nondisjunction)現象所造成。在癌細胞中的染色體,則是頻繁地出現非整倍性(aneuploidy)現象,不過這種現象與癌症之間的關係仍然不明。
2006年一篇發表在《自然》的研究報告中[10],研究人員發現在人類與其他哺乳類DNA序列中的拷貝數變異(copy number variation;CDV),可能非常重要。拷貝數變異又稱為拷貝數多型性(copy number polymorphisms;CNPs),是刪除、插入(insertion)、複寫(duplication),以及複雜多位置變異(complex multi-site variants)的合稱,在所有人類以及其他已測試的哺乳動物中皆可發現。
[编辑] 遺傳疾病
- 关于此话题更进一步的细节,參見遺傳疾病。
當一個或多個基因發生不正常表現時,便可能會使某個相對應的表型產生一些症狀。遺傳異常的原因包括了基因突變、染色體數目異常,或是三聯體擴張重複突變(triplet expansion repeat mutations)。如果受損的基因會從親代遺傳到子代,那就會成為一種遺傳性疾病。目前已知有大約4000種遺傳疾病,囊腫性纖維化是其中最普遍的疾病之一。
科學家通常會以群體遺傳學的方法進行遺傳疾病的研究,對於疾病的治療,則是由一些經過臨床遺傳學訓練,且同時也是遺傳學家的醫生來進行。人類基因組計畫的成果,使遺傳檢測技術能夠更有效地檢查出一些與基因有關的疾病,並且改進治療方法。父母能夠透過遺傳諮詢來偵詢一些遺傳症狀的嚴重性、遺傳的機率,以及如何避免或是改善這些症狀。
基因劑量(Gene dosage)會對人類的表現型產生龐大的影響,對於染色體中造成疾病的複寫、省略與分裂等現象的形成擁有一定的角色。例如唐氏症患者(21號染色體為三體)有較高的比率得到阿茲海默症,可能是因為與阿茲海默症有關的類澱粉前趨蛋白基因(位在21號染色體上)的過度表現所致[11]。而且相對而言,唐氏症患者中則有較低的比率得到乳癌,可能是因為腫瘤抑制基因(tumor-suppressor gene)的過度表現[12]。
[编辑] 演化
- 参见:人類演化
比較基因組學(Comparative genomics)對於哺乳類基因組的研究顯示,人類與大約兩億年前就已經分化的各物種相比,有大約5%的比例在人類基因組中保留了下來,其中包含許多的基因與調控序列。而且人類與大多數已知的脊椎動物間,也享有了一些相同的基因。
黑猩猩的基因組與人類的基因組之間,有98.77%是相似的。而平均每一個屬於人類的標準蛋白質編碼基因,只與屬於黑猩猩的同源基因相差兩個氨基酸;並且有將近三分之一的人類基因與黑猩猩的同源基因,能夠轉譯出相同的蛋白質。人類的2號染色體,是人類與黑猩猩基因組之間的主要差異,這一條染色體是由黑猩猩的染色體12號與13號融合而成[13]。
人類在晚近的演化過程中失去了嗅覺受器基因,這解釋了為何人類比起其他的哺乳動物來說,擁有較差的嗅覺。演化上的證據顯示,人類與某些靈長類所擁有的彩色視覺,降低了這些物種對於嗅覺能力的需求[14]。
[编辑] 粒線體基因組
大多數的基因是存在細胞核中,但是除此之外,細胞中的另一個稱為粒線體的胞器,也擁有自己的基因。通常在提到人類基因組的時候,並不包括粒線體基因組。不過遺傳學家對於這些基因仍然相當感興趣,因為粒線體基因組在粒線體疾病(mitochondrial disease)中具有一定的重要性。而且這些基因也可以用來研究人類的演化,舉例而言,若分析人類粒線體基因組的變異情況,將能夠使科學家描繪出人類的共同祖先,稱為「粒線體夏娃」(Mitochondrial Eve)。之所以稱為夏娃,是因為粒線體是位於細胞質中,而人類的精子與卵子結合時,源自母親(女性)的卵子提供了絕大多數的細胞質,因此人類細胞中的粒線體基因皆是來自母親。
由於粒線體缺乏用來檢查複製錯誤的能力,因此粒線體DNA(mDNA)的變異速率比細胞核DNA(一般所指的DNA)更快。粒線體的突變速率快了20倍,這使mDNA能夠用來較為精確地追溯出母系祖先。研究族群中的mDNA,也能使人們得知此族群過去的遷移路徑,例如來自西伯利亞的美洲原住民;以及來自東南亞的波里尼西亞人。更有甚者,mDNA研究顯示在歐洲人的基因中並無參雜尼安德塔人的DNA[15]。
[编辑] 參見
人類基因組 |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | X | Y |
[编辑] 參考文獻
- ^ 1.0 1.1 International Human Genome Sequencing Consortium (2001). "Initial sequencing and analysis of the human genome.". Nature 409 (6822): 860-921. PMID 11237011. [1]
- ↑ Watson, JD, Baker TA, Bell SP, Gann A, Levine M, Losick R. (2004). “Ch9-10”, Molecular Biology of the Gene, 5th ed., Peason Benjamin Cummings; CSHL Press.
- ↑ Daniel Hartl & Elizabath W. Jones. Genetic, 6th ed., Jones and Bartlett Publishers. ISBN 0-7637-1511-5
- ↑ Nei M, Xu P, Glazko G (2001). "Estimation of divergence times from multiprotein sequences for a few mammalian species and several distantly related organisms.". Proc Natl Acad Sci U S A 98 (5): 2497-502. PMID 11226267.
- ↑ Loots G, Locksley R, Blankespoor C, Wang Z, Miller W, Rubin E, Frazer K (2000). "Identification of a coordinate regulator of interleukins 4, 13, and 5 by cross-species sequence comparisons.". Science 288 (5463): 136-40. PMID 10753117. Summary
- ↑ Meunier·Monique - Genoscope and Whitehead announce a high sequence coverage of the Tetraodon nigroviridis genome (English) Genoscope - 於2006-09-12zh-tw:造;zh-cn:采訪。
- ↑ 生命之鑰----人類基因體計畫
- ↑ "...a tiling array with 5-nucleotide resolution that mapped transcription activity along 10 human chromosomes revealed that an average of 10% of the genome (compared to the 1 to 2% represented by bona fide exons) corresponds to polyadenylated transcripts, of which more than half do not overlap with known gene locations.Claverie J (2005). "Fewer genes, more noncoding RNA.". Science 309 (5740): 1529-30. PMID 16141064.
- ↑ "...the proportion of small (50-100 bp) segments in the mammalian genome that is under (purifying) selection can be estimated to be about 5%. This proportion is much higher than can be explained by protein-coding sequences alone, implying that the genome contains many additional features (such as untranslated regions, regulatory elements, non-protein-coding genes, and chromosomal structural elements) under selection for biological function." Mouse Genome Sequencing Consortium (2002). "Initial sequencing and comparative analysis of the mouse genome.". Nature 420 (6915): 520-62. PMID 12466850.
- ↑ [2]
- ↑ Armstrong R, Cairns N, Myers D, Smith C, Lantos P, Rossor M (1996). "A comparison of beta-amyloid deposition in the medial temporal lobe in sporadic Alzheimer's disease, Down's syndrome and normal elderly brains.". Neurodegeneration 5 (1): 35-41. PMID 8731380.
- ↑ Kwak HI, Gustafson T, Metz RP, Laffin B, Schedin P, Porter WW. "Inhibition of breast cancer growth and invasion by single-minded 2s.". Carcinogenesis epub. PMID 16840439.
- ↑ "Human chromosome 2 resulted from a fusion of two ancestral chromosomes that remained separate in the chimpanzee lineage" The Chimpanzee Sequencing and Analysis Consortium (2005). "Initial sequence of the chimpanzee genome and comparison with the human genome.". Nature 437 (7055): 69-87. PMID 16136131.
"Large-scale sequencing of the chimpanzee genome is now imminent."Olson M, Varki A (2003). "Sequencing the chimpanzee genome: insights into human evolution and disease.". Nat Rev Genet 4 (1): 20-8. PMID 12509750. - ↑ "Our findings suggest that the deterioration of the olfactory repertoire occurred concomitant with the acquisition of full trichromatic color vision in primates." Gilad Y, Wiebe V, Przeworski M, Lancet D, Pääbo S (2004). "Loss of olfactory receptor genes coincides with the acquisition of full trichromatic vision in primates.". PLoS Biol 2 (1): E5. PMID 14737185.
- ↑ Sykes·Bryan (2003-10-09) - Mitochondrial DNA and human history (English) The Human Genome - 於2006-09-19zh-tw:造;zh-cn:采訪。
- Lindblad-Toh K, et. al. (2005). "Genome sequence, comparative analysis and haplotype structure of the domestic dog.". Nature 438 (7069): 803-19. PMID 16341006.
[编辑] 外部連結
- The National Human Genome Research Institute
- National Library of Medicine human genome viewer .
- UCSC Genome Browser.
- Human Genome Project.
- Sabancı University School of Languages Podcasts What makes us different from chimpanzees? by Andrew Berry (MP3 file)
- The National Office of Public Health Genomics