GC-Gehalt
aus Wikipedia, der freien Enzyklopädie
Der GC-Gehalt ist ein Merkmal von DNA-Molekülen und gibt den Anteil der DNA-Basen Guanin und Cytosin an der Gesamtheit der Basen (Guanin, Cytosin, Adenin und Thymin) in Prozent an.
- Es gilt: GC-Gehalt = (G+C)/(G+C+A+T) · 100%
- Einem GC-Gehalt von beispielsweise 64% entspricht somit ein AT-Gehalt von 36%.
Inhaltsverzeichnis |
[Bearbeiten] GC-Gehalt und Stabilität der DNA-Doppelhelix
Die jeweils komplementären Basen A-T und G-C sind im doppelsträngigen DNA-Molekül über Wasserstoffbrücken miteinander verbunden. Die Adenin-Thymin-Paare bilden stets zwei Wasserstoffbrücken aus, Guanin-Cytosin-Paare drei. Durch Erhitzen der DNA werden die Wasserstoffbrücken gelöst, so dass sich die beiden Stränge der DNA-Doppelhelix voneinander trennen (Denaturierung). Je höher der Anteil der Guanin-Cytosin-Paare ist, desto mehr Wasserstoffbrücken müssen gelöst werden und desto höher ist die Energie, die für die Denaturierung des Doppelstranges aufgebracht werden muss. GC-reiche DNA-Abschnitte sind deshalb thermodynamisch stabiler als AT-reiche.
[Bearbeiten] Bestimmung des GC-Gehaltes
Der GC-Gehalt unbekannter DNA-Moleküle kann experimentell mit verschiedenen Methoden bestimmt werden. Der einfachste Weg ist, die so genannte "Schmelztemperatur" der DNA-Doppelhelix mit Hilfe eines Fotometers zu messen: DNA absorbiert ultraviolettes Licht einer Wellenlänge von 260 nm. Denaturiert ("schmilzt") der Doppelstrang beim Erhitzen in zwei Einzelstränge, steigt die Lichtabsorption um etwa 40%. Diesen Effekt bezeichnet man als Hyperchromizität.
Die Schmelztemperatur Tm eines DNA-Doppelstranges ist dirkekt abhängig von dessen GC-Gehalt und definiert als die Temperatur, bei der 50% der Doppelhelix in denaturiertem Zustand (also einzelsträngig) vorliegen. Aus der fotometrisch bestimmten Schmelztemperatur kann der GC-Gehalt mit der empirischen Formel (Tm – 53,9) x 2,44 errechnet werden.
Wesentlich genauer ist die Bestimmung des GC-Gehaltes mit Hilfe der Gaschromatografie. Ist die Sequenz des DNA-Moleküles hingegen bekannt, kann der GC-Gehalt einfach mit der oberen Formel berechnet werden.
[Bearbeiten] GC-Gehalt und Taxonomie
Der GC-Gehalt im Genom wird als taxonomisches Merkmal zur Einteilung der Organismen, insbesondere von Bakterien verwendet. Die Werte reichen hier von ca. 20% bis fast 80%. Bakterien mit hohem GC-Gehalt findet man vor allem unter den Actinobacteria, aber auch Deltaproteobakterien wie Myxobakterien sind GC-reich. Thermophile Organismen weisen ebenfalls erhöhte GC-Gehalte auf, was sicher auf die größere Stabilität der G-C-Basenpaarung zurückzuführen ist.
GC-Gehalte einiger Modellorganismen:
Art | Phylogenetische Gruppe | GC-Gehalt |
---|---|---|
Streptomyces coelicolor Myxococcus xanthus Halobacterium sp. Saccharomyces cerevisiae (Bäckerhefe) Arabidopsis thaliana (Ackerschmalwand) Methanosphaera stadtmanae Plasmodium falciparum (Malariaerreger) |
Actinobacterium Deltaproteobakterium Archaeon Ascomycet (Pilz) Blütenpflanze Archaeon Protozoon |
72% 68% 67% 38% 36% 27% ~20% |
Aufgrund der Struktur des genetischen Codes ist es für einen Organismus praktisch unmöglich, sein Genom ausschließlich aus zwei Basen (G-C oder A-T) aufzubauen und damit einen GC-Gehalt von 100% oder 0% zu erreichen. Die Anzahl möglicher Codons reicht nicht aus, um alle Aminosäuren in einem Zwei-Basen-Code zu verschlüsseln.
[Bearbeiten] GC-Gehalte einzelner DNA-Abschnitte
Der Anteil der Basenpaare GC und AT variiert aber auch innerhalb eines Genomes.
AT-reiche (und daher GC-arme) Regionen findet man im Genom häufig an den Stellen, an denen die Doppelhelix leicht auflösbar sein muss, zum Beispiel an den Punkten, an denen die Replikation des DNA-Moleküls beginnt. Auch in menschlichen Chromosomen existieren Regionen mit GC-Gehalten, die deutlich von 50% abweichen. Diese Abschnitte sind meist in die Aufrechterhaltung der räumlichen Struktur der Chromosomen einbezogen.
Außerdem ist der GC-Gehalt in den DNA-Abschnitten, die für ein Gen codieren oft höher, als in anderen Regionen (zum Beispiel Introns, regulatorische Sequenzen). Diese Eigenschaft nutzt man aus, um in sequenzierten Genomen nach den eigentlichen Genen zu suchen: Genomsequenzen bestehen zunächst ausschließlich aus einer Abfolge von Millionen Basen. Die Annotation der eigentlichen Gene (das heißt, deren Start- und Endpunkt im Genom) erfolgt mit Hilfe von Computerprogrammen (z.B. GLIMMER), die GC-reiche Abschnitte finden und als mögliche Gene identifizieren.
Stößt man beim Studium eines Organismus auf funktionelle Gene, deren GC-gehalt deutlich von dem der übrigen Gene abweicht, wird dies häufig als Hinweis darauf gewertet, dass diese Gene erst kürzlich durch horizontalen Gentransfer erworben wurden oder von einem Retrovirus stammen.