DNA-Sequenz
aus Wikipedia, der freien Enzyklopädie
Als DNA-Sequenz oder Nukleotid-Sequenz wird in der Genetik die Abfolge der Nukleotide eines DNA-Moleküls bezeichnet. Für die vier Nukleotide Adenin, Guanin, Thymin und Cytosin werden die Symbole A, G, T und C verwendet.
Eine DNA-Sequenz wird durch DNA-Sequenzierung ermittelt und in einer festgelegten Richtung gelesen: Sie wird konventionell vom 5'-Ende zum 3'-Ende des kodierenden Stranges aufgeschrieben, also in der selben Richtung, in der sich Polymerasen über den Strang bewegen.
Ermittelte DNA-Sequenzen werden unter anderem in großen öffentlichen Genom-Datenbanken wie z. B. GenBank gespeichert.
Aufgrund der Darstellung als Symbolfolge lässt sich die DNA statistisch gut untersuchen. Es kann beispielsweise die Häufigkeit so genannter n-Tupel, d. h. das Vorkommen von Teilwörtern der Länge n untersucht werden. So taucht im menschlichen Genom im Mittel die Folge "CG" deutlich seltener auf als alle anderen 2er-Wörter. Die lokalen Häufigkeitsverteilungen verschiedener Nukleotidwörter können erste Hinweise auf die Funktionen bestimmter DNA-Abschnitte geben (CpG-Inseln, Stoppcodons, Sequenzenden von Introns).
RNA-Sequenzen werden in ähnlicher Weise dargestellt, die Nukleinbase Thymin ist hier allerdings durch Uracil ersetzt. Daher setzen sich RNA-Sequenzen aus den Symbolen G,C,A, und U zusammen.
Siehe auch: