Alignement séquentiel
Un article de Wikipédia, l'encyclopédie libre.
En bioinformatique, l'alignement séquentiel est une manière de disposer les composantes (nucléotides ou acides aminés) des ADN, des ARN, ou des séquences primaires de protéines pour identifier les zones de concordance qui traduisent des similarités ou dissemblances de nature historique. Les séquences alignées sont traditionnellement représentées comme des lignes d'une matrice. Des trous sont disposés de manière à aligner les caractères communs sur des colonnes successives.
Lorsque deux séquences dans un alignement partagent un ancêtre commun, les discordances s'interprètent comme des points de mutation ou des lieux d'insertion ou de délétion.
Sommaire |
[modifier] Représentations
Les alignements sont habituellement représentés soit graphiquement soit en format texte. Dans la plupart des représentations des alignements séquentiels, les séquences sont écrites en lignes, disposées pour que les composantes communes apparaissent dans des colonnes successives. En format texte, les colonnes alignés contiennent des caractères identiques ou similaires, indiqués par un système cohérent de symboles. Un astérisque est utilisé pour montrer l'identité entre colonnes. Beaucoup de programmes utilisent de la couleur pour différencier l'information. Pour les ADN ou ARN, l'utilisation de couleur permet de différencier les nucléotides. Pour les alignements de protéines, elle permet d'indiquer les propriétés des acides aminés, ce qui aide à conclure sur la conservation du rôle d'un acide aminé substitué.
Lorsque plusieurs séquences sont mises en jeu, une dernière ligne est ajoutée pour conclure un consensus.
Les alignements séquentiels peuvent être fournis dans une large variété de formats de fichiers, dépendant par exemple du programme spécifique utilisé : FASTA format, GenBank, ... Toutefois, dans les laboratoires de recherche, l'utilisation spécifique d'outils techniques peut réduire le choix de format.
[modifier] Alignements locaux et globaux
[Image:Global-local-alignment.png|right|250px]] Les alignements globaux sont plus souvent utilisés quand les séquences mises en jeu sont similaires et de taille égale. Une technique générale, appelée algorithme de Needleman-Wunsch est basée sur la programmation dynamique.
Les alignements locaux sont plus souvent utilisés quand deux séquences dissemblables sont soupçonnées de posséder des motifs semblables malgré l'environnement. L'algorithme de Smith-Waterman est une méthode d'alignement local générale basée aussi sur la programmation dynamique.
Avec des séquences suffisamment identiques, il n'y aucune différence dans les résultats.
Des méthodes hybrides, des méthodes semi-locales, s'avèrent utiles quand ...
[modifier] Alignement par paire
Les méthodes d'alignement par paires sont utilisées pour trouver les correspondances entre deux alignements de suites mais ne demandent pas une précision extrême.
[modifier] Méthode des matrices par point
[modifier] Programmation dynamique
[modifier] Méthodes par mots
[modifier] Alignement séquentiel multiple
[modifier] Programmation dynamique
[modifier] Méthodes progressives
[modifier] Méthodes itératives
[modifier] Trouver le motif
[modifier] Techniques issues de l'informatique
[modifier] Alignement structurel
[modifier] DALI
[modifier] SSAP
[modifier] Extension combinatoire
[modifier] Analyse phylogénétique
[modifier] Références
![]() |
Portail de la biologie – Accédez aux articles de Wikipédia concernant la biologie. |