Alignement des séquences d’ADN déterminées

Les séquences déterminées correspondent à une multitude de fragments issus de la molécule d'ADN initiale. L'assemblage de ces séquences « courtes » et aléatoires (petits traits multicolores) se fait en utilisant leurs zones de chevauchement (schématisées par des « boîtes » sur quatre bases). On reconstitue ainsi la totalité ou presque de la séquence initiale (grand trait gris). Lorsqu'on dispose d'un génome de référence (c'est-à-dire déjà déterminé), l'alignement de ces « petites » lectures (reads) de séquences (traits gris) entre elles se fait également et surtout vis-à-vis de celui-ci, définissant ainsi la couverture. En effet, certaines zones ne seront pas obtenues, car non couvertes par des séquences (zones blanches entre les flèches) et la séquence de l'échantillon analysé ne sera donc pas connue à ces positions. La couverture de séquences obtenues s'apprécie donc en pourcentage de la séquence initiale de référence. La profondeur de lecture (base lue X fois via X séquences) permet d'estimer la fiabilité dans la lecture de chaque base et ainsi dans la détection de variants. Un minimum de profondeur est nécessaire pour sécuriser la sureté de l’information.

Encyclopædia Universalis France - Conditions d'utilisation