Principe de l’approche dite Greedy pour l’assemblage de novo de fragments d’ADN
Cette approche très intuitive de reconstruction d'une séquence d'ADN à partir de fragments est coûteuse en temps informatique, d'où son nom de Greedy, « glouton ». Prenons quatre lectures de séquences : AGAT, GATT, TTAT et TGGC. Le meilleur score de chevauchement entre toutes les paires de séquences est de 3 : il est obtenu entre les séquences AGAT et GATT qui sont assemblées. Un nouveau score de chevauchement est calculé pour sélectionner la nouvelle paire à assembler, et ainsi de suite, jusqu'à obtenir une seule séquence. (Adapté de https://data-science-sequencing.github.io/Win2018/lectures/lecture6/)
Encyclopædia Universalis France - Conditions d'utilisation