STRUCTURE EXONS-INTRONS DES GÈNES
La découverte en 1978 de la structure discontinue des gènes marque une étape importante dans l’histoire de la génétique. Auparavant, on avait démontré que la mémoire génétique d’un organisme était inscrite dans son ADN et plus précisément codée par la suite linéaire de ses molécules constitutives, les nucléotides : un gène codant pour une protéine était donc réductible à une séquence de nucléotides. Implicitement, on avait admis que tout l’ADN était codant.
Cette notion, qui paraissait aller de soi au moins pour les bactéries, organismes modèles des biologistes moléculaires à l’époque, va brusquement être remise en cause avec l’étude des gènes d’organismes non microbiens. Le mois de novembre 1977 voit la publication d’une note préliminaire – suivie d’une série d’articles en 1978, issus du laboratoire de Pierre Chambon à Strasbourg – qui montre que le gène d’une protéine du blanc d’œuf de la poule, l’ovalbumine, contient des séquences dont on ne retrouve pas le correspondant dans la protéine. En 1978, on assiste ainsi à la véritable naissance de la notion de gènes (en) mosaïque (split genes) – ou gènes en morceaux – principalement sous l’impulsion de l’équipe de Chambon. Pour simplifier, nous dirons que le gène de l’ovalbumine contient des séquences codantes, les exons (contraction d’expressedregion), séparées les unes des autres par des séquences non codantes, les introns (contraction d’intragenicregion). Le gène correspond donc à une somme d’exons et d'introns. Il est transcrit intégralement en ARN pré-messager puis les introns sont éliminés par un processus qui couple coupure et raboutage des exons entre eux (épissage). L’ARN messager final qui résulte de l’opération est ensuite traduit en protéines. Pendant la même année 1978, ce résultat est confirmé chez les adénovirus par le groupe de Phillip Sharp, puis généralisé : tous les gènes des organismes eucaryotes ne sont pas en mosaïque, mais beaucoup le sont. Les gènes en mosaïque n’existent pas chez les bactéries vraies (alors qu’il y en a chez les archées).
Les introns peuvent allonger de façon considérable un gène alors que la protéine produite est de taille moyenne : c’est le cas du gène de la dystrophine (protéine essentielle à l’architecture cellulaire et dont l’anomalie entraîne la myopathie de Duchenne), qui possède 79 exons ne totalisant que 14 000 nucléotides alors que le gène tout entier est long de 2,4 millions de nucléotides.
Pourquoi cette organisation a-t-elle été sélectionnée au cours de l’évolution des eucaryotes ? Certains introns possèdent des éléments de contrôle de l’expression des gènes. On peut également à partir d’un seul gène produire plusieurs protéines grâce à l’élimination d’un exon pendant la maturation de l’ARN pré-messager (épissage alternatif). Mais le plus important est sans doute que, en raison de cette séparation des séquences codantes par des séquences non codantes, la production de gènes « bricolés » en empruntant des exons à d’autres gènes, et codant ainsi pour des protéines « composites », se trouve facilitée. Comme un exon code en général pour une partie de protéine (domaine) dotée d’une fonction précise (reconnaissance d’autres protéines, de sucres, de capacité d’activité enzymatique, etc.), on conçoit que l’évolution peut fabriquer et sélectionner à peu de frais des protéines issues de l’addition de plusieurs exons provenant de plusieurs autres gènes. Ce phénomène a été observé dans de nombreuses protéines. Ce brassage des exons (exon shuffling) est ainsi un moteur essentiel de la diversification et de l’évolution des protéines.
La suite de cet article est accessible aux abonnés
- Des contenus variés, complets et fiables
- Accessible sur tous les écrans
- Pas de publicité
Déjà abonné ? Se connecter
Écrit par
- Gabriel GACHELIN : chercheur en histoire des sciences, université Paris VII-Denis-Diderot, ancien chef de service à l'Institut Pasteur
Classification