Le site de vulgarisation scientifique de l’Université de Liège. ULg, Université de Liège

L’ancêtre des Eucaryotes, un organisme déjà complexe
01/06/2012

Des analyses titanesques

« En phylogénie, il est important que les séquences utilisées soient bien conservées », indique le Professeur Motte. Or ce n’est pas le cas du domaine riche en dipeptides sérine-arginine qui a valu leur nom aux protéines SR. Mais, outre ce domaine, ces protéines présentent  notamment un domaine RRM (pour RNA-recognition motif), qui est un domaine de liaison à l’ARN. Contrairement au domaine SR, celui-là présente les « qualités phylogénétiques » nécessaires. C’est donc le domaine RRM que les chercheurs ont choisi pour étudier l’histoire évolutive des protéines SR. « C’est un petit domaine, de 80-90 acides aminés, mais c’était le seul véritablement utile d’un point de vue phylogénétique », poursuit Patrick Motte.

La mission des chercheurs (Denis Baurain, Sophie Califice, Marc Hanikenne et Patrick Motte) était dès lors rien de moins que d’identifier et étudier toutes les protéines à RRM au sein des protéomes de plus de 200 organismes! Et ce tant chez des Procaryotes (bactéries et archées) que chez des Eucaryotes (plantes, animaux, champignons et protistes)… « Nous nous sommes alors retrouvés avec plus de 12 000 séquences différentes », précise Patrick Motte. « Cela était très difficile à gérer mais indispensable pour retracer l’évolution de ces protéines. La plupart des autres études sur le sujet ne portaient que sur quelques centaines de séquences au maximum », poursuit le scientifique.  

Afin de pouvoir analyser cette énorme quantité de données, les chercheurs ont dû mettre au point des techniques compliquées. Le Professeur Denis Baurain a notamment élaboré de nouveaux algorithmes afin de compléter les programmes informatiques déjà disponibles pour de telles analyses. « Les analyses ont nécessité des mois de calculs sur un super ordinateur et un énorme travail d’interprétation », indiquent les deux scientifiques. « Nous avons eu une double approche, automatique d’une part, avec l’utilisation d’ordinateurs pour le prétraitement des données, et manuelle d’autre part, avec un examen minutieux des résultats obtenus », poursuit Denis Baurain. Ainsi, les gigantesques arbres phylogénétiques créés par le super ordinateur sont ensuite passés sous la loupe des chercheurs à la recherche des protéines SR. Outre cette double approche, les chercheurs ont également utilisé divers modèles phylogénétiques afin d’appuyer leurs résultats. En effet, travailler sur une séquence aussi courte que le domaine RRM était un défi. « De ce fait nous avons multiplié les approches car chacune d’elles nous donnait des résultats statistiques peu certains. Mais comme toutes convergeaient vers une même tendance, cela a conforté la validité de nos résultats », explique Denis Baurain. 

Les protéines SR, une ancienne innovation !

Les résultats obtenus furent à la hauteur du travail et du temps que les chercheurs ont investi dans cette étude lancée en 2007. En effet, plusieurs conclusions importantes en ressortent et sont publiées dans le journal Plant Physiology (1). Les analyses ont révélé que les protéines SR sont présentes chez un très grand nombre d’organismes eucaryotes. Mieux encore, les sous-familles de ces protéines se retrouvent au sein de différents groupes d’Eucaryotes. « Cela signifie que ces sous-familles étaient déjà présentes chez une forme eucaryote ancestrale. Car quand on retrouve une même famille ou sous-famille de protéines chez des organismes aussi éloignés que des plantes et des animaux, soit il s’agit d’un phénomène de convergence, soit elles ont une origine commune, ce que confirme notre travail concernant les protéines SR », souligne Patrick Motte. Ainsi, une séquence ancestrale aurait évolué pour donner différentes familles et sous-familles de protéines SR qui auraient déjà été présentes chez le dernier ancêtre commun des Eucaryotes (LECA, pour Last Eukaryotic Common Ancestor). Outre l’intérêt de cette découverte pour comprendre l’histoire des protéines SR, cela signifie également que LECA avait déjà une machinerie de maturation de l’ARN très complexe et était loin de l’organisme simple que l’on avait pu s’imaginer. « De manière générale, on pense souvent que si un organisme est simple, c’est qu’il est ancien (et vice versa) mais ce n’est pas toujours le cas », indique Patrick Motte. « L’évolution ne va pas toujours dans le sens de la complexité », poursuit Denis Baurain. « La levure en est un exemple. Cet organisme ne présente pas de protéines SR. La levure a évolué en simplifiant sa machinerie de maturation de l’ARN par rapport à celle que présentait LECA et que présentent encore ses cousins actuels », précise Denis Baurain.

(1) Sophie Califice, Denis Baurain, Marc Hanikenne, and Patrick Motte. A Single Ancient Origin for Prototypical Serine/Arginine-Rich Splicing Factors. Plant Physiol. 2012 February; 158(2): 546–560.

Page : précédente 1 2 3 4 suivante

 


© 2007 ULi�ge