Reflexions, le site de vulgarisation de l'Université de Liège


Démêler la structure 3D des protéines

14/10/2013

À l’heure actuelle, il est encore difficile et coûteux d’obtenir une représentation de la structure tridimensionnelle des protéines. Or celle-ci est intimement liée à leur fonction. C’est pourquoi les scientifiques tentent de développer des approches informatiques pour réaliser des prédictions, nettement plus rapides, permettant d’acquérir certains indices sur les propriétés des protéines.
Julien Becker, Francis Maes et Louis Wehenkel utilisent ainsi l’apprentissage automatique pour prédire la formation des ponts disulfures (liaisons qui se forment entre les atomes de souffre de deux acides aminés appelés cystéines) présents au sein d’une protéine. Leurs travaux ont ainsi mené à la création d’un prédicteur, appelé x3CysBridges, permettant de calculer la probabilité que les cystéines d’une même protéine forment des ponts disulfures. Un prédicteur que la communauté scientifique internationale commence déjà à utiliser…

structure proteineMacromolécules aux fonctions variées au sein de la cellule ou de l’organisme, les protéines sont essentielles à toute forme de vie. Elles sont constituées d’une ou plusieurs chaînes d’acides aminés qui, selon leur séquence et leurs interactions, donnent à chaque protéine une structure tridimensionnelle particulière. Celle-ci est intimement liée à la fonction de la protéine.

De la simple séquence d’acides aminés à sa conformation finale, la macromolécule passe par quatre niveaux de structuration appelés structures primaire, secondaire, tertiaire et quaternaire. Au fil de ces étapes, la protéine se replie de sorte à adopter une structure tridimensionnelle stable qui lui permettra de remplir correctement sa mission. Elle peut alors prendre deux grands types de conformation : en hélice ou en feuillet.

Lorsque des protéines ont une séquence d’acides aminés similaire, elles auront tendance à avoir une structure 3D proche. Mais il arrive également que deux protéines aux séquences identiques aient une structure tridimensionnelle, et donc une fonction, différente selon le solvant ou l’environnement dans lequel on les trouve. En effet, les protéines interagissent avec d’autres éléments de leur milieu qui influencent ainsi leur conformation finale.

Des ponts pour stabiliser la protéine

De manière générale, différents types d’interactions, à la fois entre les acides aminés et entre ceux-ci et leur environnement, permettent de stabiliser la structure des protéines. Parmi ces interactions on compte les liaisons covalentes, et plus particulièrement les ponts disulfures. Ces liaisons se forment, par oxydation, entre les atomes de souffre de deux acides aminés appelés cystéines. « On trouve des ponts disulfures surtout au niveau des protéines extracellulaires, qui sont excrétées, ou au niveau des membranes car cela permet de les stabiliser », explique Julien Becker, doctorant sous la supervision du Pr. Louis Wehenkel à l’Unité de recherche Systèmes et Modélisation du GIGA. « Au sein de la cellule, l’environnement est plutôt stable et donc il y a moins besoin de stabiliser davantage les protéines », poursuit-il. À titre d’exemple, on trouve des ponts disulfures dans les protéines du venin de serpent ou de scorpion, dans les anticorps produits par le système immunitaire, dans l’insuline -hormone qui régule la concentration de sucre dans le sang - et dans bien d’autres protéines.

« Obtenir une représentation 3D d’une protéine est difficile et très coûteux », indique Julien Becker. « Pour de nombreuses protéines ce n’est actuellement pas possible et pour celles pour lesquelles on y arrive, il faut utiliser des méthodes comme la cristallographie par rayon X ou la spectroscopie par résonance magnétique nucléaire », continue le chercheur. C’est pourquoi les scientifiques tentent de développer des approches informatiques pour réaliser des prédictions, nettement plus rapides, permettant d’acquérir certains indices sur les propriétés des protéines. C’est précisément le domaine de recherche de Julien Becker et Louis Wehenkel. « Le graal dans le domaine serait de pouvoir prédire la structure 3D des protéines », précise Julien Becker.

Vers un prédicteur de structure 3D

Face à l’énorme challenge d’un jour pouvoir prédire la structure tridimensionnelle des protéines grâce à l’informatique, les chercheurs doivent d’abord attaquer le problème par des approches plus simples. « Cela fait environ trente ans qu’on utilise l’informatique pour prédire les propriétés des protéines. Au début on regardait simplement la constitution en acides aminés et on essayait de voir s’il s’agissait plutôt de résidus solubles ou non solubles », explique Julien Becker. « Aujourd’hui on utilise de plus en plus l’apprentissage automatique où on travaille avec des milliers de protéines que l’on tente de caractériser via des approches mathématiques », continue le jeune chercheur. L’apprentissage automatique ou apprentissage supervisé est une technique qui permet de produire automatiquement des règles à partir de bases de données d’apprentissage contenant des exemples, des cas déjà traités et validés.  « Si on prend l’exemple d’une base de données comprenant des images de voitures, de camions et de vélos. Ces images sont annotées afin de savoir quelle image appartient à quelle catégorie », indique Julien Becker. « On donne cela à un algorithme qui va chercher des patrons, des formes similaires. Une fois que le modèle est appris, on lui soumet de nouvelles images qu’il pourra automatiquement classer dans la bonne catégorie ».


PredicteurEn ce qui concerne les protéines, les scientifiques attribuent des valeurs aux différentes propriétés qu’ils désirent prédire telles que l’accessibilité des résidus, la structure secondaire en hélice ou en feuillet, etc. En général, les chercheurs tentent de générer un prédicteur par type de propriété. « Mon idée était de combiner tout ça en un seul prédicteur et pour ce faire j’ai attaqué des problèmes un peu plus compliqués comme les ponts disulfures », explique le doctorant. « Ici la difficulté est de prédire une propriété non pas pour un seul résidu mais pour une paire de résidus ».

Calculer la probabilité de formation des ponts disulfures

PT proteine prediction

Les cystéines sont les seuls résidus à pouvoir former des ponts entre eux. « La structure 3D de la protéine va être fortement contrainte par ces liaisons. Et donc en cherchant les cystéines qui se connectent entre elles, on peut déjà avoir une bonne idée de la conformation de la protéine », poursuit Julien Becker.  Le tout était donc de trouver le moyen de prédire la formation des ponts disulfures entre les différentes cystéines présentes au sein d’une protéine. « En apprentissage, on essaye de représenter chaque objet, ici les paires de cystéines, sous forme d’un vecteur de valeur numériques qui varient entre 0 et 1 », précise le scientifique. « Mon approche vise à utiliser une série de manières de représenter une paire de résidus et de voir lesquelles sont les plus pertinentes pour prédire les ponts disulfures », poursuit-il. Julien Becker a ainsi tenu compte de critères tels que la longueur de la protéine (c.-à-d., le nombre de résidus), le nombre de cystéines, leur position relative, etc.  Il a ensuite développé un algorithme qui sélectionne les meilleures descriptions jusqu’à ce qu’ajouter une description n’apporte plus rien au prédicteur. « Avant d’appliquer cet algorithme, nous avons testé trois grandes familles de machines d’apprentissage afin de sélectionner celles qui fonctionnent le mieux pour appliquer notre algorithme », précise Julien Becker.

Les régions désordonnées des protéines, un nouveau défi…

Les travaux de Julien Becker ont mené à la création d’un prédicteur, appelé x3CysBridges, permettant de calculer la probabilité que les cystéines d’une même protéine forment des ponts disulfures. Le principe est simple, les chercheurs intéressés par cet outil entrent la séquence d’acides aminés qu’ils désirent tester et le prédicteur effectue les calculs nécessaires. Ensuite les chercheurs sont informés de la réponse du prédicteur, c’est-à-dire quelles cystéines forment des ponts, par email. Les résultats de ces travaux sont publiés dans la revue PLoS ONE (1). « Nous avons déjà eu quelques requêtes de biologistes qui ont utilisé ce service », indique Julien Becker.

Aujourd’hui le chercheur s’attaque à un nouveau défi : « Je suis en train de réutiliser cette méthode pour faire de l’apprentissage sur les régions désordonnées », explique-t-il. Au sein d’une protéine, on retrouve des régions dites ordonnées dont la structure 3D est stable mais également des régions désordonnées où il y a beaucoup de variabilité. Ces morceaux de protéine n’adoptent pas une structure stable et sont en général utilisés pour « attraper » des métabolites au sein ou en dehors de la cellule. « C’est le même type d’étude que pour les ponts disulfures. J’essaye d’apprendre une représentation, sous forme de valeur numériques, de chacun des résidus de la protéine pour construire un prédicteur de régions désordonnées », explique Julien Beckers. Petit à petit et de prédicteurs en prédicteurs, le jeune scientifique poursuit donc son objectif vers un outil automatique unique permettant de prédire la structure 3D des protéines…

(1) Becker J, Maes F, Wehenkel L. On the relevance of sophisticated structural annotations for disulfide connectivity pattern prediction. PLoS One. 2013;8(2):e56621. doi: 10.1371/journal.pone.0056621. Epub 2013 Feb 15.


© Universit� de Li�ge - https://www.reflexions.uliege.be/cms/c_352385/fr/demeler-la-structure-3d-des-proteines?printView=true - 26 avril 2024