Reflexions, le site de vulgarisation de l'Université de Liège


Génétique de la floraison : une nouvelle base de données

02/02/2016

La base de données conçue par le laboratoire de physiologie végétale de l’Université de Liège est un outil pédagogique mais aussi une précieuse base de travail pour les chercheurs, dans un domaine où les connaissances sont soumises à une croissance exponentielle. Elle est constituée de   snapshots (schémas d’ensemble) entièrement « cliquables » pour accéder à l'information sous-jacente. Le site fournit également l’ensemble des références des articles scientifiques (1646 à ce jour !) ayant permis d’établir ces données, avec des liens directs vers les publications.

Le laboratoire de Physiologie végétale de l’ULg est spécialisé dans l’étude de la floraison depuis plusieurs décennies. « Notre alimentation est basée en grande partie sur la disponibilité de fruits. Pensez à la farine, obtenue de grains de blé. Le grain de blé, c’est un fruit. Or s’il n’y a pas de floraison, il n’y a pas de fruit », rappelle par exemple le Pr Claire Périlleux, directrice de ce laboratoire. Si la floraison conditionne au premier degré l’alimentation humaine, le contrôle que l’on peut faire de ce processus est tout aussi important. « Si une salade fleurit, elle n’est plus commercialisable», explique la chercheuse. De par son rôle central dans le maintien et l’évolution des espèces végétales, la floraison, à la base de la reproduction, est aussi au cœur des enjeux de la biodiversité.

« C’est à partir des années 1990 que le domaine de la floraison a été investigué d’un point de vue génétique autour du modèle Arabidopsis thaliana», poursuit le Pr Claire Périlleux. Surnommée « souris blanche de la biologie végétale », cette plante a vu son génome entièrement séquencé en l’an 2000. Elle sert désormais de porte d’entrée pour l’ensemble des recherches en génétique de la floraison. « Une découverte fondamentale faite chez cette espèce ouvre souvent la porte à des découvertes tout aussi fondamentales chez d’autres espèces. Beaucoup d’équipes asiatiques travaillent par exemple sur le riz. Or, jusqu’à présent, la plupart des données à propos d’Arabidopsis thaliana ont permis d’avancer dans la connaissance de la floraison du riz. Mais cela est aussi vrai pour la tomate, la pomme de terre, etc. » (Lire: Le cocktail de la floraison )

Arabidopsis thaliana

1646 articles en quelques clics

Au fil des années, les connaissances en génétique de la floraison ont connu, grâce à ce modèle clef, une croissance exponentielle. « Pour les personnes qui débutent dans le domaine, le sujet est devenu très complexe à aborder. Plusieurs fois par an, des chercheurs écrivent des reviews. Nous utilisons aussi de plus en plus des représentations graphiques – des schémas récapitulatifs appelés "snapshots" – pour mieux visualiser l’ensemble de cette masse de données », explique le Pr Claire Périlleux. Pendant son doctorat au sein du laboratoire de Physiologie végétale, Frédéric Bouché, confronté à ce problème de gestion de l’information – et par ailleurs passionné d’informatique et de graphisme –, a ainsi mis sur pied sa propre base de données. « Nous nous sommes rendus compte que ce qu’il faisait pouvait être d’une grande utilité, non seulement pour les chercheurs du laboratoire qui n’avaient pas cette facilité à gérer et à représenter la littérature mais aussi pour le reste de la communauté scientifique », explique Claire Périlleux. Frédéric Bouché rencontre alorsGuillaume Lobet, post-doctorant FNRS, également passionné de nouvelles technologies. Ensemble, ils décident de transformer cette base de données en un site internet baptisé « Flowering Interactive Database » [FLOR-ID]. « Cette base de données contient quelque 1646 articles scientifiques. Le format interactif permet d’accéder facilement à l’information. »

Les snapshots sont ici entièrement « cliquables », tant au niveau des gènes répertoriés que des lignes qui montrent les interactions entre ces gènes. Le site fournit également l’ensemble des références des articles scientifiques ayant permis d’établir ces données, avec des liens directs vers les publications. « Nous veillons à ce que les informations soient faciles à extraire, pour que les chercheurs puissent les réutiliser dans leurs propres analyses et présentations. Cela permet de gagner un temps précieux », explique Guillaume Lobet. « Il est aussi possible d'interroger la base de données sur tel ou tel gène spécifique », ajoute Claire Périlleux. Ces différentes portes d’entrées et niveaux de complexité permettent un usage « à la carte », depuis l’étudiant jusqu’au chercheur confirmé. « Nous proposons une information déjà digérée mais pour autant, cela ne dispense pas le lecteur de toute réflexion », précise le Pr Périlleux. Il est même permis de penser que ces raccourcis vers la connaissance laissent davantage de temps et de disponibilité pour la recherche dans ce qu’elle a de plus inventif.

L’open access en question

« Rendre l’information publique fait partie de notre métier », estime Guillaume Lobet. « Nous ne sommes pas des éditeurs ; nous sommes payés par les pouvoirs publics et, mis à part le fait que si nous ne rendons par l’information publique, nous n’en récoltons pas les lauriers, nous avons le devoir de le faire. Par ailleurs, la matière première est publique. On ne divulgue rien. Ce qui est partagé, c’est l’effort intellectuel de la compilation».

Publié récemment dans le journal Nucleic Acids Research, l’article (1) relatif à FLOR-ID devrait permettre à ce dispositif innovant de se faire connaître de la communauté scientifique. « Il reste très difficile de valoriser une initiative gratuite de mise à disposition de l’information. Cette revue de littérature ne se soumet pas à un journal comme d’autres revues de littérature. C’est un format que beaucoup ne sont pas encore prêts à accueillir. Nous avons donc publié ce papier à l’occasion d’une édition consacrée aux bases de données. Et l’article a été très bien reçu », commente Claire Périlleux.

FLORID

Dans un domaine où de nouveaux articles paraissent tous les mois, FLOR-ID se distingue surtout par son caractère évolutif. À tout moment, chaque visiteur peut soumettre, via un formulaire en ligne, de nouvelles informations. Celles-ci sont alors vérifiées, puis intégrées. « Ce système nous permet de ne pas devoir produire à chaque fois un nouveau schéma. La curation manuelle – nous vérifions nous-mêmes chaque information soumise – assure par ailleurs une grande fiabilité », précise Guillaume Lobet.

Une telle base de données, ouverte et évolutive, n’est évidemment pas sans poser la question de la gratuité. « Dans le contexte actuel de la recherche, où les laboratoires fonctionnent avec des fonds limités, rendre ces bases de données accessibles à tous est essentiel », estime Frédéric Bouché. Mais pour les bases de données qui requièrent un travail de curation conséquent et l’utilisation de puissants serveurs informatiques, la souscription payante semble parfois incontournable. Frédéric Bouché donne en exemple la base de données TAIR (The Arabidopsis Information Resource) qui, avec un budget de fonctionnement annuel de 1,6 million de dollars, a opté, suite à l’arrêt de ses subsides, pour une solution intermédiaire : l’accès payant aux données publiées dans le courant de l'année écoulée. « En tant qu’universitaires, nous ne sommes pas dans une logique économique. Néanmoins, à un certain stade de développement, la question pourrait se poser pour FLOR-ID, par exemple s’il fallait engager quelqu’un pour la maintenir à jour. C’était aussi une exigence de Nucleic Acids Research : que la base de données soit maintenue cinq ans après la publication.  C’est évidemment ce que nous souhaitons mais cela amènera en effet d’autres questions », expliquent les chercheurs.

Enfin, la pérennisation du projet suppose la collaboration avec d’autres équipes spécialisées dans la génétique du monde végétal. « La génétique de la floraison connaît de nombreux développements mais on pourrait imaginer le même type de support pour les gènes impliqués dans la fécondité, la formation du pollen, etc. L’idéal serait de faire grossir cette base de données de manière connexe car on sait qu’il existe des initiatives de ce type, mais les laboratoires ne les rendent pas nécessairement publiques. Rendre un support "users friendly" exige en effet des efforts supplémentaires », explique le Pr Claire Périlleux. Avec l’apparition de ces nouveaux outils, la problématique du partage des connaissances, au sein et en dehors de la communauté scientifique, est plus que jamais centrale.

(1) FLOR-ID: an interactive database of flowering-time gene networks in Arabidopsis thaliana, in Nucleic Acids Research.    


© Universit� de Li�ge - https://www.reflexions.uliege.be/cms/c_409421/fr/genetique-de-la-floraison-une-nouvelle-base-de-donnees?printView=true - 29 mars 2024