Mr Jacques Van Helden,
Bioinformaticien

Interview réalisée en mai 2009

Directeur du service de "Bioinformatique des Génomes et des Réseaux" à l'ULB. 

Comment définirez-vous la bioinformatique ?

Voici une définition synthétique : développement et utilisation de méthodes informatiques pour l’analyse de données biologiques, avec un accent particulier sur le niveau de description moléculaire. La bioinformatique inclut traditionnellement (durant les années 1980-1990) l’analyse de structures tridimensionnelles de macromolécules, l’analyse de séquences. A la fin des années 1990, les projets de séquençage des génomes ont suscité un besoin croissant en bioinformatique. Les champs d’application et les méthodes se sont rapidement étendues au début du millénaire, avec notamment :

  • l’analyse des données du transcriptome, qui requiert des méthodes avancées de statistiques multivariées (clusering, sélection de variable, classification supervisée, visualisation) ;
  • l’analyse des réseaux d’interactions moléculaires (protéomique, voies métaboliques, réseaux de régulation) comportant des milliers d’entités et des dizaines de milliers d’interactions, qui fait appel à des méthodes de théorie des graphes ;
  • la modélisation des systèmes dynamiques. Ce domaine pré-existait sous divers noms (biologie théorique, biologie mathématique) et a été phagocyté par les bioinformaticiens, qui lui ont attribué le nom sexy de "systems biology" (appellation que je trouve vide de sens, la biologie implique par essence l’étude de systèmes).

Est-ce une science récente ?

Les articles fondateurs datent de la fin des années 1970, début des années 1980. La bioinformatique au sens d’analyse de séquences (définition "traditionnelle") a connu son plein essor au début des années 1990. Son extension à la génomique et à l’analyse des données à haut débit (transciptome, protéome, interactome) remonte au tournant du millénaire.
En 2007-2008, plusieurs nouvelles méthodes de séquençage ont été publiées, qui font que la vitesse de séquençage fait un bond qualitatif. Pour la première fois, les biologistes ont la possibilité de générer des données à un rythme que ne couvrira pas l’augmentation des capacités des ordinateurs. On peut donc s’attendre à ce que les besoins continuent à augmenter.

Quel a été votre parcours scolaire ?

Secondaires option latin-mathématiques, puis sciences de l'ingénieur orientation bioingénieur à l'Université. J'ai ensuite fait un doctorat avec pour thèse "la génétique du développement de la drosophile".

Quel a été votre parcours professionnel ?

1996 : post-doctorat à Montpellier, implémentation de méthodes d’analyse d’images microscopiques (mesures de la fluorescence dans les tissus et cellules de drosophile).
1997 : post-doctorat au Mexique, dans le laboratoire de Julio Collado-Vides, où j’ai commencé à développer des algorithmes pour le décryptage des séquences génomiques non-codantes.
1998-1999 : post-doctorat à l’Institut Européen de Bioinformatique (Grande-Bretagne), dans le groupe de Shoshana Wodak : développement d’une base de données regroupant les voies métaboliques et leur régulation, et implémentation d’algorithmes d’analyse des réseaux métaboliques (applications de la théorie des graphes).
1999-2002 : post-doctorat à l’ULB dans le groupe de Shoshana Wodak. Poursuite de mes recherches entreprises au Mexique (analyse des séquences régulatrices) et à l’EBI (analyse des voies métaboliques).
Depuis 2003 : chargé de cours à l’ULB.
Depuis 2006 : directeur du service de Bioinformatique des Génomes et des Réseaux (BiGRe).

Pourquoi vous êtes vous tourné vers la bioinformatique ?

La bioinformatique me permet d’appliquer les approches qui m’amusent (mathématiques, statistiques, informatique) pour répondre à des questions passionnantes concernant le fonctionnement et l’évolution des organismes vivants.

Quelles sont les connaissances de base que doit connaître tout bon bioinformaticien ?

La bioinformatique demande par essence une double compétence en biologie (pour comprendre les questions qu’on étudie) et en informatique (pour maîtriser les outils qu’on utilise). Il ne faut pas non plus négliger que le domaine consiste essentiellement à analyser des données massives, et qu’on est donc amené de façon incontournable à utiliser des méthodes statistiques.

Pouvez-vous nous donner des applications concrètes de la bioinformatique ?

  • Analyse de l’évolution à partir des séquences génomiques et protéiques (phylogénie moléculaire) ;
  • analyse du fonctionnement des organismes, de la régulation génétique, et de leurs interactions avec leur milieu (analyse des voies métaboliques, réseaux d’interactions moléculaires) 
  • analyse des relations entre la structure des protéines et leur fonction ;
  • analyse des systèmes

Celles-ci sont pour moi des applications concrètes. Voici maintenant quelques applications commerciales :

  • caractérisation de protéines-cibles pour l’industrie pharmaceutique. Ceci combine les méthodes d’analyse de séquences et de structure tridimensionnelle des protéines ;
  • diagnostic et pronostic de diverses maladies, y compris le cancer à partir de données de génomes (profils de "Single-nucleotide polymorphism") ou des profils d’expression de l’ensemble des gènes (transcriptome) ;
  • identification de cibles thérapeutiques par modélisation des systèmes dynamiques et prédiction des changements dans leurs comportements suite à l’application de traitements.

Dans quels types d’entreprises peuvent postuler les bioinformaticiens ?

Les  entreprises pharmaceutiques, les petites compagnies de biotechnologie  ou encore d'autres petites entreprises développant et commercialisant des outils bioinformatiques.

Quelle vision de la bioinformatique avez-vous et quelles sont les perspectives d’avenir dans le secteur ?

La bioinformatique pose des défis formidables à la fois concernant son contenu (elle devient incontournable pour aborder toutes les grandes questions de la biologie) et par ses méthodes (de par l’explosion des données, la bioinformatique pose de nouveaux défis aux informaticiens, mathématiciens, statisticiens).

Quels conseils donneriez-vous à une personne désireuse de devenir bioinformaticienne ? 

Choisissez des sujets qui vous passionnent et apprenez à maîtriser toutes les composantes nécessaires pour devenir excellent dans ces sujets (maîtriser l’outil informatique, les concepts mathématiques, et l’interprétation biologique).

Quelle filière selon vous est la plus indiquée pour devenir bioinformaticien ?

Historiquement, les  "papas" de la bioinformatique proviennent de formations très diverses. On trouve des biologistes,  biochimistes,  physiciens,  mathématiciens, bioingénieurs, etc.
A l’époque où j’ai commencé mes études, il n’existait pas de formation en bioinformatique. La formation d’ingénieur agronome était assez idéale car elle incluait à la fois une bonne formation en biologie et en maths/stats (plus une initiation à l’informatique). Entre 2000 et 2007, nous avons organisé en Belgique francophone un DEA/DES inter-universitaire en bioinformatique et modélisation, qui a accueilli des étudiants de formations très diverses (biologistes, informaticiens, physiciens, etc.). Cette formation a fourni d’excellents résultats, en permettant à ces étudiants d’acquérir les concepts complémentaires à ceux de leur formation initiale. Ce DEA/DES impliquait des enseignants de toutes les universités francophones de Belgique (avec une participation majoritaire de l’ULB et des FUNDP).
Depuis septembre 2007, il existe un master en Bioinformatique et modélisation. Il s’agit d’un master "orphelin", c’est-à-dire qu’il n’existe pas de bachelier correspondant, mais il est ouvert aux porteurs d’un diplôme de bachelier de transition en sciences biologiques, sciences chimiques, sciences informatiques ou encore en s'adressant directement au service administratif de l'Université.

 
SIEP.be, Service d'Information sur les Études et les Professions.