La médecine personnalisée permet aux patients de recevoir des soins de santé adaptés à leur constitution génétique unique pour un pronostic de survie optimal. Lorsqu’il s’agit d’une question de vie ou de mort, les médecins doivent prendre des décisions de traitement éclairées. L’objectif est d’optimiser les analyses de données biologiques à l’aide d’un nouvel outil bio-informatique conçu dans un laboratoire du Centre hospitalier universitaire Sainte-Justine (CHUSJ) qui facilitera la prise de décisions cliniques.
Le 26 juin 2000, le président Bill Clinton a déclaré : « Nous sommes ici pour célébrer l’achèvement du premier séquençage de l’ensemble du génome humain. Il s’agit sans aucun doute de la carte la plus importante et la plus merveilleuse jamais produite par l’humanité. » Ce jour-là, le président Clinton a annoncé l’achèvement d’une première version du génome humain. Mais en fait, deux versions indépendantes du génome avaient été produites. Le président était alors accompagné de deux scientifiques : Dr Francis Collins et Dr Craig Venter. Dr Collins, généticien médical américain, dirigeait le Human Genome Project (HGP) dont l’objectif ambitieux était de déterminer le contenu, la structure et l’organisation du génome humain afin d’aider à prévenir, à diagnostiquer et à traiter les maladies. Treize ans, 2,7 milliards $ US et une collaboration internationale ont été nécessaires à la réalisation de cet objectif. Le second, Dr Venter, biotechnologue américain, avait fondé et dirigeait la société fermée Celera Genomics qui avait utilisé une technique différente pour produire sa version du génome.
Comme un livre de recettes, le génome contient toutes les informations nécessaires à la croissance et au développement d’un organisme. Il représente l’ensemble du matériel génétique stocké dans les molécules d’ADN qui sont constituées d’un code génétique unique. Le code génétique, ou l’alphabet de l’ADN, est composé de quatre bases ou lettres correspondant aux nucléotides, qui sont des produits chimiques liés entre eux pour former de longues chaînes d’ADN. Les nucléotides de l’ADN sont l’adénine (A), la cytosine (C), la guanine (G) et la thymine (T). Le séquençage des segments d’ADN permet d’établir l’ordre exact des lettres dans le livre de recettes.
Dans cette ère de médecine personnalisée, les médecins peuvent créer des pharmacothérapies et des thérapies anticancéreuses hautement adaptées à partir du séquençage du génome d’une personne. En fait, ce qui demandait autrefois des années, des milliards de dollars et un effort à l’échelle planétaire peut maintenant être réalisé en quelques jours et pour quelques centaines de dollars. Le développement de nouvelles méthodes de séquençage, comme le séquençage massif en parallèle, ouvre la voie à d’incroyables possibilités en médecine génomique. Mon projet de recherche s’inscrit dans la lignée de ces efforts visant à adapter les soins de santé à la génétique de chaque patient. Il met en œuvre une nouvelle stratégie d’analyse instantanée des données biologiques qui servira de fondement pour la conception d’outils de diagnostic.
Ma méthodologie repose sur une technique de séquençage récente appelée séquençage par nanopores. Les nanopores, dont le diamètre est 100 000 fois plus petit que celui d’un cheveu humain, sont des trous dans une membrane séparant deux chambres. Lorsqu’un courant électrique est appliqué, il crée un flux de courant dans les nanopores qui permet de lire les lettres qui composent les molécules d’ADN au fur et à mesure que passe le matériel génétique à travers les nanopores. Imaginez que le fil soit coloré en jaune, vert, bleu et rouge pour représenter des propriétés uniques. Au fur et à mesure que passe le fil coloré dans l’aiguille, un capteur connecté à l’aiguille capte les différentes couleurs. Le courant électrique dans les nanopores change aussi, puisque chaque base a une forme différente et bloque le courant différemment. Le signal électrique brut généré par le séquenceur est transmis à un ordinateur qui peut utiliser l’apprentissage automatique pour traduire ces signaux en bases. Globalement, cette technique novatrice rend le séquençage beaucoup plus rapide et moins coûteux.
Puisque le séquençage par nanopores est encore en cours de développement, la précision des séquences traduites est relativement faible comparativement aux autres technologies de séquençage. Je souhaite contourner l’étape de la traduction et travailler dans l’espace du signal pour rendre le séquençage plus rapide et plus sensible. Le signal brut du nanopore représente la mesure du courant électrique dans le temps. Il peut être comparé à la série chronologique boursière représentant le cours des actions sur une période donnée ou à un électrocardiogramme (ECG) enregistrant le signal électrique dans le cœur. L’un de mes objectifs particuliers est d’utiliser un algorithme de déformation temporelle dynamique (DTW, en anglais) pour agréger les données et établir des aspects communs dans le signal brut. La déformation temporelle dynamique est une mesure de similarité qui tient compte des changements de vitesse et des déformations temporelles. Elle effectue des comparaisons par paire et renvoie la meilleure correspondance entre deux signaux. Je vais devoir ajuster et optimiser les paramètres pour améliorer les alignements et j’utiliserai ensuite un algorithme de regroupement pour regrouper les signaux bruts similaires. Pour reprendre l’analogie du fil de couleur, ces algorithmes permettront de regrouper les fils de couleur semblable. Par conséquent, cette nouvelle stratégie d’analyse des données permettra de distinguer rapidement le matériel biologique d’un échantillon grâce à son pouvoir discriminant. Du point de vue de la médecine personnalisée, mon projet contribuera à l’extraction de caractéristiques pertinentes à une maladie en vue d’un diagnostic précis et rapide.
Les diagnostics moléculaires en temps réel pourraient améliorer grandement la reconnaissance des catégories cliniques appropriées. Par exemple, il est difficile de différencier un patient souffrant d’une septicémie virale d’un patient présentant une réponse inflammatoire aiguë non liée à un agent pathogène. Le premier doit se voir prescrire un antiviral tandis que le second doit se voir prescrire un immunodépresseur. Un traitement inapproprié entraîne la mort, d’où la pertinence de fournir un diagnostic instantané et précis, ce que je compte faire en optimisant les algorithmes d’analyse du signal.
Cet article a été réalisé par Kristina Atanasova, étudiante à la Maîtrise en bio-informatique (Université de Montréal), avec l’accompagnement de Marie-Paule Primeau, conseillère en vulgarisation scientifique, dans le cadre de notre initiative « Mon projet de recherche en 800 mots ».