Macromolécule fibreuse que l’on isole du reste des composants des chromosomes, l’acide désoxyribonucléique, ou ADN, gouverne le fonctionnement des cellules. L’élucidation de sa structure, en 1953, a fourni à la génétique — l’étude de l’hérédité biologique — une base physique, ainsi que toute une série de notions empruntées à la cybernétique : information, code, programme, contrôle, transcription, message… Celles-ci facilitent la compréhension de ses mécanismes, mais méritent d’être employées avec précaution. L’ADN est constitué de deux chaînes formant une double hélice et comportant, pour l’humain, environ trois milliards de maillons (soit six milliards de nucléotides, ou « bases », qui vont par paire), mais seulement quatre types distincts de maillons.
Le séquençage vise à déterminer l’ordre de succession de ces composants biochimiques, que l’on nomme par les caractères A, C, T ou G — d’après leurs premières lettres : adénine, cytosine, thymine et guanine. Cette caractérisation permet de les enregistrer dans un fichier informatique, le seul support qui permette leur étude compte tenu du nombre de nucléotides contenus dans le moindre fragment d’ADN. On peut s’intéresser seulement à la partie dite « codante » de ces chaînes, les gènes, qui portent l’information pour fabriquer les protéines, et qui représentent moins de 2 % des bases qui s’enchaînent dans l’ADN humain. Le génome désigne communément la séquence de la totalité de ces trois milliards de maillons portés sur les 23 paires de chromosomes présents, en principe à l’identique, dans le noyau de chaque cellule humaine (1). Ces chromosomes représentent après numérisation, un fichier informatique d’environ trois milliards de caractères, soit plus de 400 fois plus que l’un des romans les plus longs jamais écrits, À la recherche du temps perdu, de Marcel Proust, dont la dernière édition chez Gallimard en compterait 7,2 millions.
Le consortium public international Human Genome Project (HGP) a présenté en avril 2003 le premier séquençage presque complet d’un génome humain — environ 5 % restant encore inconnus aujourd’hui (2). L’ensemble du programme a coûté 3,2 milliards de dollars. Le consortium public était en concurrence avec l’entreprise privée Celera Genomics, qui rêvait de breveter ses résultats, obtenus pour une part en récupérant les données publiques (3). Présenté comme une percée scientifique majeure, le HGP représentait surtout une prouesse technique inaugurant une filière industrielle. « Comme ses équivalents dans les sciences physiques, ce n’est pas un projet pour faire de la science, mais pour développer une ressource », expliquait le professeur Charles DeLisi, principal initiateur du programme, qu’il justifiait principalement par ses « promesses d’avancées médicales » et par une « compétitivité économique accrue » (4).
Depuis, et grâce à ce premier investissement, le temps nécessaire à un séquençage et son coût ont chuté. Au point qu’aujourd’hui il peut s’accomplir en quelques heures et pour environ 1 000 euros. Ce premier décryptage accompli par le HGP n’apportait pas seulement une preuve de la faisabilité de l’opération : il représentait aussi une sorte d’étalon, un « génome de référence ». Cet échantillon-type sert de matrice pour automatiser le séquençage et effectuer les calculs informatiques sur les données brutes sorties du séquenceur.
La place du calcul informatique dans la production d’un génome s’avère aussi importante que celle de l’analyse biologique. Il aboutit à une caractérisation moléculaire de l’individu sous forme numérique, à laquelle on accorde une capacité descriptive de chacun. Identifiante, y compris à des fins judiciaires, elle prend le pas sur le parcours vital, au point que l’expression « C’est dans mon ADN » tend à remplacer la formule « C’est dans ma nature ».
Raúl Guillén
Journaliste, Madrid.
(1) En outre, le génome mitochondrial humain, indépendant de l’ADN nucléaire, comporte 16 500 bases.
(2) Adam Philippy, « The (near) complete sequence of a human genome », université de Californie à Santa Cruz, Genomics Institute, 22 septembre 2020.
(3) John Sulston, « Le génome humain sauvé de la spéculation », Le Monde diplomatique, décembre 2002.
(4) Charles DeLisi, « The Human Gene Project », American Scientist, vol. 76, n° 5, Research Triangle Park (Caroline du Nord), septembre-octobre 1988.