Contacter l'auteur / Contact the author

Recherche dans ce site / Search in this site

 

 

 

 

 

Microbiologie du Covid-19

Cycle de vie du virus (II)

Comme l'illustrent les deux schémas du cycle de vie du SARS-CoV-2 présentés ci-dessous, lorsque le virus a pénétré dans la cellule, l'endosome qui contient la charge virale se dissout. L'ARN viral ainsi libéré peut alors être décodé par le ribosome afin que les gènes puissent exprimer leurs protéines spécifiques. L'une des 16 protéines virales est une enzyme appelée l'ARN polymérase qui va synthétiser un ARN messager qui agit exactement comme l'ARNm cellulaire. Il va exploiter la machinerie cellulaire pour répliquer de nouveaux virions contenant des copies de l'ARN viral.

A consulter : Biorender (logiciel de DAO)

Descriptions du cycle de vie du SARS-CoV-2 depuis son attachement à la cellule hôte et l'endocytose jusqu'à l'exocytose. Notez en particulier le réticulum endoplasmique (ER) où le processus de traduction de l'ARN viral va fabriquer les protéines structurales et les éléments de la capside des futurs virions. Documents R.Di Napoli et al. (2020) et Lucerna-Chem.

L'ARN messager du virus va synthétiser deux longues polyprotéines. Ces protéines comprennent un complexe de réplication/transcription (RCT) qui produit de nouveaux ARN, des protéines structurales et deux protéases.

Pendant la réplication, des copies complètes de l'ARN viral (pleine longueur de polarité négative) sont produites et utilisées comme modèle pour fabriquer de nouveaux brins d'ARN (pleine longueur de polarité positive).

Pendant la transcription, un sous-ensemble de 7 à 9 ARN génomiques, y compris ceux codant pour toutes les protéines structurales, sont produites par transcription discontinue et coupées grâce à une protéase.

Enfin, les nucléocapsides virales sont combinées dans le cytoplasme à partir de l'ARN génomique et des protéines structurales puis bourgeonnent dans la lumière du réticulum endoplasmique. Après la synthèse de ces protéines, des macromolécules et des substances annexes, ces produits sont transférés vers l'appareil de Golgi situé près de la membrane cellulaire (le système endomembranaire). Lorsque les nouveaux virions matures sont assemblés, ils émergent ou bourgeonnent de la surface de la cellule par exocytose et cherchent d'autres cellules à infecter.

Pour le lecteur intéressé, voici le mode de réplication des Influenzavirus de la grippe.

Notons que si la cellule est fortement infectée par des virus, elle peut s'autodétruire, ce qu'on appelle l'apoptose (cf. la mort cellulaire).

Documents R.Sender et al. (2020) adapté par l'auteur.

Quelle est la durée du cycle de vie du SARS-CoV-2 et combien de virus peut-on détecter chez une personne contaminée ?

Si on se base sur des cas cliniques, des prélèvements effectués à l'écouvillon sur des patients hospitalisés depuis 1 à 3 jours en Chine entre le 1 janvier et le 17 février 2020 montrent qu'au cours d'un cycle viral supérieur à 30 jours, le nombre moyen de virus ne dépasse pas 26000 copies d'ARN viraux/mL à l'exception du nez où le cycle viral est de 24.3 jours et le nombre de virus est 53 fois supérieur, atteignant 1.4 million de copies d'ARN viraux/mL (cf. W.Tan et al., 2020). Mais cette étude fut en partie remise en question par des membres de l'équipe de Tan en raison de l'incomplétude des données.

Au niveau de la gorge, au cours des 5 premiers jours des symptômes, l'excrétion virale au niveau du pharynx est très élevée avec des quantités variant entre 676000 et 700 millions de copies d'ARN viraux/mL au 4e jour (cf. R.Woelfel et al., 2020; C.Drosten et al., 2020).

Comme illustré à gauche, selon une étude publiée sur "medRxiv" (non validée) le 17 novembre 2020 et mise à jour le 5 avril 2021 par l'équipe de Ron Sender de l'Institut Weizmann des Sciences de Rehovot, en Israël, les chercheurs estiment que "chaque personne contaminée porte entre 1 et 100 milliards de virions pendant le pic d'infection, ce qui représente une masse totale d'environ 1 et 100 μg. Cela implique curieusement que tous les virions du SARS-CoV-2 actuellement [actifs] dans le monde représentent une masse de seulement 0.1 à 10 kg".

Ils ont également calculé le pourcentage de cellules contaminées chez un patient Covid ayant contracté le virus depuis quelques jours. Sur base du nombre total de virions produit par une cellule infectée ou burst size estimé entre 10 et 100 virions, il y a 10 virions infectieux par cellule contaminée. En estimant qu'il y a entre 100000 et 10 million de virions chez cette personne, 10 virions par cellule contaminée représentent entre 10000 et 1 million de cellules infectées sur 100 milliards de cellules potentiellement cibles. Au total, ils obtiennent un rapport de 1 cellule contaminée pour 100000 à 10 millions de cellules saines.

La connaissance du nombre absolu de virions chez un individu contaminé peut mettre en perspective les paramètres de la réponse du système immunitaire, les doses infectieuses minimales et les limites de détection lors des tests.

C'est à ce stade que l'infection touche généralement plusieurs tissus et organes et que la personne présente les premiers symptômes et peut éventuellement devenir malade si ses défenses immunitaires sont trop faibles pour répondre efficacement à l'attaque virale. On reviendra sur les pathologies des patients Covid.

Nous verrons à propos des remèdes contre le Covid-19 que les chercheurs disposent de nombreuses stratégies thérapeutiques pour combattre le virus dont un assortiment de plusieurs centaines de traitements et presque autant de vaccins potentiels capables de neutraliser la charge virale du SARS-CoV-2 et donc l'expression de ses gènes.

Effets des protéines virales sur l'organisme

Les principaux constituants cellulaires affectés par les protéines virales. Document LadyofHats.

Des études ont montré que les différentes protéines du SARS-CoV-2 influenceraient le fonctionnement des cellules ainsi que les réponses du système immunitaire. Bien que le sujet soit très vaste et en partie inexploré, en voici un bref aperçu.

La protéine M influencerait la morphologie du réticulum endoplasmique tandis que la protéine nsp13 agirait sur l'organisation de l'appareil de Golgi.

La protéine nsp6 et la protéine accessoire 9C interagiraient avec les récepteurs Sigma 1 et 2 impliqués dans le métabolisme des lipides et l'adaptation du réticulum endoplasmique au stress cellulaire.

La principale protéase Mpro affecterait la circulation à l'intérieur du réticulum endoplasmique.

Plusieurs protéines virales cibleraient également des protéines cellulaires impliquées dans l'immunité innée dont les voies de l'interféron (protéines nsp13, nsp15…) qui favorisent la production de protéines antivirales, et la voie du NF-kappaB (protéine nsp13) qui active les cellules phagocytaires.

Des protéines virales comme la nsp9 entraveraient également des enzymes comme l'ubiquitine ligase E3 participant à l'activité antivirale de l'immunité.

D'autres protéines virales interféreraient également avec la machinerie de traduction des ARNm en protéines cellulaires, etc.

Activité et durée de vie de la charge virale

Comme nous l'avons expliqué, le SARS-CoV-2 ne peut répliquer son ARN que dans le cytoplasme d'une cellule hôte infectée dont il utilise la machinerie génétique à son profit. Autrement dit, même en faisant ses courses et en imaginant que le virus se poserait sur notre peau, il serait inoffensif. On y reviendra à propos des voies de transmission du virus car le sujet a suscité beaucoup de craintes et de malentendus.

Comme tous les coronavirus, étant enveloppé, pour que sa charge virale reste active (on ne parle pas de survie dans le cas d'un virus), le SARS-CoV-2 doit rester dans un milieu humide et idéalement à une température inférieure à 25°C, l'air chaud et sec ayant tendance à fragiliser son enveloppe. En effet, si le milieu est trop sec, le virus sera détruit au bout de quelques heures. La période estivale n'est donc pas sa meilleure saison, d'autant moins que le nombre de contacts qu'il peut établir diminue puisque la population à tendance à se disperser. En revanche, le virus apprécie le temps froid et sec hivernal.

Enfin, comme la majorité des virus, la charge virale et la capacité infectieuse du SARS-CoV-2 est détruite lorsqu'il est exposé au moins une demi-heure à 56°C ou 1 seconde à 100°C, d'où l'intérêt de bien cuire les aliments et de nettoyer le linge susceptible d'être contaminé (y compris les masques de protection en tissu) à au moins 60°C pendant au moins une demi-heure. On reviendra sur les façons d'éliminer les bactéries et les virus.

Les épitopes

Au début de la pandémie au Covid-19, les recherches se sont d'abord concentrées sur le groupe d'anticorps ciblant la partie la plus évidente de la protéine S, le domaine de liaison au récepteur (RBD) car c'est celui-ci qui se fixe directement aux récepteurs ACE2 des cellules humaines et permet au virus de les infecter.

Dans une étude publiée dans la revue "Science" le 4 mai 2021, Gregory C. Ippolito du Département des biosciences moléculaires de l'Université du Texas à Austin et ses collègues ont étudié la manière dont les anticorps anti-S se lient aux épitopes de la protéine S du SARS-CoV-2 pour la neutraliser et empêcher le virus d'infecter les cellules.

Pour rappel, l'épitope représente la partie de l'antigène du virus qui est reconnue comme étrangère par le système immunitaire et à laquelle il peut répondre par une réaction adaptée au moyen d'anticorps. La région de l'anticorps qui se lie à l'épitope est appelée le paratope. Les épitopes sont des déterminants antigéniques qui existent sur toutes les protéines virales. Ils mesurent ou contiennent entre 3 et 11 acides aminés. Dans le cas du SARS-CoV-2, les épitopes contiennent entre 9 et 11 acides aminés. Selon leur structure et leur interaction avec le paratope de l'anticorps, il existe trois types d'épitope : conformationnel, linéaire et discontinu. Les épitopes peuvent avoir une réaction croisée (homologies de structure).

A lire : Les épitopes pour les nuls, S.Denery, 2016

What is an Epitope?, News Medical

A gauche, structure des domaines de la protéine S du SARS-CoV-2 et épitopes de quelques mutations. Au centre, les anticorps monoclonaux neutralisants (mAbs) spécifiques se fixent sur des sites déterminés de la protéine S appelés les épitopes pour neutraliser la protéine. A droite, les épitopes linéaires de lymphocytes B sur la protéine S. Documents T. de Oliveira et al. (2020) adapté par l'auteur, U.Texas Austin et S.Tao et al. (2021).

En testant des échantillons de plasma sanguin de convalescents de la Covid-19, Ippolito et ses collègues ont découvert que les anticorps explorent l'intégralité de la protéine S, à la fois les deux branches du Y et la tige comme illustré ci-dessus au centre. Selon Ippolito, "Le système immunitaire voit tout la protéine S et essaie de la neutraliser".

Environ 84% des anticorps circulant dans le sang ciblent les zones de la protéine S en dehors du RBD. Ces anticorps ciblent l'une des branches en Y de la protéine S appelée le domaine N-terminal (NTD).

Le NTD fait également partie de la région de la protéine S virale qui mute fréquemment, en particulier dans les variants préoccupants (Alpha, Beta, Delta, Omicron, etc). Cela suggère que l'une des raisons pour lesquelles ces variants sont si efficaces pour échapper au système immunitaire est qu'ils peuvent muter autour de l'un de ces types d'anticorps les plus courants et les plus puissants de nos arsenaux médicamenteux.

Analyse de la protéine S du SARS-CoV-2 basée sur la structure des épitopes conformationnels (lors d'une réponse immunitaire). Document D.L. Robertson et al. (2021).

Selon les chercheurs, environ 40% des anticorps circulants ciblent la tige de la protéine S, appelée la sous-unité S2 qui est une partie relativement stable du virus qui change rarement.

Selon Ippolito. "C'est rassurant. C'est un avantage de notre système immunitaire. Cela signifie également que nos vaccins actuels suscitent des anticorps ciblant cette sous-unité S2, qui fournissent probablement une autre couche de protection contre le virus".

Selon une étude sur les épitopes du SARS-CoV-2 publiée dans la revue "Cell Reports Medicine" le 21 mai 2021, des chercheurs de l'Université Polytechnique de Hong Kong ont constaté que 62% des épitopes du coronavirus sont situés sur la protéine S et 38% sur la protéine N de la nucléocapside. 19 parmi les épitopes de la protéine S sont produits par le RBD grâce auxquels le virus s'attache au récepteur ACE2 cellulaire. 48 autres épitopes sont situés sur la tige (sous-unité S2), et un épitope se situe dans la région des peptides de fusion. Parmi les épitopes de la protéine N, 24 concernent le domaine de liaison à l'ARN (RBD) et 20 concernent le domaine de dimérisation. Les chercheurs ont également constaté que 23 épitopes étaient capables d'obtenir des réponses des cellule T chez plus de 75% des personnes examinées.

Sachant que le SARS-CoV-2 est couvert de milliers de protéines S contenant chacune 67 épitopes, avec ses dizaines de milliers de clés ce virus est un véritable "passe-partout" qui n'éprouve aucune difficulté pour pénétrer dans les cellules non protégées. D'où l'intérêt d'être vacciné afin de lui opposer le cas échéant un arsenal encore plus conséquent de "verroux" et autre neutralisants.

On comprendra que la cartographie des épitopes et une bonne compréhension de leur mécanisme de liaison aux cellules et aux anticorps sont importantes pour développer des vaccins efficaces (cf. S.Tao et al., 2021; J.He et al., 2021; A.Rubinsteyn et al., 2021) et des médicaments thérapeutiques.

De l'acide linoléique dans la protéine S

Grâce à un puissant système d'imagerie appelé la cryo-microscopie électronique (cf. cryo-EM) capable d'analyser des échantillons biologiques jusqu'à une résolution quasi-atomique, des chercheurs de l'Université de Bristol ont découvert que la protéine S du SARS-CoV-2 contient une petite cavité ou poche contenant un acide linoléique (C18H32O2). Il s'agit d'un acide gras libre polyinsaturé qu'utilise également le corps humain et qui est indispensable pour maintenir les membranes cellulaires dans les poumons afin que nous puissions respirer correctement.

A gauche, représentation de la protéine S vue de dessus avec les sous-unités trimères en jaune, vert et bleu et l'acide linoléique sous forme de sphères orange. Au centre, la cavité ou poche de liaison de l'acide linoléique (en orange) formée par les RBD adjacents (jaune et bleu). A droite, la poche de liaison de l'acide linoléique illustrant l'excellent ajustement de l'acide gras lié (en orange). Les zones bleues et rouges indiquent respectivement une charge de surface positive et négative. Documents I.Berger et al. (2022) et I.Berger et al. (2020).

Le corps humain ne peut pas produire cet acide gras mais il peut absorber cette molécule essentielle par l'alimentation (qu'on trouve en abondance dans l'huile de pépins de raisin, l'huile de carthame, l'huile d'arachide, etc).

Les chercheurs ont découvert que curieusement, l'acide linoléique joue également un rôle vital dans l'inflammation et la modulation immunitaire, qui sont deux éléments clés de la progression de la Covid-19 (cf. I.Berger et al., 2020). Cette molécule conservée au fil des mutations y compris chez le variant Omicron permet au virus de se dissimuler efficacement aux défenses du système immunitaire. On reviendra sur cette molécule à propos de l'évasion immunitaire et comment les chercheurs peuvent détourner cette molécule contre le virus.

Nos moyens informatiques actuels permettent de simuler non seulement les épitopes existants sur la protéine S mais également des épitopes possibles prometteurs pour la conception de futurs vaccins (cf. G.Hummer et al., 2021). Nous allons voir qu'il est également possible de prédire certaines mutations du virus.

Taux et vitesse de mutation

Le fait que le SARS-CoV-2 soit un virus à ARN monocaténaire (simple brin) le rend plus sujet aux mutations car les ARN polymérases qui assurent la réplication du génome n'ont pas les fonctions de correction d'erreurs des ADN polymérases. De ce fait, bien que son génome compte déjà parmi les plus grands génomes ssARN (cf. A.Becerra et al., 2015), sa taille et ses fonctions génétiques sont limitées.

Modèles du coronavirus SARS-CoV-2 révélant les spicules sur l'enveloppe et la capside protégeant le brin d'ARN. Documents Andriy Onufriyenko/Getty Images.

Les coronavirus sont les seuls virus à ARN disposant d'un système de correction d'erreurs (cf. W-L. Ng et al., 2020 et en format PDF). Il s'effectue grâce à l'exonucléase, une fonction enzymatique de la sous-unité nsp14 qui détruit la plupart des analogues de nucléotides, y compris des antiviraux comme la ribavirine, rendant ces virus résistants à ce médicament. Néanmoins, ce mécanisme n'est pas aussi efficace que celui des cellules eucaryotes. Par conséquent, le génome des coronavirus peut subir de légères mutations. Ceci explique que les virus à ARN ont une grande capacité d'adaptation qui leur permet même d'échapper aux défenses du système immunitaire. On y reviendra à propos de l'immunité face au Covid-19.

Le SARS-CoV-2 évolue beaucoup plus lentement que les autres coronavirus. Selon les données de Nextstrain, selon les variants le SARS-CoV-2 présente un taux de mutation (substitution) compris entre 22 et 25 mutations par an contre ~50 mutations par an pour les virus de la grippe saisonnière. Ce taux deux fois plus lent s'explique en partie par la taille deux fois plus longue du génome du SARS-CoV-2 par rapport à ceux de l'Influenza A de la grippe saisonnière (~30 kb contre 13.5 kb).

En terme de vitesse de mutation, le SARS-CoV-2 présente entre 5.2 et 8.1 x 10-3 substitution par site ou endroit du génome viral par an (cf. S.Angeletti et al., 2020; M.Sallam et al., 2021). C'est le deuxième taux de mutation le plus rapide après celui du virus de la Polio (~10-2 substitution par site par an, cf. G.V. Gavrilin et al., 2000), juste devant le VIH-1 (3 à 8 x 10-3 substitution par site par an, cf. R.Klitting et al., 2018) et les Influenzavirus de la grippe (2 à 8 x 10-3 substitution par site par an, cf. R.Klitting et al., 2018).

A gauche, la protéine S du SARS-CoV-2 sous forme fermée avec, selon la couleur, les sites où les résidus d'acides aminés mutent fréquemment (substitutions ou des suppressions d'acides aminés). A droite, les épitopes sur le domaine NTD de la protéine S des variants Kappa (gauche) et Delta (droite). Les résidus mutés sont représentés en rouge et interfèrent avec la reconnaissance immunitaire. Les N-glycanes sont représentés en bleu foncé et il est probable qu'ils interagissent avec le RBD afin de renforcer la liaison et la durée d’interaction entre la protéine S et le récepteur ACE2. Documents D.L. Robertson et al. (2021) et M.McCallum et al. (2021).

Le taux de mutation beaucoup plus lent du SARS-CoV-2 comparé à celui de la grippe donne de l'espoir aux chercheurs de développer des vaccins efficaces et durables contre le virus. Mais il faut rester réaliste. Le virus et ses variants continueront de muter et les vaccins devront donc probablement être adaptés en conséquence. Il y aura donc de nouvelles campagnes de vaccination et donc peut-être une piqûre de rappel chaque année pour éviter une nouvelle pandémie et son lot de restrictions. Autant être prévenu tout de suite.

Biostatistiques

En général, les vitesses de mutation d'un virus ssARN varient entre 10-4 et 10-6 substitution par nucléotide par infection cellulaire contre 10-6 à 10-8 pour les virus à ADN (cf. Sanjuán et Domingo-Calap, 2016). A grande échelle, un virus à ARN mute 1 million de fois par cycle viral soit environ toutes les 6 heures. Si dans l'absolu cela paraît élevé et très fréquent, il faut examiner ce que cela représente concrètement et avec quel effet.

La puissance des superordinateurs est notamment exploitée pour séquencer le génome du Covid-19, pour détecter le virus, retracer la contamination, étudier ses mutations, développer des kits de test plus rapides ou des vaccins. Le gouvernement de Singagour a justement lancé un appel d'offre aux chercheurs qui souhaiteraient utiliser le HPC ASPIRE-1 du NSCC de 1 PetaFLOPS. Document Shutterstock.

Pour comprendre l'origine du SARS-CoV-2 et surtout pour mettre au point un remède ou un vaccin, les chercheurs doivent absolument savoir si son génome est stable et quand il va muter. Pour cela, il faut le décoder.

Rappelons que l'ARN est une molécule similaire à l'ADN, et c'est pour l'essentiel une copie temporaire d'un court segment d'ADN. Plus précisément, selon les théories actuelles, l'ADN est transcrit en ARN. Le SARS-CoV-2 étant un virus à ARN, nos technologies de séquençage d'ADN ne peuvent pas décoder directement sa séquence génétique. Cependant, les scientifiques peuvent transcrire l'ARN du virus en ADN complémentaire (ou ADNc), qui peut ensuite être séquencé.

Les modèles d'évolution des séquences nucléaires ou d'évolutions phylogénétiques existent depuis plus d'un demi-siècle (cf. M.Forster et al., 2020; S.Pompei et al., 2012; S.Tavaré, 1986; W.M. Fitch, 1971; Cavalli‐Sforza et Edwards, 1967; Zuckerkandl et Pauling, 1965). On peut donc analyser statistiquement les divergences qui apparaissent sur les nucléotides au fil du temps. À partir de ces modèles d'évolution on peut prédire l'histoire du virus et l'utiliser pour essayer de calculer à quel taux les mutations se produisent, sur quelle partie du génome, quels gènes mutent fréquemment, autant d'informations utiles pour concevoir des médicaments et en particulier un vaccin.

Aujourd'hui, pour mener ces recherches digne d'un enquêteur, les chercheurs font appel à la puissance de calcul des ordinateurs. Les bioinformaticiens parmi d'autres spécialistes recourent à l'intelligence artificielle (IA), en particulier à la méthode d'apprentissage automatique (learning machine) qui permet à partir des mégadonnées (Big Data), des réseaux neuronaux et d'autres technologies informatiques de classifier très rapidement et avec une précision de 100% les séquences génomiques virales, et éventuellement de découvrir en quelques minutes les relations les plus pertinentes entre plus de 5000 génomes viraux enregistrés à ce jour.

Grâce à cette méthode, on peut obtenir les cladogrammes présentés ci-joints montrant la phylogénie du SARS-CoV-2 obtenue dans le cadre du projet open source Nextstrain qui analyse les génomes de virus du monde entier. On constate que le SARS-CoV-2 a subi beaucoup de divergences ou mutations depuis sa découverte en décembre 2019.

Précisons qu'il faut interpréter ces arborescences avec prudence. En effet, tant que la population n'est pas massivement dépistée et les données disponibles, ce dont on dispose sera toujours basé sur un sous-ensemble et donc biaisé de la population mondiale. Par conséquent, il ne faut pas généraliser ces résultats et par exemple conclure que le virus évolue en passant d'un continent ou d'un groupe de population à l'autre comme semble l'indiquer les différentes couleurs. C'est une interprétation possible, mais elle est prématurée.

En fait, l'analyse statistique permet seulement de dire que les écarts importants qu'on voit entre les groupes sont plus probablement dus à un sous-échantillonnage (des liens manqueraient le long de l'arbre) plutôt qu'à des mutations importantes du virus lorsqu'il se déplace d'un pays à l'autre.

L'arbre phylogénétique (représentations en escalier et radiale) du SARS-CoV-2 révélant ses divergences ou mutations en mars 2020 (gauche) et entre décembre 2019 et juin 2021( centre et droite). Il va sans dire qu'à cette époque le variant Alpha (B.1.1.7) était dominant. Documents Scientific American et Nextstrain.

Une analyse détaillée des séquences de l'ARN du SARS-CoV-2 montre que le virus subit de nombreuses mutations sur ses nucléotides (cf. N.Moshiri, 2020; N. De Maio et al., 2021).

Dans son rapport d'analyse du 20 septembre 2020, le bioinformaticien Niema Moshiri de l'Université de Californie à San Diego (UCSD) présente le diagramme "Alignement Position Entropies" figurant ci-dessous à droite indiquant le niveau de désordre des positions de l'alignement des séquences d'ARN (la séquence des bases A, G, C, U). Certaines positions affichent une entropie élevée (jusqu'au rapport 1.0) signifiant qu'elles sont très variables mais heureusement elles sont peu nombreuses et la plupart de ces mutations sont "silencieuses" car sans conséquence. En effet, les bases ou nucléotides sont prises par 3 pour être traduites en acides aminés et un changement chez l'une d'elles n'est pas toujours accompagné d'un changement de la fonction de la protéine (cf. la synthèse des protéines).

On a également identifié sur le SARS-CoV-2 des substitutions de 380 acides aminés du SARS, incluant des différences dans cinq des six acides aminés qui composent le domaine de liaison de la protéine S au récepteur ACE2 (cf. X.Li et al., 2020; F.Li et al., 2005).

A gauche, fréquence des mutations du SARS-CoV-2 distribuées dans 4 zones géographiques. Au total, 14 variants (13 dans ce graphique établi le 22 avril 2020) ont été répertoriés en avril 2020. A droite, le niveau de désordre des positions de l'alignement des séquences d'ARN du Covid-19 en septembre 2020. Documents D.Zella et al. (2020) et N.Moshiri (2020) adaptés par l'auteur.

Comme on le voit dans le diagramme ci-dessus à gauche, en avril 2020 on avait déjà identifié 14 variants du Covid-19 (13 sont présentés dans le graphique) présentant des mutations récurrentes de points chauds. Ces changements concernent notamment des mutations sur la protéine S dans le variant D614 qui s'est propagé en Europe puis aux Etats-Unis (voir page suivante) et d'autres sur la protéine hélicase nsp13 (protéine non structurelle) qui catalyse l'ouverture des brins appariés d'acides nucléiques qui n'affecte que l'un des variants présent en Amérique du Nord (cf. D.Zella et al. 2020; PNAS, 2020).

Au total, depuis son identification le 21 décembre 2019, la base Nextstrain a répertorié 4001 séquences génétiques du SARS-CoV-2 début juin 2021 dont 2899 nouvelles séquences depuis le 1er janvier 2021. Le SARS-CoV-2 subit en moyenne 25 mutations par an et est loin d'être éteint !

Des mutations sans fin ?

Y a-t-il des limites aux mutations du SARS-CoV-2 ? Vu sa nature, il est normal que le virus subisse des mutations. Mais y a-t-il une limite au nombre de mutations pouvant provoquer une maladie ou le virus peut-il simplement continuer à évoluer indéfiniment sans pour autant entraîner de maladie chez les humains ?

Selon le virologue Vincent Racaniello, professeur de microbiologie et d'immunologie à l'Université Columbia de la Cité Universitaire de New York (CUNY), il existe effectivement une limite, mais personne ne sait exactement où elle se trouve. En effet, "on ne peut pas prédire toutes les mutations génétiques possibles que le virus pourrait subir car leur nombre est supérieur au nombre d'atomes dans l'univers visible" (estimé entre 1079-1082 atomes, cf. l'avenir de l'Univers).

Selon Racaniello, des études sur d'autres virus à ARN simple brin ont montré que plus de la moitié des bases de ces virus peuvent subir des mutations. "Mathématiquement, cela signifie que pour un virus de 10000 bases, il existe 45000 possibilités de séquences génétiques possibles" !

Appliqué au SARS-CoV-2 dont le génome est trois fois plus long, il existerait 414941 combinaisons génétiques différentes possibles ! Et cela ne tient compte que des substitutions de bases car il existe également d'autres mutations telles que les délétions et les insertions de bases qui augmentent encore le nombre de possibilités de milliers d'ordres de grandeur.

Avec ses 1273 acides aminés codées par 3831 bases, la seule protéine S peut subir 41916 mutations. Heureusement, bon nombre de ces mutations sont redondantes et codent pour les mêmes acides aminés.

A gauche, schéma des principales régions de mutations observées chez le SARS-CoV-2. A droite, les classes d'anticorps neutralisants définies par des analyses structurelles (gauche) et les propriétés des résidus de protéines S du SARS-CoV-2 (droite). Documents S.K. Saxena et al. (2020) adapté par l'auteur et D.L. Robertson et al. (2021).

Comme nous l'avons expliqué, des milliers de mutations sont silencieuses ou ont un effet mortel sur le virus. Ces mutations ne sont pas identifiées comme un nouveau variant du virus. Les variants identifiés et nommés ont généralement des propriétés "remarquables" comme une plus grande capacité à se transmettre entre humains ou à échapper aux anticorps. On y reviendra.

Les scientifiques surveillent les mutations du virus grâce au dépistage de la population. Lorsqu'une mutation significative est détectée, ces données sont incorporées dans un modèle informatique de la protéine S afin de prédire le comportement du variant. Mais pour réellement comprendre comment la mutation modifie le comportement du virus, il faut réaliser des expériences in vitro (en culture) ou ex vivo (sur des tissus extraits d'un organisme) sur le variant ou les protéines ayant muté.

Pourquoi toutes ces mutations se produisent-elles ? Dans le premier cas, le variant s'est propagé parce qu'un plus grand nombre de personnes voyagent et sont en contact les unes avec les autres. Mais cela ne signifie pas nécessairement que le virus tire avantage de cette mutation.

Dans le second cas, des mutations identiques ou très similaires émergent dans différents variants en différents endroits du monde. Cela signifie que la mutation confère un avantage au virus. La souche initiale du virus étant déjà très efficace pour contaminer les humains, en principe toute nouvelle mutation ne lui conférera qu'un faible avantage et ne va pas profondément modifier l'action du virus. Pour faire une comparaison, cela revient à augmenter le son de votre radio de 10%.

Toutefois, le fait de vacciner la population à un rythme trop lent peut inciter le virus à développer des mutations d'échappement pour bloquer la capacité de neutralisation des anticorps. On y reviendra.

Des modèles pour prédire les futures mutations

Le SARS-CoV-2 circule dans la population humaine depuis fin 2019. Depuis sa découverte, son évolution est plutôt stochastique, autrement dit aléatoire, et jusqu'à présent on n'a pu que réagir et non anticiper les impacts de ses mutations sur la transmissibilité, la létalité ou l'évasion du virus face aux médicaments.

Malgré tout, assez rapidement les chercheurs ont pu prédire certaines mutations très évidentes, telles que certains changements d'acides aminés sur la protéine S qui ont un impact décisif sur le domaine RBD, ce qui a un impact sur la capacité du virus à s'attacher et à pénétrer dans les cellules humaines. Mais ce n'est qu'une partie de la protéine S et de nombreux autres changements protéiques peuvent avoir un impact sur sa forme physique et donc sur la transmissibilité du virus.

Configurations 3D du SARS-CoV-2, du repliement de la protéine S et du domaine RBD ainsi que quelques unes des mutations. Documents CDC, B.Korber et al. (2020) et Y.Wang et al. (2020) adaptés par l'auteur.

Il fallut notamment que la base de données GISAID (Nextstrain) contienne suffisamment de séquences génomiques du SARS-CoV-2 pour que les chercheurs aient assez de références et de recul sur l'évolution des différents variants pour faire des prédictions sur ceux qui émergeront à l'avenir. En janvier 2022, GISAID contenait plus de 7.2 millions de séquences génomiques du SARS-CoV-2 (contre 1.5 million en mai 2021). Avec 1.5 million de séquences génomiques, les chercheurs ont pu élaborer des modèles.

Dans une étude publiée dans les "PNAS" le 25 janvier 2022, Juan Rodriguez-Rivas du Laboratoire de Biologie Computationnelle et Quantitative (LCQB) de la Sorbonne et ses collègues ont étudié la mutabilité de toutes les positions dans les domaines protéiques du SARS-CoV-2 afin de prédire l'apparition de variants non détectés pour ensuite élaborer des modèles statistiques épistatiques (tenant compte de variabilité entre gènes) capables de déterminer non seulement quels acides aminés sont conservés, mais également des évolutions plus complexes résultant de l'interaction entre les gènes (l'épistasie).

Mutations de la structure du domaine RBD de la protéine S du SARS-CoV-2 selon le modèle prédictif épistatique DCA (gauche) comparée à l'expression expérimentale des protéines (droite). Document J.Rodriguez-Rivas et al. (2022) adapté par l'auteur.

Les chercheurs ont utilisé l'intelligence artificielle, en particulier l'apprentissage automatique (cf. IBM) et disposaient de deux principaux modèles dont ils devaient choisir le plus adapté au SARS-CoV-2 : le modèle IND et le modèle DCA. Le modèle IND est indépendant, contenant peu de paramètres. Il ne peut pas être entraîné à l'aide d'ensembles limités de données et n'a qu'un pouvoir prédictif limité car il suppose que les positions au sein d'une protéine évoluent indépendamment les unes des autres, sans tenir compte du fait que les résidus (des fragments de molécules qui ne changent pas après avoir été incorporés dans une biomolécule complexe). C'est typiquement le cas des acides aminés lorsqu'ils forment un polypeptide :) peuvent affecter l'évolution des autres protéines via des interactions épistatiques.

Le modèle DCA (direct coupling analysis, cf. T-M.Zhou et al., 2018; M.Weigt et al., 2018) est épistatique et peut être entraîné à l'aide d'ensembles limités de données. Pour améliorer ses performances prédictives et surmonter les limitations inhérentes des données (le nombre de génomes enregistré en 2 ans est limité comparé par exemple au HIV, l'infection d'un patient ne dure que quelques mois, des séquences peuvent être erronnées car contaminées en labo, etc), les chercheurs ont entrainé le modèle en incluant explicitement des termes épistatiques par paires de gènes.

Le modèle DCA est formé à l'aide de familles de séquences homologues (des séquences de nucléotides partageant une origine évolutive commune) collectées à partir de tous les génomes de coronavirus connus, ce qui permet de modéliser les pressions sélectives générales agissant sur la famille des coronaviridae. Bien que l'utilisation d'autres coronavirus élargisse considérablement les ensembles de données, rendant la modélisation plus robuste, on peut cependant perdre partiellement des informations sur les contraintes spécifiques à l'hôte telles que l'interaction avec le récepteur ACE2 cellulaire ou avec le système immunitaire de l'hôte (l'ACE2 de la souris par exemple est légèrement différent de l'ACE2 humain et les coronovirus doivent s'y adapter).

Après analyse des résultats, les chercheurs confirment que ce modèle est très performant pour estimer la variabilité du virus. Comme illustré ci-dessus à gauche, dans le domaine RBD de la protéine S, ils ont découvert que la mutabilité prédite est bien corrélée aux mesures expérimentales de la stabilité des protéines et que les deux méthodes (mutabilité prédite et variabilité observée) sont des moyens fiables pour prédire les mutations virales. Ils ont également observé une correspondance croissante entre leur modèle et la variabilité observée à mesure que davantage de données étaient disponibles au fil du temps, prouvant la capacité d'anticipation de ce type de modèle.

Selon les chercheurs, "Lorsqu'elle est combinée avec des données concernant la réponse immunitaire, notre approche identifie les positions où les variants préoccupants actuels sont fortement surreprésentés. Ces résultats pourraient aider les études sur l'évolution virale et les futures épidémies virales et, en particulier, guider l'exploration et l'anticipation de futurs variants potentiellement dangereux du SARS-CoV-2".

Mais même s'il est possible de prédire quelles mutations pourraient émerger, ce serait probablement trop tard sachant la fréquence à laquelle le virus peut muter. En effet, le virus s'adapte plus rapidement que les vaccins ou les remèdes car les protéines virales sont très flexibles dans leurs capacités à interagir avec des récepteurs ou des anticorps; elles sont capables de tolérer une mutation de plusieurs façons différentes pour atteindre leur objectif. Et cela, les scientifiques ne peuvent pas le prédire. Espérons que l'intelligence artificielle y pourvoira.

Représentation des liens entre paires de domaines lorsqu'ils ont au moins un couplage épistatique relativement fort. Les nœuds représentent les domaines Pfam (les alignements multiples) dans le protéome du SARS-CoV-2. L'épaisseur du lien représente la force ou poids du couplage le plus fort parmi toutes les paires de positions interdomaines. Les domaines protéiques codifiés dans le même ORF partagent la même couleur. Document J.Rodriguez-Rivas et al. (2022) adapté par l'auteur.

On sait également que plus le virus se propage plus les mutations émergeront. D'abord parce que chaque réplication virale est potentiellement sujette à mutation, et elles se comptent par milliards dans un seul organisme lors d'une attaque virale. Ensuite parce que certains variants sont sélectionnés en raison de leur plus grande transmissibilité et/ou résistance aux anticorps, considérées comme les deux principaux facteurs de pression de la sélection naturelle. On en déduit qu'un vaccin offrant une forte pression de sélection et donc très efficace contre le virus, peut réduire la probabilité que le virus se réplique et mute. À l'inverse, une pression de sélection très faible signifie que le virus subit peu de contraintes, il ne va donc pas beaucoup muter et tout changement fournira un avantage négligeable.

Mais ce mécanisme peut mal fonctionner lorsque la pression de sélection sur le virus est insuffisante. Ainsi, l'utilisation généralisée de vaccins peu efficaces ou l'allongement du délai entre la première et la deuxième dose du vaccin lorsqu'une personne n'a pas une forte réponse en anticorps, peut représenter un terrain fertile pour de nouveaux variants. C'est une situation dont ont bien conscience les microbiologistes et les sociétés pharmaceutiques qui travaillent littéralement dans une course contre la montre contre les mutations du virus.

Empêcher les mutations grâce à la vaccination

Pour éviter ces variants potentiels, tous les spécialistes confirment qu'il faut administrer le plus rapidement possible les vaccins au plus grand nombre possible de personnes (en théorie en fonction du Ro ou taux de reproduction de base du virus) et en respectant le protocole, c'est-à-dire dans les délais prévus et validés lors des tests cliniques, pour atteindre le plus rapidement possible une immunité de 100% et ainsi empêcher l'émergence de variants portant des mutations d'échappement ou de nouvelles mutations importantes exclues des vaccins actuels.

En vaccinant rapidement la population, les courbes de l'épidémie montrent clairement qu'en moins de deux mois le nombre de cas de contamination diminue sensiblement et on élimine ou réduit fortement le risque de mutation.

En résumé, que ce soit de nos jours avec le SARS-CoV-2 où lors des épidémies antérieures, la propagation des virus peut toujours être endiguée et stoppée par les procédures standards recommandées par l'OMS et le corps médical.

Décrivons à présent les nouveaux variants qui sont apparus en différents endroits du monde. C'est l'objet du prochain chapitre.

Prochain chapitre

Les différents variants

Page 1 - 2 - 3 - 4 -


Back to:

HOME

Copyright & FAQ