Un chercheur trouve 13 séquences provenant de certains des premiers cas observés à Wuhan.
La recherche de l’origine du SRAS-CoV-2, le coronavirus responsable de près de 3,9 millions de décès dans le monde, a été largement entravée par le manque d’accès aux informations provenant de Chine, où les premiers cas sont apparus.
Aujourd’hui, un chercheur de Seattle a recouvré des fichiers supprimés de Google Cloud qui révèlent 13 séquences génétiques partielles de certains des premiers cas de COVID-19 à Wuhan, rapporte Carl Zimmer pour le New York Times.
Il apparait donc que les séquences ne font pas pencher la balance en faveur ou à l’encontre de l’une des nombreuses théories sur la façon dont le SRAS-CoV-2 est apparu – elles ne suggèrent pas que le virus a fui d’un laboratoire de haute sécurité à Wuhan, ni qu’il s’agit d’un événement naturel. Mais elles confirment l’idée que le nouveau coronavirus circulait déjà avant la première grande épidémie survenue sur un marché de fruits de mer.
D’abord et pour déterminer exactement comment et où le virus est apparu, les scientifiques doivent trouver le virus dit progéniteur, celui dont descendent toutes les autres souches. Jusqu’à présent, les séquences les plus anciennes sont principalement celles prélevées sur des cas avérés du marché de poisson Huanan de Wuhan, dont on pensait initialement qu’il s’agissait du lieu où le nouveau coronavirus est apparu pour la première fois fin décembre 2019. Toutefois, les cas recensés au début du mois de décembre et en novembre 2019 n’avaient aucun lien avec le marché, ce qui indique que le virus est apparu assez tôt dans la pandémie.
Cependant il y avait un problème récurrent avec ces premières séquences génétiques. Celles provenant des cas trouvés sur le marché comprennent trois mutations qui manquent dans les échantillons de virus provenant de cas apparus des semaines plus tard en dehors du marché.
En effet, les virus dépourvus de ces trois mutations correspondaient plus étroitement aux coronavirus trouvés chez les chauves-souris fer à cheval (rhinolophus ferrumequinum). Les scientifiques sont relativement certains que le nouveau coronavirus a émergé d’une manière ou d’une autre des chauves-souris, il est donc logique de supposer que le progéniteur n’aurait pas non plus ces mutations.
Aujourd’hui, Jesse Bloom, du Howard Hughes Medical Institute de Seattle, a découvert que les séquences supprimées – probablement certains des premiers échantillons – étaient également dépourvues de ces mutations. (Bloom est l’auteur principal d’une lettre publiée en mai dans la revue Science, demandant instamment une enquête impartiale sur les origines du coronavirus).
« Ils sont trois fois plus proches des coronavirus de la chauve-souris que des virus du marché aux poissons de Huanan« , a déclaré M. Bloom au New York Times. Ces nouvelles données laissent penser que le virus circulait à Wuhan bien avant d’apparaître sur le marché aux fruits de mer, a ajouté M. Bloom.
« Ce fait suggère que les séquences du marché, qui sont le principal objet de l’épidémiologie génomique dans le rapport conjoint OMS-Chine … ne sont pas représentatives des virus qui circulaient à Wuhan à la fin de décembre 2019 et au début de janvier 2020« , a écrit Bloom dans son article téléchargé le 22 juin sur la base de données de préimpression bioRxiv.
Selon Zimmer, il y a environ un an, 241 séquences génétiques de patients atteints de coronavirus avaient disparu d’une base de données en ligne appelée Sequence Read Archive, gérée par les National Institutes of Health (NIH).
Dès lors, Bloom a remarqué les séquences manquantes lorsqu’il est tombé sur une feuille de calcul dans une étude publiée en mai 2020 dans la revue PeerJ, dans laquelle les auteurs énumèrent 241 séquences génétiques du SRAS-CoV-2 jusqu’à la fin mars 2020. Les séquences faisaient partie d’un projet de l’université de Wuhan appelé PRJNA612766 et étaient censées être téléchargées dans Sequence Read Archive. Alors il a recherché les séquences dans la base de données des archives et a obtenu le message « Aucun élément trouvé« , écrit Bloom dans l’article de bioRxiv, qui n’a pas fait l’objet d’un examen par les pairs.
Ses recherches ont révélé que les séquences supprimées avaient été recueillies par Aisu Fu et l’hôpital Renmin de l’université de Wuhan, et qu’une préimpression de la recherche publiée à partir de ces séquences (désignée sous le nom de Wang et al. 2020) suggérait qu’elles provenaient d’échantillons de nez prélevés sur des patients ambulatoires soupçonnés d’être atteints du COVID-19 au début de l’épidémie.
Or Bloom n’a pas pu trouver d’explication sur la raison pour laquelle les séquences avaient été supprimées, et les courriels qu’il a envoyés aux deux auteurs correspondants pour s’informer sont restés sans réponse.
« Il n’y a aucune raison scientifique plausible pour la suppression : les séquences sont parfaitement concordantes avec les échantillons décrits dans Wang et al. (2020a,b) », a écrit Bloom dans bioRxiv. « Il n’y a pas de corrections à l’article, l’article indique que l’approbation des sujets humains a été obtenue, et le séquençage ne montre aucune preuve de contamination plasmidique ou d’échantillon à échantillon. Il semble donc probable que les séquences aient été supprimées pour masquer leur existence.«
Toutefois M. Bloom note plusieurs limites à son étude, notamment le fait que les séquences ne sont que partielles et ne comportent aucune information permettant de déterminer clairement la date ou le lieu de collecte – des informations cruciales pour remonter à l’origine du virus.
Quoi qu’il en soit, M. Bloom pense que l’examen plus approfondi des données archivées du NIH et d’autres organisations – et la reconstitution des séquences – pourrait aider à brosser un tableau plus clair de l’origine et de la propagation précoce du SRAS-CoV-2, sans qu’il soit nécessaire de mener des études sur le terrain en Chine.
Lu dans le New York Times et Live Science, articles traduits et adaptés pour WUKALI