Les aventures de Virus, Logistix et Benny

Par MD

1/ Introduction.
Dans un article récent, il a été question de la fonction dite « logistique » et de ses applications – toutes théoriques – à la propagation de la pandémie de Coronavirus. On ne reviendra pas sur les considérations exposées dans ce premier article. Toutefois, il paraît utile de faire intervenir un troisième compère venu cette fois d’outre-Manche.
En effet, près de trois semaines ont passé, et l’évolution de la pandémie semble maintenant obéir à une loi différente, à laquelle on va tenter de donner une expression en géométrie analytique. Répétons à nouveau qu’il ne s’agit que d’un exercice mathématique, l’auteur de ces lignes n’ayant aucune compétence médicale ni épidémiologique.

2/ Logistix et Benny Gompertz.
Par convention, une fonction N(t) représente un nombre d’évènements cumulés recensés au temps t (en jours). La courbe logistique N(t) telle que : image001 avait été définie par deux paramètres : T, nombre de jours entre l’origine et le point d’inflexion, et K, paramètre de forme. Cette fonction est symétrique par rapport au point d’inflexion de la courbe, qui correspond à la valeur maximale de sa dérivée, c’est-à-dire le maximum d’évènements journaliers.
Dans la pratique, beaucoup de phénomènes ne sont pas exactement symétriques. Souvent, à partir de l’apparition du premier évènement, on constate un développement rapide d’allure exponentielle, qui s’atténue, passe par un point d’inflexion, puis s’atténue encore jusqu’à la disparition du phénomène, phase ultime qui peut durer assez longtemps.
Ceci n’avait pas échappé à un savant autodidacte britannique, Benjamin Gompertz, qui s’appuyant sur des données démographiques, avait énoncé, il y a bientôt deux siècles (1822) une fonction à laquelle son nom est resté attaché.
On en connaît plusieurs expressions plus ou moins complexes. On retiendra ici la plus simple comportant seulement deux paramètres T et K où, comme dans le cas de la fonction logistique, T est le nombre de jours entre l’origine et le point d’inflexion, et K un coefficient déterminant l’allure de la courbe. Les formules sont les suivantes :

-fonction de Gompertz : image002
-dérivée : image003

Voici la représentation graphique de la fonction et de sa dérivée (pour le couple de paramètres T=35 jours et K=0,09 à titre d’exemple).
image004
-En début de courbe, N(t) est presque confondue avec la fonction exponentielle image005 ainsi qu’avec la fonction logistique image006
-Au point d’inflexion (marqué par un gros point), on a t=T (ici 35), d’où (t-T) = 0 et = 1, d’où N(t) = 1/e # 0,37. La pente est alors maximale et égale à K/e (ici 0,033).
-En fin de courbe, N(t) est presque confondue avec la fonction exponentielle image008
Le lecteur voudra bien excuser l’aridité de ces formules ; en voici une image moins rébarbative.
image009
On peut retenir que le point d’inflexion marque à peu près le tiers de l’évolution du phénomène, et non la moitié comme dans la logistique. Comme pour la logistique, le coefficient K illustre l’allure de la courbe : plus K est faible, plus la courbe est aplatie, donc étalée dans le temps.

3/ Exemples d’application.
Comme dans l’article précédent, on a tenté par tâtonnements de faire coïncider des courbes de Gompertz théoriques avec les données épidémiologiques publiées par le site Worldometer, à jour au 3 mai 2020. On a choisi comme entrée les nombres de décès attribués au coronavirus, qui sont probablement les mieux connus (le même exercice a été fait sur les cas déclarés et donne des courbes similaires). L’échelle des abscisses est exprimée en jours du calendrier. L’échelle des ordonnées a été rendue muette : en effet, l’ajustement entre la courbe théorique (en rouge) et la courbe réelle (en bleu) nécessite une hypothèse sur l’amplitude du phénomène, c’est à dire sur le nombre final de décès. Cette donnée est particulièrement sensible, dans tous les sens du terme car chaque jour qui passe peut conduire à la réviser en fonction de la dernière donnée en date.
On commencera par donner le graphique de la Chine, où la pandémie est considérée comme terminée depuis la mi-avril, et qui peut servie de parangon. La Chine a tout récemment revu son mode d’évaluation, mais n’a pas rétropolé sa série en conséquence. Néanmoins, il est intéressant de présenter la série non réévaluée (la nouvelle s’en déduirait par homothétie).
image010
L’examen a surtout porté sur des pays européens. Les mosaïques ci-après illustrent les résultats obtenus pour huit d’entre eux. On donne pour chaque pays les valeurs des paramètres T et K, et les points d’inflexion sont marqués.image011
image012
A titre d’illustration complémentaire, voici deux exemples de graphiques représentant cette fois les nouveaux décès déclarés quotidiennement, superposés à la dérivée N’(t). Les courbes sont beaucoup plus irrégulières que celles des cumuls, mais on discerne bien les tendances.
image013

4/ Conclusion.
Que peut-on conclure de tout cela.
-D’une façon générale, l’évolution de la pandémie s’est notablement écartée de la courbe logistique (ce qui justifie la prudence préconisée dans l’article précédent). Gompertz semble avoir supplanté Verhulst.
-Les pays examinés présentent une grande diversité géographique, démographique, économique, et en matière de politique de santé. Face à la pandémie, ils ont adopté des dispositions très variées. Enfin il y a des écarts considérables dans les pourcentages de décès par rapport aux populations respectives. Pourtant les allures des courbes sont proches et les paramètres T et K sont assez voisins (en moyenne, T=34 jours et K=0,08).
-Il semble que la diminution progressive des décès journaliers manifeste maintenant une tendance assez robuste. En Europe, la pandémie serait donc peu éloignée de sa conclusion, sauf surprises ou réévaluations.
-Cela étant, faire des pronostics est un exercice particulièrement hasardeux. En l’occurrence, ce type de fonction ne constitue ni un « modèle » de prévision ni une « théorie mathématique des épidémies ». On voit seulement qu’il est possible d’adapter des observations épidémiologiques – présumées fiables – à un type de courbe théorique qui a fait ses preuves dans d’autres domaines. Mais l’allure définitive de la courbe ne peut être déterminée qu’en fin de course.

Pour tirer d’autres conclusions, et notamment faire des comparaisons pertinentes entre les pays, il faudra maintenant attendre la fin espérée de ce pénible épisode. Souhaitons que les mythes et les mancies ne s’imposent pas aux mathématiques.

29 réflexions au sujet de « Les aventures de Virus, Logistix et Benny »

  1. Philippe, cette modestie vous honore mais, s’il vous plait, ne vous sous-estimez pas. N’oublions pas que certains « scientifiques » exploitent justement cette passivité pour nous asséner leurs « modèles » et leurs vérités, dans ce domaine comme dans bien d’autres, si vous voyez ce que je veux dire.
    Bien à vous.
    Michel

    J’aime

  2. moi non plus, je n’ai pas tous les atouts pour suivre les détails mathématiques, mais je crois avoir au moins compris des conclusions que les courbes se ressemblaient dans les différents pays, et que nulle part elles ne s’emballent dans la durée…
    c’est bien, tous les gouvernements vont pouvoir être contents d’eux, ceux qui n’ont pas pris des mesures trop strictes se diront qu’ils ont bien fait, ceux qui comme en France en ont pris des strictes diront que c’est grâce à ces mesures… certes, sauf erreur, aucun pays dans le monde n’a adopté le scénario « business as usual », sans aucune mesure de distanciation sociale…
    même si, comme vous le dites bien, le modèle n’est pas pas prédictif, l’exemple des pays dont le calendrier est un peu en avance sur nous suggère que la probabilité d’une remontée est, au moins à court terme, improbable… il serait bien que, en France, à un confinement très pénalisant pour la vie économique et sociale, on ne rajoute pas un plan de déconfinement qui s’étale sur des mois…
    en tous cas, espérons (je rêve !) que cette affaire incitera les scientifiques à moins de certitudes dans leurs modèles prédictifs, ou les gouvernements à les suivre moins aveuglément… la science a déjà du mal à expliquer les phénomènes en cours (à l ‘évidence, l’arrêt de la progression de la pandémie ne doit rien à une immunité collective de 60 ou 70 %, les histoires de Rn semblent aussi avoir leurs limites, etc.), elle devrait laisser les projections pour l’avenir aux Mmes Soleil… on voit bien que les modélisations de l’avenir ne sont jamais ni plus ni moins que des prolongations des courbes actuelles toutes choses égales par ailleurs… or, le problème, c’est toutes choses ne sont jamais égales par ailleurs…

    J’aime

  3. Vous précisez que vous n’avez pas mis de valeurs aux ordonnées (ramenées à l’intervalle 0/1) et votre raison est que l’on ne connait pas encore le nb de morts final; OK mais ceci renforce, me semble-t-il, la ressemblance des courbes. J’aime donc bien votre prudence et comme disait Woody, la prévision est un art incertain surtout en ce qui concerne l’avenir.

    J’aime

  4. Si votre théorie se confirme, et compte tenu de la grande diversité des politiques menées dans le monde, on pourrait en conclure que contrairement à ce qui a partout été annoncé, on ne déplace pas les courbes ou les pics avec nos politiques, autrement dit le virus arrive, passe et puis s’en va, sans qu’on sache pourquoi (dixit Raoult). Ce que nos politiques changent, c’est donc le nombre de morts par million d’habitants. Et là la France va devoir reconnaître une erreur de jugement monstrueuse avec le choix du confinement aveugle.
    Avez-vous appliqué la méthode à la Suède, qui reste par une chance inouïe le témoin nécessaire dans cette expérimentation ?

    J’aime

    • Vous avez les données pour la Suéde ici (Totalt dödsfall)
      https://platz.se/coronavirus/#jump-to-new-deaths-7-days-average

      La modélisation proposée par MD donne pour la France 92% le 5 mai = 24900 décès, soit un total final simulé de ≈ 27000 décès.
      Pour la Suéde on lit 2785 décès à environ 80% soit un total final simulé de ≈ 3500

      Ramenée en décès par millions d’habitants, en fin d’épidémie nous aurions: France = 415 et Suéde = 350.
      Les attributions des décès au covid-19 sont discutables, mais il semble néanmoins, dans cette modélisation, que la France pouvait (peut-être) avoir (même taux que la Suéde) 24900 x 315/415 = 18900 décès.
      Soit la possibilité (théorique) d’éviter 27000-18900= 8100 décès, avec un autre avantage : une économie qui ne serait pas en ruine.

      J’aime

    • Merci, mais votre lien ne concerne que « New Yotk city », certes le foyer le plus important aux USA, mais les résultats sont-ils comparable, ne serait-ce qu’avec le reste des US, sans parler du reste du monde ?

      J’aime

  5. En parcourant worldometer à l’instant une autre idée me vient : si l’on arrive à modéliser le déroulement de l’épidémie il sera peut être possible de détecter les pays qui ont triché dans les décomptes. Je ne crois pas que la Chine ait menti, ils sont suffisamment efficaces (l’hôpital de 4000 lits en 10 jours) et performants (dixit Raoult) pour obtenir ces résultats. Par contre l’Iran présente depuis des semaines une courbe très atypique.
    Il y a un autre élément mystérieux sur lequel je n’ai rien lu pour le moment; c’est le comportement en vagues qui est bien mis en évidence pas les moyennes sur trois jours que vient d’ajouter worldometer. Soit c’est un biais lié aux week-ends, soit c’est très intéressant quant au fonctionnement du virus.

    J’aime

    • Cette irrégularité que vous appelez les vagues peut être un artefact dû aux imperfections dans la transmission des données, qui est excusable (le week-end peut en être une des explications). Elle peut être aussi due au caractère aléatoire des décès journaliers, d’autant plus visible que leur nombre est faible. Pour répondre à votre première question, j’ai en effet examiné le cas de la Suède, qui est difficile à interpréter en raison justement de ces irrégularités. Mais en gros, on aboutit au même genre de courbe.
      Michel

      J’aime

      • Merci.
        Et concernant l’Iran ?
        Pour les vagues, leur régularité dans la plupart des courbes me fait pencher pour un effet week-end.

        J’aime

      • j’ai une amie qui travaille à la CNAM. pour elle, une bonne part des explications des irrégularités viendrait des décalages déclarations »week-end » .(sous toute réserve, of course).

        J’aime

      • Les données de la France sont à ce point irrégulières que par 3 fois le nombre de cas de covid-19 cumulé depuis le début de l’épidémie a diminué, les 18, 22 et 29 avril (source université John Hopkins).

        J’aime

      • Pour Aragorn
        Comme vous le suggériez, j’ai regardé le cas de l’Iran.
        Voici la courbe traitée comme les précédentes.

        Elle présente une allure analogue, mais il est exact que le paramètre d’aplatissement K est particulièrement faible par rapport à la moyenne des autres.
        Bien à vous
        Michel

        J’aime

    • @Aragorn : je me suis déjà fait cette réflexion, et comme c’est variable selon les pays, j’y vois surtout un effet week-end (dans certains pays comme les US, on voyait 0 cas les dimanches, et un chiffre très élevé les lundis)…En France aussi, on pouvait remarquer ce genre d’artefact en mars et début avril.

      J’aime

    • Je ne crois pas que les iraniens trichent. Un chercheur iranien m’a par contre informé qu’il y a un décalage d’environ une semaine.
      C’est vrai que le cas iranien est intriguant d’autant plus que leur confinement était moins strict et qu’ils ont déjà deconfiné depuis plus de deux semaines.
      Je ne sais pas à quoi c’est dû mais j’ai envie de croire que c’est le soleil qui aide les iraniens. L’évolution du climat entre janvier et mai est bcp plus significatif en Iran qu’en Europe. Ça fait qq temps que les températures montent à 30 en iran avec un ensoleillement remarquable.
      Je remarque la même chose pour des pays comme l’Égypte.
      J’ai parcouru plusieurs des études qui disent que le climat n’a pas d’impact et franchement je les trouve très très très discutables. Je pense qu’il n’existe pas aujourd’hui une étude valable sur le sujet

      J’aime

      • Aucun a priori sur les iraniens qui sont des gens remarquables, mais leur courbe est assez différente. Elle n’en finit pas d’atterrir. Pour le coup, cela donne l’impression qu’ils ont bien écrêté, eux. Mais ce sont les seuls.

        J’aime

      • Vous voulez parler de la courbe de cumul des cas?
        Si oui, ça ne m’étonne pas. Si on regarde tous les modèles, en fin d’épidémie, les courbes n’en finissent pas d’atterrir.
        De plus, une chose étrange. En lisant un article iranien sur l’estimation de R. J’ai remarqué qu’après le confinement, R continuait à descendre alors que tous les modèles sur les pays européens, dont la fameuse etude du collège impérial, montrent une baisse de R après confinement mais ce R reste constat à des vibrations près.
        Qu’est ce qui fait que le R iranien continue à baisser tout doucement ? Je ne sais pas. Mais j’ai envie de croire que c’est parce que le climat la bas est déjà estival contrairement à l’Europe où la différence entre février et maintenant est relativement bcp plus faible

        J’aime

    • Vue, très intéressante, même si vers la fin ses quelques couplets « mainstream » su le climat ou plutôt l’environnement pourront faire grincer quelques dents..;

      J’aime

  6. C’est très bien d’avoir rappelé dans les dernières lignes qu’un simple ajustement de courbes n’est pas un modèle. Pour des évolutions qui ne sont pas trop tourmentées, il est enfantin d’ajuster une fonction ayant quelques paramètres libres. Cela colle souvent très bien pour le passé mais les mauvaises surprises arrivent ensuite quand on essaie de prévoir le futur et que l’on constate un écart entre la prévision et la constatation. Un véritable modèle suppose une explication de type mécaniste et/ou le recours à des principes qui peuvent souvent s’exprimer de façon simple (ex les invariances, moindre action etc… qui ont fait le succès de la physique). A mon avis dans la « bonne science » le qualitatif précède le moulinage de chiffres. Tout le contraire de beaucoup de « recherches » bas de gammes actuelles qui se limitent à espérer trouver des relations dans des masses de données surinterprétées par des méthodes statistiques mal digérées par leurs utilisateurs qui ne maitrisent souvent pas plus le processus d’obtention de ces données et se contentent de machines et réactifs achetés sur catalogue !

    J’aime

  7. Si on mesure « t » en unites « 1/K » le fit ne dépend que d’un seul paramètre, i.e. KT.
    « La classe d’universalité » de la théorie qui sous-tend ce fit doit être rudimentaire, mais apparemment efficace.

    J’aime

  8. Ping : Benny, oui, oui | Mythes, Mancies & Mathématiques

Laisser un commentaire