Coronavirus : l’exponentielle adoucie

Nous avons vu hier une première description de l’épidémie chinoise à l’aide d’un modèle du type exponentiel-qui-fait-peur, qui montre heureusement vite ses limites. À présent, place à un modèle plus perfectionné pour mieux comprendre ce qui se passe.

Rappelons pour commencer l’allure des données sur les cas répertoriés en Chine jusqu’au 3 mars (revoici le lien vers l’ensemble des données e l’OMS) :

Le premier morceau de la courbe montre, comme nous l’avons vu hier, un comportement exponentiel. À partir du début février, une inflexion s’est produite, puis s’est accentuée au point que le nombre de cas cumulés est à peine ascendant. (Redisons aussi que le décrochage qui s’est produit au 22e jour tient à un changement de méthodologie dans le dénombrement des malades ; on n’en tiendra pas compte ici.)

Toute la question est maintenant de trouver un modèle qui rende compte de cette inflexion, ainsi que de l’asymptote horizontale qui se dessine, toutes choses que le modèle exponentiel est absolument incapable de faire. Une modèle ancien pour cela, qui a fait ses preuves, est le modèle logistique, proposé pour la première fois par Pierre-François Verhlust en 1845. Ce modèle corrige les défauts les plus manifestes du modèle exponentiel en tenant compte d’un fait important : à mesure qu’une population grandit, elle a de plus en plus de mal à grandir encore.

Verhulst s’intéressait à la population humaine, mais le fond est le même s’agissant d’un virus, de la vente d’un bien de consommation, ou même du nombre d’entrées d’un film au cinéma : dans tous les cas, après une prospérité initiale, des facteurs limitants finissent par se manifester. Pour le Covid-19 ce peut être la difficulté à trouver de nouveaux porteurs (que ce soit parce qu’il y a déjà beaucoup de personnes contaminées ou parce que celles qui n’ont pas encore été frappées sont en fait protégées par leurs défenses naturelles), ou par les mesures de protection qui sont prises et, en principe, de plus en plus drastiques à mesure de la progression de l’épidémie.

Sur les conseils de Quetelet, Verhulst a introduit une sorte de « force de frottement » à l’exponentiellle, un peu à l’image d’un mobile qui avance tout droit dans l’air ambiant et qui se trouve d’autant plus freiné par l’air qu’il rencontre que sa vitesse est importante. Si vous pédalez plus vite, vous irez certes plus vite que si vous pédalez moins vite, mais l’air exercera quand même sur vous une pression plus forte pour vous ralentir, si bien que vous avez de plus en plus de mal à accroître votre vitesse.

Pour une épidémie, l’idée est un peu la même : plus il y a de contaminés, plus il devient difficile à l’épidémie de s’étendre au même rythme qu’à ses débuts exponentiels. Mais alors qu’en mécanique la représentation du phénomène par une équation est assez naturelle (une force proportionnelle à la vitesse et de sens contraire), il n’y a pas d’équation qui s’impose naturellement pour le cas d’une épidémie. En étudiant diverses possibilités (dans le cadre de la démographie humaine, donc), Verhulst a toutefois constaté que les résultats ne différaient pas toujours beaucoup, si bien qu’il s’est finalement focalisé sur le plus simple qu’il avait trouvé. C’est celui-là que, pour des raisons obscures, il a baptisé « logistique ».

Dans le modèle logistique, au lieu de multiplier à chaque fois par une même valeur r pour passer d’un nombre au suivant, on multiplie par une valeur qui dépend du nombre de personnes déjà contaminées, et qui décroît quand le nombre de malades augmente. Plus précisément, si la population de malades un jour donné est de p, alors le modèle logistique estime le nombre de malades du lendemain en multipliant p par r(1–p/K), où r et K sont deux paramètres à choisir en fonction des données. Au début de l’épidémie, où le nombre p de malades est faible, la valeur p/K est petite (K étant choisi assez grand), si bien que 1–p/K est proche de 1, et donc qu’une multiplication par r(1–p/K) n’est pas très différente d’une multiplication par r : on est alors proche d’un modèle exponentiel. Par la suite, à mesure que p devient grand, r(1–p/K) se réduit significativement, au point d’em^êcher la population de progresser au-delà d’une certaine valeur. Voici un exemple où l’on part d’un malade initial unique, avec r = 2 et K = 100 (les valeurs indiquées sur l’axe des ordonnées sont des dizaines). On voit nettement une parenté avec la courbe chinoise.

J’en entends qui grognent dans le fond, parce ce qui précède n’est pas tout à fait correct : par souci de simplicité, les choses ont été présentées de façon séquentielle (une succession de nombres, dont chacun se calcule à partir du précédent selon une certaine règle), alors qu’en pratique le modèle logistique fonctionne plutôt sous forme continue (une courbe, et non une succession discontinue de points). La différence n’est pas énorme dans le modèle exponentiel, mais elle est immense dans le cas logistique, pour des raisons complexes qui nous emmèneraient trop loin. Contentons-nous donc de dire qu’en vrai, pour que tout fonctionne sans souci, la version continue du modèle logistique est préférable. Seul son formalisme général m’a dissuadé de le présenter comme tel, parce qu’il utilise le calcul infinitésimal. (Ouvrons donc une courte parenthèse pour les connaisseurs : dans le modèle logistique, la population y dépendant du temps t satisfait l’équation différentielle y’ = r×(1–y/Ky. En posant z=1/y, cette équation se transforme en z’ = –rz+r/K, dont les solutions sont z(t) = c×exp(-rt) +1/K, où c est une constante.)

Le modèle logistique contient donc trois paramètres. Les deux premiers sont les mêmes que ceux du modèle exponentiel : le nombre a de cas au temps 0 et le facteur de croissance r au début de l’épidémie. Le troisième, K, s’interprète rétrospectivement comme le nombre ultime de personnes que le virus parviendra à contaminer. (NB : ça ne fonctionne que pour le modèle continu, donc ne vous étonnez pas outre mesure que dans le cas séquentiel vu plus haut la ligne brisée stagne à 50 et non à 100.) Voici un choix à l’œil nu de ces trois paramètres de sorte que le modèle épouse à peu près bien les données chinoises :

Il est remarquable qu’un modèle aussi simple fonctionne aussi bien (surtout quand on se souvient que le décrochage du jour 22 est un artefact qui, une fois corrigé, ferait encore mieux coller les données au modèle). La coïncidence est d’autant plus notable que le modèle se fonde sur des mathématiques qui ne dépassent pas de beaucoup les connaissances d’un bon bachelier des filières scientifiques.

Tout n’est pas parfait, bien sûr, et notamment sur ce qui se passe ces jours derniers, où la courbe monte un petit peu plus que pour une courbe logistique véritable. Le panorama général est toutefois assez convaincant : première victime du Covid-19, l’Empire du Milieu semble appelé à en être également le premier guéri. Tout indique que, à l’échelle chinoise, le plus gros de l’épidémie est passé.

Fin de l’histoire ? Hélas non car, comme tout modèle, le modèle logistique ne peut pas être utilisé en-dehors de son domaine de validité. Ici, seul le cas chinois a été considéré, et selon l’hypothèse implicite et contestable qu’il constituerait un tout cohérent. Or l’ensemble des cas de par le monde ne constitue pas un foyer unique, et pour étudier l’épidémie à l’échelle globale il n’est pas légitime d’agglomérer simplement les cas observés pour lui appliquer le modèle logistique. Chaque foyer d’infection est spécifique et créé sa propre courbe à étudier individuellement. (Techniquement, cela se traduit par le fait que la somme de deux fonctions logistiques n’est pas, en général, une fonction logistique, surtout quand on a affaire à des phénomènes décalés dans le temps.)

Mise à la porte par le modèle logistique, la peur exponentielle peut donc tenter de rentrer par la fenêtre en arguant de la multiplication des foyers d’infection. Pour savoir ce qu’il en est (spoiler : pas de panique), il faut analyser plus finement les données. Rendez-vous demain.

29 réflexions au sujet de « Coronavirus : l’exponentielle adoucie »

  1. Décidément la formule feuilleton est passionnante ! Vivement demain pour voir si le côté obscur de la force sera terrassé par le laser mathématique.

    J’aime

  2. C’est clair, instructif, amusant, haletant… Merci pour ce joli morceau de pédagogie. Je rêve que des enseignants de terminale puissent le mettre à profit pour montrer en quoi les maths sont une clé de compréhension du monde réel .

    J’aime

  3. Passionnant! Et à mettre en parallèle avec les catastrophismes des marchands de peur écolo.
    Question mode « cynique/parano/complotiste » : les autorités chinoises, passé le moment de la tentative locale du déni et de la minoration ensuite, pourraient-elles -car ils sont loin d’être tous idiots- justement utiliser ce modèle pour communiquer de fausses informations minorant la réalité pour empêcher d’être accusé?
    Perso, je n’en suis pas sûr mais je préfèrerai vérifier…avec des proxies : c’est en analysant la croissance de la consommation énergétique que les économistes s’étaient aperçu que les chiffres de la croissance officielle chinoise étaient du pipeau.
    Maintenant, quelles proxies utiliser……
    J’ai entendu que les usines ré-ouvraient…..

    J’aime

  4. «le modèle se fonde sur des mathématiques qui ne dépassent pas de beaucoup les connaissances d’un bon bachelier des filières scientifiques».
    De mon temps, c’était plutôt en première année de prépa. Des connaissances à ne surtout pas laisser soupçonner en entreprise pour ne pas passer pour un « professeur Tournesol ». En revanche le calcul informatique à outrance, voire à tort et à travers sans se soucier des domaines de validité, est bien vu.

    Aimé par 1 personne

    • En effet, aujourd’hui, les élèves de terminale ignorent ce qu’est une équation différentielle, sauf peut-être y’=y.
      L’équation de Verhulst a été le sujet du bac S en 2003 : beau scandale, elle nécessite un changement de variable, comme Benoît l’a expliqué, alors que les instructions officielles disaient que le changement de variable était hors programme. Résultat des courses : des élèves perdus, et l’épreuve de maths a dû être corrigée avec un barème sur 25 ou 30 points, suivant les académies, afin d’obtenir une moyenne conforme à celle des autres années.
      Le calcul informatique à outrance, comme vous dites, cela nous donne des prévisions de température apocalyptiques. Si l’ordinateur le dit, c’est mieux que la boule de cristal.

      J’aime

  5. Merci vivement Benoît d’attirer notre attention sur la fonction logistique. Outre l’épidémiologie qui donne lieu à votre passionnante série d’articles, la « courbe en S » trouve en effet des applications dans une multitude de domaines : croissance des êtres vivants, démographie, économie, apprentissage. Elle est pourtant largement ignorée. Il est plus vendeur de dire que « P augmente de x% par an (ou par jour, etc.) » ou que « la croissance est exponentielle », ce qui n’est approximativement vrai qu’en début de périodes. Il est certes commode de se référer au passé proche mais une extension inconsidérée dans le temps est à l’origine d’un grand nombre de contre-sens et de déconvenues parfois tragiques. Les boursiers savent que les arbres ne montent pas jusqu’au ciel, mais certains ont parfois tendance à l’oublier.
    Michel

    J’aime

  6. Merci pour tout cela, Benoît.
    Il est significatif qu’il faut sans doute que l’Homme soit confronté à des dangers pour que lui soient rappelés les principes sur lesquels sont basés la plupart des phénomènes vivants : il y a une phase exponentielle dans la croissance, en nombre de cellules mais aussi en taille, en poids, etc. de chaque être vivant. Mais il y a toujours tassement et courbe en S. Les phénomènes économiques sont copiés sur le vivant comme le rappelle MD ci-dessus. Les causes des tassements de croissance, comme le rappelle Benoît, sont différentes, selon l’objet biologique ou économique étudié : il peut être intrinsèque (génétique, dans le cas de la croissance de l’arbre ou simplement de la feuille) ou extérieur (s’il n’y avait pas de facteur extérieur limitant, le monde serait bactérien ou « mouche » en peu de temps). La nature est donc prudente et il ne semble pas y avoir beaucoup de cas de parasites ou de pathogènes qui aillent jusqu’au bout et détruise l’espèce qui leur ont servi de nourriture. C’est une des déductions de la théorie darwinienne. J’ai eu la tentation d’en douter au moment de la destruction des buis par la pyrale, en voyant l’hécatombe. Mais il y aura finalement un équilibre entre le pathogène et son hôte, parce que la Nature a « prévu » des conditions tellement précises pour le développement du parasite qu’il ne détruira pas son hôte. Ce sera le cas, « mutatis mutandis », pour le Covid.

    J’aime

  7. petit HS… quoique…
    La courbe des températures « moyennes globales », est-elle sous la forme exponentielle ou logistique ?
    Vous avez le temps de plusieurs rapports du GIEC pour répondre 🙂

    J’aime

  8. J’ai un problème avec l’équation différentielle z’ = –rz+r/K
    Je trouve les solutions de la forme z = c.exp(-rt)+ rt/K + d
    au lieu de z(t) = c×exp(-rt) +1/K
    ai-je faux?

    J’aime

    • Élève acpp, vous avez faux, en effet.😉
      La question est celle d’une solution particulière. Si on en cherche une qui soit constante (z=b), alors on a z’=0 et, dans l’équation, on doit trouver la valeur de b telle que -rb+r/K=0. C’est b=r/K, d’où ce qui est dans le texte.
      Si on cherche une solution sous forme affine z=at+b, alors on a z’=a, donc, dans l’équation, a=-r(at+b)+r/K, soit encore art+(a+rb-r/K)=0. Par identification, on en tire a=0 et on est ramené au cas d’une solution particulière constante.

      Aimé par 1 personne

      • Mis à part ceque vous avez écrit entre :  » Elève acpp,…..  » et  » ……. particulièrement constante. « , j’ai tout compris !
        Climatiquement vôtre. JEAN

        J’aime

  9. Dans la série « les arbres ne montent pas jusqu’au ciel »:

    Don’t assume straight lines. Many trends do not follow straight lines but are S-bends, slides, humps, or doubling lines. No child ever kept up the rate of growth it achieved in its first six months, and no parents would expect it to.

    C’est le principe numéro 3 de « factfulness » de Hans Rosling.

    https://www.gapminder.org/factfulness/straightline/

    J’aime

  10. Le risque dans cette histoire c’est surtout l’engorgement du système de santé et des dégâts collatéraux que cela engendrent. Les précautions mises en place sont tout à fait justifiées. Pas de panique inutile mais de la vigilance permanente.

    1% de létalité sur 1 million de personnes, je vous laisse calculer le nombre de places de cimetière que cela représente. Et 10% en réanimation ? Calculez le nombre de lits nécessaires en réanimation sur le nombre de lits disponibles en France (5700 en 2006 d’après une rapide recherche Google, à confirmer) et vous comprendrez pourquoi le gouvernement cherche à retarder et à étaler le pic le plus possible (notamment pour ne pas que ça tombe pendant l’épidémie de grippe qui sature déjà les services de gériatrie).

    Pas de croissance exponentielle, évidemment, mais un vrai risque systémique. Soyez raisonnablement prudents, faites des stocks de nourriture d’une semaine voir deux (c’est de toutes les façons recommandé par la sécurité civile) et prevoyez une pile de bon bouquins. Dans le meilleur des cas, cela ne servira pas.

    J’aime

    • « Pas de panique inutile mais de la vigilance permanente. »

      Vigilance? Vous parlez de l’action du gouvernement?

      Une agitation désordonnée et généralement débile, faisant fermer les marchés ouverts mais pas les grandes surfaces, annulant les matchs de basket mais pas de foot, même internationaux… bref l’incompétence attendue pour les décisions des pervers récupérés dans l’entourage de DSK et de Macron, des préfets et autres relais serviles recrutés pour leur servilité…

      J’aime

  11. Chers cousins,

    J’observe votre désarroi de mon côté de l’Atlantique. Je comprends que Patrick, 55 ans, retraité de la RATP qui vit en bonne santé à Honfleur veut savoir
    1- la probabilité qu’il soit atteint par le virus
    2- ses chances de survie le cas échéant.
    Avons nous les ordinateurs pour arriver à lui donner les réponses ? oui
    Avons-nous les données pertinentes pour obtenir les réponses ? non
    Pouvons-nous les obtenir ? oui
    Comment ? en demandant à ce gros machin (ONU) d’arrêter de nous les casser avec un prêche contre un gaz bénéfique pour la planète et se concentrer sur LE vrai problème (évaluation des risques et élaboration d’une solution). J’ai écrit un billet sur ce sujet

    CORONAVIRUS,  PRINCIPE DE PRÉCAUTION ET ÉVALUATION DU RISQUE

    et en ai parlé ce matin à la radio de Québec

    https://radiox.com/rnc/reynald-du-berger-denonce-les-fakes-news-climatiques/2020/03/03/

    Prompt rétablissement chers cousins !

    J’aime

  12. Les informations disponibles sont encore un peu légères pour envisager des modèles mécanistes subtils. En Chine on suit l’évolution du nombre de cas et de décès mais le nombre de tests biologiques est faible. Un suspect est simplement une personne ayant des signes de pneumonie sans que l’on sache combien sont contaminé par le covid19 et combien ont un pneumonie pour d’autres raisons. Sachant que la pneumonie est hélas assez répandue, il est possible que l’on surestime les contaminés covid. Il serait aussi intéressant de savoir parmi les décès de pneumonies, combien sont contaminés covid et combien ne le sont pas (et s’ils le sont ce peut être une simple coïncidence normale dans une population où le virus est très répandu). Enfin, ce qu’il faudrait savoir c’est combien la population contient maintenant d’anciens contaminés. Pour une épidémie qui en Chine dure depuis plus de deux mois et qui a une phase initiale exponentielle assez brutale, il ne serait pas étonnant qu’il y ait beaucoup de personnes ayant été contaminé et n’ayant eu que peu de symptômes au point de ne pas s’en soucier. La montée de la proportion d’immunisés par un premier contact peut largement contribuer à l’effet « logistique ».

    J’aime

  13. Ping : Coronavirus : l'exponentielle prend fin dans les trois principaux foyers hors de Chine | Mythes, Mancies & Mathématiques

  14. Ping : Coronavirus : décès et pyramide des âges | Mythes, Mancies & Mathématiques

  15. Si mes souvenirs sont exacts Verhulst se faisait fort de déterminer les coefficients de la courbe logistique en connaissant trois stades de l’évolution d’une population.
    A-t-on essayé de le faire avec la « population » des contaminés par le virus pour déterminer la phase finale

    J’aime

    • Le site elm.nsupdate.info contient des courbes pour chaque pays. Les estimations pour la France sont très instables, parce que les données sont irrégulières. Elles ne suivent pas une belle courbe bien homogène, mais sont en marche d’escalier. Du coup, un jour le point d’inflexion est presque atteint, et le lendemain il s’éloigne dans l’avenir.
      En revanche pour les province Chinoises, les estimations ont rapidement été très bonnes.

      J’aime

  16. Je ne suis pas mathématicien mais globalement, pour les différents pays, j’aurai plus l’impression que les courbes d’évolution des décès (DC=y= f(t)) sont mieux décrites par un fit logistique 4 paramètres, une sigmoïde (selon Rodbarr) tel que:
    y=M+[(m-M)/(1+(t/ti)↑Pi)]
    – M est la valeur Max de la sigmoïde (l’asymptote)
    – m est le valeur min (au départ de l’épidémie)
    – ti est le temps pour atteindre le point d’inflexion (valeur max des DC/j)
    – Pi est la pente de la courbe au point d’inflexion ((t/ti)↑Pi , exprime que le terme (t/ti) est à la puissance Pi.
    Les fits ainsi obtenus par approche successives, en modulant manuellement les différentes constante (M,m,ti et Pi) sont plutôt meilleurs que ceux obtenus par le fit logistique y(j)=y(j-1)*r*[1-y(j-1)/K] proposés dans l’article

    J’aime

    • Pensez vous pouvoir modéliser la propagation du virus en France ?Ça serait vraiment intéressant. Ça pourrait en particulier nous donner une idée sur le nombre de cas déjà immunisé.
      Merci

      J’aime

Laisser un commentaire