Dans ma boule de cristal je vois… je vois… le fichier top secret des températures utilisé par Météo France pour constituer le diagramme de son Bilan climatique 2011… Je n’ai pas le temps de noter, je suis trop concentré sur la boule pour retenir les chiffres qui dansent devant mes yeux… Là ! Une formule ! Je n’en vois qu’une partie, c’est… c’est… C’est la façon dont la moyenne annuelle est calculée ! Argh… ma tête me fais mal, la vision ne va pas durer… allez, encore un effort… oui, je vois… je vois… je vois un arrondi au centième près par défaut. La vision se brouille : c’est fini. Épuisé par l’effort, je m’effondre devant ma boule de cristal.
Le caractère artisanal que j’ai employé pour reconstituer les données sous-jacentes au diagramme de Météo France me rend un peu prudent. Comme critère d’évaluation de mon travail, outre la superposition de mon propre graphique avec celui de MF (qui donne un résultat apparemment très bon), j’ai eu après coup l’idée d’un petit test complémentaire qui utilise le fait que l’anomalie est mesurée par rapport à une moyenne sur 30 ans. En conséquence, si ma reconstitution artisanale des données est exacte, alors par définition la somme des anomalies sur ces 30 années doit faire 0°. À peu près, disons.
Sauf que quand je l’ai fait, le calcul m’a donné la valeur 11,68°. Pas besoin de vous dire que j’ai eu un moment d’angoisse : me serais-je donc trompé de près de 0,4° en moyenne chaque année, sachant que la longueur des bâtons du diagramme n’est que de l’ordre de 1° ? (Allô le cabinet d’ophtalomologie ? C’est pour un rendez-vous en urgence s’il vous plaît !) C’est cette angoisse qui m’a conduit à la découverte que les 30 années de référence prises par MF ne sont pas toujours les mêmes. Ces 11,68° se fondent sur une normale calculée sur la période 1981-2010 (celle indiquée dans l’un des courriers de MF), alors que la période à utiliser, indiquée sur le diagramme, est 1971-2000.
Pour cette période 1971-2000, la somme est déjà plus raisonnable : -0,07°. C’est nettement mieux, mais tout de même encore assez significativement loin de 0°. N’oublions pas en effet que je crois mes mesures précises au centième près. Un écart de 0,07° suggère donc un nombre d’erreurs au moins égal à 7, et potentiellement même plus élevé puisque certaines erreurs peuvent se compenser. Sur 30 mesures, ça ferait beaucoup : ce serait du même ordre de grandeur que les erreurs commises par l’IPSL (sauf qu’eux c’est pour des mesures au dixième près, héhé…), c’est dire !
Il est certes plausible que mes estimations soient entachées d’erreurs, mais une autre explication peut également être avancée, la voici. Lorsque MF calcule ses anomalies annuelles, le résultat a à l’évidence plus de deux chiffres après la virgule en général. Imaginons que l’arrondi au centième se fasse systématiquement par défaut : ainsi, 0,432 est arrondi à 0,43, et 0,439 également à 0,43. La somme des anomalies de 1971 à 2000 faite à partir d’évaluations au centième sous-estime alors nécessairement la normale calculée sans cet arrondi. Plus exactement, elle la sous-estime en moyenne de 0,005° pour chaque année, ce qui donne un écart total moyen de 30×0,005.
J’ai d’abord été très content, parce que j’ai calculé mentalement ce produit selon une procédure qui revenait en fait à diviser au lieu de multiplier par 5, ce qui m’a donné le résultat très confortable de 0,06°. Calcul faux, donc, même s’il m’arrangeait. Moralité : la recherche, c’est avoir quelques idées, mais aussi et surtout corriger ses erreurs…Bref : 30×0,005, ça fait en fait 0,15°. Vu de loin, je pourrais pavoiser, vu que mes 0,07° sont loin en dessous. Le problème, c’est qu’ils sont en fait maintenant trop en-dessous. Alors il faut chercher encore… Bien sûr, il doit rester clair de bout en bout que mes données sont peut-être tout simplement mal mesurées. Mais cela n’interdit pas de chercher une autre explication cohérente. J’en ai trouvé une en me souvenant que, comme déjà noté ici, une division d’un nombre décimal par 30 produit un nombre qui est soit décimal, soit se finit par une infinité (drôle de façon de le dire !) de 3 (comme pour 1/30 = 0,03333…), soit par une infinité de 6 (comme pour 2/30 = 0,0666666…). Puisqu’il s’agit de faire une moyenne sur 30 stations, ce phénomène a une conséquence particulière, qui se manifesterait certes pour une division par un autre nombre mais de façon en général beaucoup moins marquée (parce qu’il est rare que la période, c’est-à-dire le motif qui se répète à l’infini dans l’expression décimale, ne soit composée que d’un seul chiffre). Pour une division par 31 ou par 29, on ne s’en rendrait même pas compte. Mais ici, donc, une fois sur trois les valeurs montrent des 333333…, une fois sur trois des 666666… et une fois sur 3 rien du tout : le nombre est décimal. En moyenne, donc, la différence entre mon arrondi et la vraie valeur de MF n’est pas de 0,005° (comme ce serait le cas si les arrondis se baladaient un peu au hasard entre 0° et 0,01°), mais de (1/3)×0,003333… + (1/3)×0,006666… + (1/3)×0, qui vaut 0,00333…° (c’est-à-dire, en fait, 1/300). C’est assez nettement moins que les 0,005° que j’avais pris au départ. Multiplié par les 30 stations, cela donne un écart moyen à prévoir de 0,1°, déjà beaucoup plus proche des 0,07°. On peut même s’en approcher encore plus en supposant, ce que me dit ma boule de cristal, que les vraies valeurs de MF ne contiennent pas des 333333… ou des 66666…, mais des arrondis au millième par défaut. Dans ce cas, l’écart moyen n’est plus donné par l’expression (1/3)×0,003333… + (1/3)×0,006666… + (1/3)×0, mais par (1/3)×0,003 + (1/3)×0,006 + (1/3)×0, qui vaut 0,09°, ce qui est encore mieux.
Une explication bricolée après coup, j’en conviens, et qui ne permet de toute façon pas d’exclure des erreurs de ma part dans ma reconstitution du diagramme de MF. Elle montre toutefois que le choix d’un arrondi peut avoir un certain effet dans la définition d’une normale, et renforce l’idée qu’en réalité, une température normale ne devrait pas être définie en référence à une moyenne, de toute façon imprécise car il n’est pas crédible qu’on puisse mesurer au centième de degré la température annuelle d’un lieu donné. Sans y avoir beaucoup réfléchi, je pense qu’une médiane serait une meilleure idée.
Ping : Le retour de 0,07 | Mythes, Mancies & Mathématiques