L’une des séries de données que j’ai réclamées à Météo France est celle des anomalies annuelles de température en France, qui correspondent à ce graphique.
Lorsque j’ai découvert, et donc signalé à Météo France, que ces données qu’elle me refusait étaient en réalité en accès libre sur le site de l’IPSL, il m’a été répondu notamment ceci :
les données du fichier excel du site cycleducarbone.ipsl.jussieu.fr semblent présenter une ou plusieurs anomalies. L’année 2009 aurait pour valeur de l’indicateur 11.1. La normale de température pour les 30 dernières années est de 12.6 (source MF).
(…)
Le site de Jussieu précise que « les captures d’écran de cette page représentent des données s’arrêtant en 2008 ». Le fichier excel n’a peut être pas été mis à jour comme il est précisé. Pour toutes les années antérieures il y a cohérence.
La phrase importante est la dernière : « pour toutes les années antérieures [à 2008] il y a cohérence. » Il est légitime de supposer que mon correspondant a comparé le fichier Excel de l’IPSL avec celui de Météo France et qu’il a vérifié que les deux coïncidaient jusqu’en 2008. En attendant que MF daigne me donner le fichier (j’attends toujours) ou que la CADA l’enjoigne de le faire, ce courrier de Météo France affirme à l’évidence qu’on peut utiliser le fichier de l’IPSL en confiance avant 2008. (Je traiterai dans un autre article le cas des années plus récentes.)
N’étant pas tout à fait un perdreau de l’année, j’ai quand même voulu vérifier que le fichier de l’IPSL donnait bien le même graphique que celui publié par Météo France jusqu’en 2008. J’ai donc tracé le graphique suivant, constitué des données du fichier de l’IPSL normalisées un peu comme j’ai pu.
Je profite de l’occasion pour dire tout le mal que je pense de la forme donnée au graphique de MF (et par ricochet le graphique ci-dessus, conçu pur lui ressembler), qui accorde une importance privilégiée à une « valeur normale » pourtant purement conventionnelle et force l’œil à ne lire le graphique que par rapport à cette référence, ce qui pollue considérablement l’environnement visuel de la courbe. Passons.
Deux points doivent être notés avant toute tentative de comparaison :
1) l’IPSL donne des températures absolues là où Météo France donne des écarts à une température de référence. Il y a donc une soustraction à faire. Ça n’a rien de difficile, sauf que la valeur à soustraire n’est probablement pas la normale de 12,6°C prise par Météo France. (Ç’aurait été trop beau.) Conséquence : il ne faut pas attacher trop d’importance à une éventuelle différence qualitative du genre « chez l’IPSL l’année n est au-dessus de la moyenne alors qu’elle est en-dessous chez MF ».
2) l’IPSL donne des températures au dixième de degré près, alors que le graphique de Météo France est manifestement constitué de données plus précises, probablement au centième près. (Voyez par exemple, dans le graphique de Météo France, les années 2004 et 2005 : les valeurs correspondantes sont distinctes mais, selon l’échelle des ordonnées, leur différence est nettement inférieure à 0,1°C ; selon ma propre mesure, elle est voisine de 0,01°C : cf. ci-dessous.) De petits écarts entre les deux fichiers sont donc inévitables et pas forcément significatifs.
Une fois formulées ces réserves importantes, voici une superposition des deux diagrammes.
Même en tenant compte des points 1 et 2, la comparaison ressemble à un jeu des 7 erreurs. Pour en avoir le cœur net, je me suis donc lancé dans ce que j’espérais pouvoir éviter de faire : évaluer à la main chacune des valeurs du graphique de MF. Pour ceux que cela intéresse, j’ai mis les résultats dans un fichier que vous pouvez télécharger (ReconstitutionGraphiqueMF). La mesure « à la main » a été un peu longuette, mais pas difficile. Avec un logiciel de géométrie (GeoGebra), j’ai placé en tant qu’image le graphique de MF sur une fenêtre et j’ai, pour chaque année n, mesuré la distance (normalisée, j’espère convenablement) entre l’origine du repère et la droite horizontale passant par le bout du bâton de l’année n. Ci-dessous les exemples superposés des années 2004 et 2005, dont la distance évaluée à 0,01°C indique qu’il n’y a pas besoin d’un œil de lynx pour espérer une précision de l’ordre du centième de degré, même s’il faut bien sûr rester prudent dans l’interprétation de données obtenues d’une telle manière.
Une fois effectué cet ingrat travail de mesure (pour lequel je devrais peut-être envoyer la facture à MF…), j’ai superposé le graphique qui s’en déduit de celui de MF pour voir si je n’avais pas fait un trop mauvais boulot. Voici :
Mon vieux Ben, c’est bon : t’as pas encore besoin de prendre rendez-vous chez l’ophtalmo.
Une fois les valeurs du graphique de MF connues, on peut évaluer les écarts avec les données de l’IPSL. C’est là qu’il faut choisir une valeur normale de référence à soustraire (point 1 ci-dessus). Sans pouvoir garantir l’exactitude de mon choix, il me semble que la valeur de 11,7°C ne doit pas être loin de la vérité. Voici un graphique qui présente, avec cette valeur, la différence entre les anomalies de l’IPSL et celle de MF. Comme vous le voyez, c’est une jolie crosse de hockey qui apparaît.
Le problème vient de l’année 2009, et il faut reconnaître que MF m’avait prévenu.
Deuxième tentative, en arrêtant le graphique juste avant cette année mystérieuse :
Même dans un monde idéal où le fichier de l’IPSL correspondrait à celui de MF, le fait que l’IPSL ait arrondi à un seul chiffre après la virgule fait que la courbe ne pouvait pas être parfaitement horizontale et située à la hauteur zéro : il y aurait forcément eu quelques fluctuation dues aux arrondis. Sauf que ces fluctuations ne peuvent normalement pas sortir d’un intervalle de taille 0,1°C. Par exemple, si, comme il est le plus logique, les arrondis de l’IPSL ont été faits au plus proche dixième (en arrondissant 0,43°C à 0,4°C et 0,47°C à 0,5°C, par exemple), alors la courbe ci-dessus devrait rester à l’intérieure d’une bande horizontale limitée par les valeurs -0,05 et +0,05. Pour tenir compte des imprécisions dans mes mesures, on peut pousser jusqu’à -0,06 et +0,06, mais pas plus. Chaque écart dépassant 0,06 (en plus ou en moins) correspond donc à une année pour laquelle l’IPSL et MF divergent. Cela se produit dans 28 cas. Sur 111 années, cela fait tout de même un taux d’erreur de 25 %.
Si c’est cela que Météo France considère comme des données « en cohérence », alors nous n’avons pas la même définition du mot.
Précisons que cette divergence reste qualitativement le même lorsqu’on change la valeur de référence (11,7°C), c’est-à-dire, de manière équivalente, qu’on fait glisser la bande horizontale autorisée vers le haut ou vers le bas (en pratique, ce qui est gagné d’un côté est perdu de l’autre).
Enfin, j’ignore s’il faut chercher une tendance quelconque dans cette courbe des écarts entre MF et l’IPSL. Le fait que les données de MF soient homogénéisées à partir de 1947 a-t-il quelque chose à voir avec le décrochage particulièrement brusque qui se produit au début des années 1950 ? Coïncidence, peut-être.
À suivre…
Il semble que vous avez levé un lièvre et que vous le poursuivez. Mais votre article, remarquablement construit, est difficile d’accès. On ne voit pas bien le lièvre…Ce que je vois, c’est que vous montrez que la crosse de hockey apparaît de manière artificielle. Est-ce cela l’essentiel ?
J’aimeJ’aime
La crosse de hockey n’est ici qu’anecdotique. Le lièvre est dans le titre : le fichier de l’IPSL et le diagramme de MF, pourtant en principe tous deux issus des mêmes données, divergent dans beaucoup de cas antérieurs à 2008 (contrairement à ce que m’avait dit MF).
J’aimeJ’aime
Ping : 2009, 2010 et 2011 | Mythes, Mancies & Mathématiques
Ping : Petit exercice de voyance mathématique | Mythes, Mancies & Mathématiques
Ping : Que les vraies températures lèvent le doigt ! | Mythes, Mancies & Mathématiques
Ping : La France a enfin sa crosse de hockey | Mythes, Mancies & Mathématiques