Analyses statistiques de la Coupe du Monde 2018 en Russie (2)

Dans l’article d’hier, nous avons identifié quelques indicateurs de description d’un match de football : possession, passes, tirs et, paramètre plus complexe, buts escomptés (xG). Il est tentant d’utiliser ces « proxys » pour essayer de prévoir l’issue d’un match de football. C’est ce dans quoi s’est lancé le site américain FiveThirtyEight. Initialement spécialisé dans le « journalisme de données » appliquées aux élections américaines, il se consacre aussi aux événements sportifs, à partir d’informations statistiques.

Il était donc logique que ce site se lance dans des prévisions sur la Coupe du Monde 2018. Pour cela, FiveThirtyEight a conçu un « indice de niveau footballistique » (« Soccer Power Index », SPI) à partir d’informations sur les résultats récents des sélections qualifiées pour cette compétition ainsi que sur les buts escomptés (xG) au cours de leurs matches et sur le niveau individuel de chacun des joueurs. À partir du SPI de chaque équipe, FiveThirtyEight a déterminé des probabilités de résultat pour chaque match de la Coupe du Monde et, à l’aide de ces probabilités, a construit les différents scénarios possibles pour l’ensemble de la compétition. Après avoir fait tourner son modèle un grand nombre de fois, le site a pu obtenir les probabilités de succès (et d’accession à tous les stades de la compétition) pour l’ensemble des équipes.

Un modèle qui évolue avec la réalité

Le résultat est ici et il était actualisable au jour le jour pendant la compétition : un menu déroulant juste sous le tableau principal permet de remonter le temps et d’observer l’évolution des chances de chaque pays au fur et à mesure de l’avancement de la Coupe du Monde.

Plaçons-nous par exemple avant la compétition : le Brésil était donné favori avec 19 % de chances de gagner la Coupe du Monde et 46 % de chances d’atteindre les demi-finales. La France faisait partie des favoris, mais dans une moindre mesure : sa qualification pour les huitièmes de finale avait une probabilité de 86 %, mais celle pour les demi-finales de seulement 31 % et la victoire finale était annoncée à 8 %. Quant au tenant du titre, l’Allemagne avait 90 % de chances de se qualifier pour les huitièmes de finale.

À l’issue de la deuxième journée de la phase de poules (« before 3rd group matches »), certaines équipes (dont la France et les trois autres futurs demi-finalistes, d’ailleurs) étaient certaines d’être qualifiées pour les huitièmes de finale et l’Allemagne, malgré sa défaite initiale contre le Mexique, conservait la probabilité la plus élevée des équipes de sa poule de se qualifier pour les huitièmes de finale, avec 87 % ! Mais sa maladresse offensive, son déséquilibre global et ses fragilités défensives ont été logiquement punis par la Corée du Sud : malgré une victoire 2,98 à 1,16 en buts escomptés, cela a donné une défaite allemande 0-2 dans le monde réel. En passant, on peut s’étonner du minuscule xG = 0,12 correspondant au second but coréen, sur un tir d’un joueur professionnel sans opposition à six mètres du but vide… Il faut croire qu’il manque encore des paramètres pour bien estimer les xG

Après la phase de poules (« before round of 16 »), la France était favorite de son huitième de finale contre l’Argentine mais restait en cinquième position pour la victoire finale, juste derrière l’Angleterre, deuxième d’une poule très faible, et loin derrière le Brésil (25 %).

Son très bon huitième de finale faisait passer la France au deuxième rang des favoris (15 % de victoire finale), toujours loin derrière le Brésil (30 %), dont le sempiternel destin allait se réaliser en quart de finale. Et ce n’est donc qu’à l’entrée dans le carré final que la France est devenue favorite pour ne plus quitter ce statut.

Des probabilités en temps réel

Mais ces prévisions sur chaque match de la compétition pouvaient même être encore plus raffinées, avec des calculs de probabilités de victoire au fur et à mesure du match ! Je laisse le lecteur découvrir l’ensemble des évolutions pour chaque match, c’est très distrayant à regarder, on voit bien les brusques variations après chaque but ou chaque expulsion…

Exemple, France-Australie : en bleu, probabilité de victoire de la France ; en gris clair, probabilité de match nul ; en noir, probabilité de victoire de l’Australie.

FRA-AUS

Au coup d’envoi, la probabilité de victoire de la France est de 77 %, celle de l’Australie de 7 % et celle de match nul de 16 %. Juste avant le penalty français (58e minute), les probabilités de victoire de l’Australie (11 %) et surtout de match nul (38 %) ont augmenté, celle de victoire de la France diminué (51 %). Le but de Griezmann donne brutalement 86 % de victoire à la France avant que la main d’Umtiti ne relance le match nul (61 % à la 80e minute) puis que la contribution involontaire de Behich sous la pression de Pogba ne fasse passer la victoire française à 89 % puis 100 % de probabilité une fois le match terminé !

Voici maintenant un exemple de match « bien géré » (1-0 pour la France contre le Pérou, but à la 34e minute) et un exemple d’effondrement de favori (2-0 lors de Corée du Sud-Allemagne, deux buts inscrits dans les arrêts de jeu) :

FRA-PER, KOR-GER

Lors des matches à élimination directe, le match nul est impossible. Cela donne ceci pour le mouvementé France-Argentine, Croatie-Danemark (avec deux buts dans les cinq premières minutes et des montagnes russes lors de la séance de tirs au but), Croatie-Angleterre dont nos amis voisins d’Outre-Manche doivent encore se demander comment ils ont fait pour le perdre, et l’étrange finale France-Croatie.

F-A, C-D, C-E, F-C

La musique durcit les cœurs

Bon, les statistiques, le travail de fourmi d’analyse de milliers de match, c’est très bien, mais la vraie science, ce n’est pas ça. La vraie science, c’est avoir une idée, bonne ou mauvaise, et suffisamment peu de scrupules pour en faire la publicité. Et cela donne des uneétudes, reprises par la plus grande presse française.

Ainsi, 20 minutesl’ÉquipeFrance Inter et Futura-sciences, toujours à la pointe du progrès, ont-ils relayé une uneétude de la-très-sérieuse-revue Journal européen des sciences et du sport indiquant que les joueurs qui chantent avec passion leur hymne national avant un match augmentent leurs chances de le gagner.

Soyons justes avec la presse française, cette uneétude a souvent été citée de façon moqueuse. On peut néanmoins s’interroger sur le fait que les grands médias détectent la junk science quand il s’agit de football mais plus rarement à propos de certains domaines de « science dure ».

Les auteurs de l’uneétude en question sont anglais et australiens. Ce n’est sans doute pas par hasard si l’auteur principal porte le même nom qu’un footballeur australien des années 80 et 90, qui a même joué au feu Racing Club de Lens. L’uneétude n’étant pas en accès libre (normal vu sa qualité) et comme je crains que les lecteurs n’aient pas 141 € à consacrer pour louer ce puits de science pendant 30 jours, en voici un petit résumé.

Le principe est simple. Deux observateurs ont noté de 1 à 7 les indicateurs verbaux (intensité du chant) et non-verbaux (expression faciale, langage du corps comme la façon dont les joueurs s’enlacent) des joueurs pendant les hymnes avant le début de chaque match de l’Euro 2016, la note 1 signifiant l’absence de passion et la note 7 une très grande passion. Attention, ce travail n’a pas été confié à n’importe qui : les observateurs étaient des diplômés en psychologie du sport et il y avait un « haut degré de correspondance » dans leurs notes. Et en cas d’écart important entre leurs notes, la différence était « résolue par discussion ». Les bases sont sûres.

Et le résultat parle de lui-même :

Passion

En abscisses, on reconnaît la note de passion dans le chant de l’hymne (de 1 à 7). L’ordonnée est un paramètre caractérisant la probabilité de victoire. En phase de poule (« Group Stage »), la note de passion n’a pas d’influence significative sur le résultat. Mais alors pendant la phase à élimination directe (« Knockout Stage »), ça change sérieusement : observez cette superbe évolution affine, où les points s’alignent comme par la magie d’un modèle climatique ! Et puis on ne peut pas douter de sa reproductibilité puisque cette analyse sur les matches à élimination directe porte sur un vertigineux échantillon de quinze matches.

L’uneétude va plus loin en indiquant que le chant passionné n’a pas d’impact sur le nombre de buts inscrits mais permet de réduire le nombre de buts encaissés. Et les auteurs ne s’arrêtent pas en si bon chemin, ils poussent plus loin leur analyse en identifiant trois mécanismes pour expliquer l’évolution observée :

  • Une équipe manifestant une grande passion pendant l’hymne a une identité sociale plus forte, ce qui a une influence favorable sur la performance des joueurs.
  • Être passionné pendant l’hymne donne des avantages psychologiques, comportementaux et de performance ; il est logique que les bénéfices soient surtout visibles dans les phases défensives car des joueurs passionnés sont plus enclins à se sacrifier pour l’équipe (je traduis comme je peux « putting one’s body on the line »).
  • Une exécution passionnée de l’hymne manifeste un esprit de corps qui peut aussi intimider l’équipe adverse. Tiens, il suffit de regarder le haka des rugbymen néozélandais pour s’en convaincre. Non, ce n’est pas une blague, les auteurs donnent vraiment cet argument.

Néanmoins, les auteurs, qui sont des vrais scientifiques critiques et qui ont besoin de justifier de prolonger leurs travaux pour glandouiller sur des sujets pareils, n’ont pas peur de souligner les limites de leur uneétude : « This study is not without limitations ».

  • Ils ont observé la passion mais pas mesuré l’expérience de passion des joueurs ni leur identification sociale : il faudrait conduire des « études longitudinales » sur les joueurs pour juger en quoi la passion est un moteur pour eux.
  • Ils n’ont pas pu mesurer l’augmentation des paramètres physiologiques liés à la passion des joueurs.
  • Cette étude n’a analysé que le résultat du match et pas des paramètres plus subtils, comme le nombre de passes entre les joueurs.

Enfin, dans leur conclusion, les auteurs, qui ne sont pas nés de la dernière pluie, mettent en garde contre des simplifications outrancières. Il ne suffirait pas qu’un entraîneur dise à ses joueurs de chanter l’hymne avec beaucoup de passion : il faut que cette passion soit sincère et qu’elle représente vraiment l’enthousiasme de l’identification psychologique au groupe.

Vivement la prochaine Coupe du Monde de rugby qu’on puisse voir comment le haka des joueurs fidjiens, samoans, tongiens va les emmener en finale !

Publicité

Une réflexion au sujet de « Analyses statistiques de la Coupe du Monde 2018 en Russie (2) »

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s