La majorité des parieurs débutants, voir intermédiaires vont souvent s’appuyer principalement pour évaluer des données lors de leurs analyses sur la moyenne, notamment parce que celle-ci nous est familière depuis notre enfance, qui n’a pas calculé sa moyenne à l’école ( et si ce n’est pas nous, nos gentils professeurs s’en chargeaient pour nous sur notre bulletin scolaire), tout ça pour dire que même si les
maths ne sont pas dans vos matières de prédilections, la notion de moyenne et comment la calculer est acquise et nous semble simple pour la très grande majorité d’entre nous, ce qui n’est pas le cas de beaucoup d’autres notions de mathématiques.
Cependant au-delà de l’utilisation de la moyenne qui peut se révéler intéressante dans certaines situations, on peut se demander au final si celle-ci est toujours la plus pertinente ? Si elle peut nous induire en erreur dans certains cas ? En effet la médiane, le mode, la fréquence ou l’étendue peuvent être des moyens d’évaluer des données parfois plus pertinents et plus fiables que la moyenne.
Prenons l’exemple d’un domaine qui m’intéresse tout particulièrement le nombre de points marqués par un joueur en match NBA (vous pouvez évidement avoir le même raisonnement pour d’autres sport comme le nombre de buts marqués dans un match de foot, par exemple le + ou – de 1.5 buts). Je vais me servir ici pour illustrer mon propos de 2 joueurs évoluant dans la même équipe, les Indiana Pacers avec TJ Warren et Domantas Sabonis, titulaires au sein de l’équipe. Cette saison (19/20 post Covid 19) :
Tj Warren 61 matchs pour une moyenne de 18.7 pts/matchs
D. Sabonis 62 matchs pour une moyenne de 18.5 pts/matchs
Imaginons que le bookmaker propose un cut pour un pari à 18.5 points, en observant ces données on pourrait être amené à penser que ces 2 joueurs ont réalisé environ le même nombre de matchs à 19 points/ matchs ou plus durant la saison, alors que ce n’est pas le cas, Tj Warren à marqué 19 points ou plus cette saison dans 56 % des matchs qu’il a joué alors que Sabonis ne la fait seulement que 42% du temps.
En ayant une analyse très simplifié ( il y a évidemment beaucoup d’autres paramètres à prendre en compte) si le bookmaker nous proposait une cote de 2 pour le over 18.5 pts pour les deux joueurs, celle-ci semblerait intéressante seulement pour TJ Warren alors que la moyenne identique des deux joueurs pourrait induire en erreur un parieur débutant.
Comment expliquer des % si différents alors que la moyenne des 2 joueurs est identique ? Alors que la moyenne va nous donnée une vue globale des performances, malheureusement celle-ci ne va pas nous indiquer la forme de la distribution des données
Voyons donc les alternatives à la moyenne, mais tout d’abord une rapide définition des différents termes :
- La médiane: C’est la valeur qui partage une série statistique en 2 séries de même effectif. Il y a donc autant de valeurs inférieures à la médiane que de valeurs supérieures à celle-ci. Sur excel : =mediane(plage sélectionnée)
- L’étendue: C’est la différence entre la plus grande et la plus petite valeur d’une série statistique. On préférera donc une petite étendue.
- Le mode: C’est la valeur la plus représentée d’une série statistique. Sur excel : =mode(plage sélectionnée)
- La fréquence: c’est le quotient de l’effectif de la valeur par l’effectif total. Elle indique la proportion de la présence de la valeur dans la liste. Par exemple pour TJ Warren et D. Sabonis, Warren avait une fréquence de matchs à 19 pts ou plus de 34 (c’est-à-dire qu’il a inscrit 19 pts ou plus dans 34 matchs sur les 61 qu’il a disputé cette saison) contre 26 pour Sabonis.
Pour faciliter la compréhension je vais prendre ici de courtes séries afin de mettre en exergue ce que peuvent vous apporter ces différents outils.
Imaginons 3 joueurs de basket avec les stats aux points suivantes sur 5 matchs :
Joueur 1 : 20 ; 25 ;25 ;30 ;25
Joueur 2 : 35 ;25 ;15 ;20 ;30
Joueur 3 : 15 ;20 ;20 ;50 ;20
Les 3 joueurs on ici une moyenne de 25 pts/matchs mais avec une distribution différente.
Le premier joueur a une distribution symétrique, un match en dessous de la moyenne de 5 pts, un match au-dessus de 5 pts et 3 matchs à la moyenne. Dans ce cas la moyenne est plutôt bien appropriée pour une distribution symétrique.
Le joueur 2 a lui aussi une distribution symétrique, 2 perfs au-dessus de la moyenne de 5 et 10 pts, 2 perfs en dessous de la moyenne de 5 et 10 pts et une perf égale à la moyenne. Mais contrairement au joueur 1 qui a beaucoup de performances à la moyenne ce n’est pas le cas du joueur 2. L’étendue ici peux être un bon indicateur pour mesurer la dispersion de notre série (35 – 15= 20)
Par contre ce n’est pas le cas du 3ème joueur avec une énorme performance bien au-dessus de la moyenne mais 4 en dessous. La moyenne ici n’est donc pas pertinente alors que la médiane et le mode le son beaucoup plus avec un mode ainsi qu’une médiane de 20. On parlera alors pour ce joueur de distribution asymétrique.
Dans nos exemples se rendre compte de la symétrie ou de l’asymétrie d’une série est plutôt évident, l’échantillon étant très petit, il est facile de voir la valeur extrême à 50 qui fausse la donne notamment, mais lorsque vous analyser une ou plusieurs saisons avec un énorme échantillon, difficile de savoir tout cela, introduire la médiane,le mode,… pourra grandement améliorer vos analyses et de ce fait vos prises de décision.
le tableau récapitulatif ci dessous montre bien qu’a moyenne identique, si l’on pousse l’analyse on obtient des résultats différents pour le reste qui pour certains paris pourraient finalement remettre en question nos choix si l’on avait seulement pris en compte la moyenne.
Tableau récapitulatif :
*N/A : il n’y a pas de mode pour le joueur 2 car les 5 perfs sont différentes.
Conclusion :
Bien que la moyenne soit généralement la seule méthode utilisée pour évaluer des données, celle-ci à pourtant ses limites, notamment dans des distributions asymétriques avec des valeurs extrêmes, aberrantes et utiliser d’autre moyen comme celle que nous avons vu pourrait vous permettre d’améliorer et d’être plus précis dans vos analyses afin de prendre de meilleurs choix dans vos futurs paris.