Analyse prédictive : opportunités et limites pour l’avenir de la finance
L’analyse prédictive est une discipline qui existait déjà sous une forme ou une autre dès l’avènement du mesurage. De tout temps, en effet, l’humain n’a cessé de vouloir prédire l’avenir. Pour preuve, les pronostiqueurs tels que Nostradamus, et bien d’autres prophètes, abondent dans l’histoire. On peut faire remonter la pratique spécifique de l’analyse prédictive au moment où quelqu’un a posé pour la première fois sa règle sur un graphique linéaire pour tenter d’estimer les tendances évolutives de son commerce.
Bref historique de l’analyse prédictive
Nul secteur n’a davantage tenté d’exploiter le potentiel de l’analyse prédictive que celui des services financiers. Dès l’ouverture du Lloyd’s Coffee House en 1686, les professionnels de la finance cherchaient déjà à savoir de quoi l’avenir serait fait. Des planificateurs, directeurs et analystes financiers de tous bords se sont efforcés d’élaborer des méthodes précises pour mesurer la probabilité des événements.
Avant l’arrivée de l’analyse statistique avancée et du Machine Learning, les travaux d’analyse prédictive se divisaient globalement en quatre catégories :
- L’hypothèse, qui est l’option à laquelle la plupart des gens se réfèrent par défaut. Pour cela, ils tentent de deviner le déroulement probable des événements sur la base de données qualitatives et quantitatives, auxquelles s’ajoute une expertise spécialisée. Le fait que les résultats de ces prévisions procèdent ou non du hasard dépend en réalité très fortement des compétences de l’expert concerné.
- La prédiction visuelle, qui correspond ni plus ni moins à sortir une règle et tracer des courbes sur un papier. Cette technique est fort répandue depuis plusieurs décennies, non sans raison : chaque fois que des données présentent des modèles linéaires réguliers, il est possible de dessiner des courbes sur un graphique. Cette technique s’emploie encore aujourd’hui dans l’analyse des actions financières, notamment dans les médias audiovisuels. Les analystes représentent le plancher et le plafond du cours des actions par des lignes afin de déterminer si leur achat se justifie ou non.
- La prévision additive est une méthode de budgétisation populaire qui consiste à reprendre les données d’une période antérieure, à les réajuster selon un pourcentage, puis à déclarer le résultat comme étant une prévision. Cette démarche suppose que la période à venir soit identique à la précédente en termes de prévisions, ce qui ne se vérifie que dans des conditions bien définies. À une époque marquée par les pandémies et l’instabilité politique, cette stratégie est valable uniquement si elle s’accompagne d’une agilité et d’une souplesse exceptionnelles permettant de s’adapter à l’évolution des circonstances.
- Enfin, l’invention est la méthode de prévision la moins utile, mais cependant celle à laquelle un nombre surprenant d’organisations et de parties prenantes ont recours en l’absence de toute autre technique de prévision.
Les trois premières techniques partagent un point commun, qui est de se fonder sur des données préexistantes pour tenter de bâtir des modèles orientés vers l’avenir. Parmi les évolutions majeures apparues depuis 25 ans, et notamment au cours de la dernière décennie, figure le fait que l’on utilise aujourd’hui des logiciels de statistiques et de Machine Learning avancés pour générer des prévisions plus solides, sur le plan mathématique, que ces approches initiales.
Qu’est-ce que l’analyse prédictive ?
Comme son nom l’indique, il s’agit de l’utilisation de données analytiques et d’algorithmes afin de prédire ce qui est susceptible d’arriver. Pour fonctionner correctement, l’analyse prédictive s’appuie sur deux modèles contenus dans les données : la cyclicité et la saisonnalité.
La saisonnalité fait référence à la détection de tendances dans les données annuelles. Lorsque l’on pense aux saisons au sens littéral du terme (printemps, été, automne, hiver), il s’agit d’événements qui reviennent chaque année en étant en quelque sorte programmés par une horloge. Dans le domaine financier, nous savons que certains événements annuels tels que la date limite de dépôt des déclarations fiscales ont un impact considérable sur nos données. D’autres événements liés à la consommation, notamment les fêtes de fin d’année, ont également une incidence sur l’activité économique.
La cyclicité désigne tout modèle répétitif qui est présent de manière régulière dans les données. À titre d’exemple, la plupart des informations financières obéissent à un cycle très commun qui se caractérise par une abondance de données et d’activité du lundi au vendredi, mais un volume considérablement réduit le week-end. De même, les déclarations d’impôts trimestrielles sont une récurrence courante qui joue sur les données et leur prévisibilité.
Le point essentiel ici est que les données présentant un caractère cyclique ou saisonnier sont, par essence, prévisibles. Les données qui présentent cette caractéristique dans une certaine mesure peuvent être déduites grâce à l’analyse prédictive.
Ce que l’analyse prédictive ne peut pas prévoir
Par extension, les données totalement exemptes de saisonnalité ou de cyclicité ne peuvent être ni prédites, ni prévues. Ce dernier point est crucial pour comprendre les limites d’une telle discipline. Il existe quatre catégories de données génériques qui sont impossibles à prévoir avec le moindre degré de précision :
- Ce qui ne s’est encore jamais produit
- Ce qui ne présente aucune prévisibilité
- Ce qui ne présente aucun caractère cyclique ou saisonnier
- Ce qui comporte des facteurs cachés
S’agissant des événements inédits dans le passé, aucun logiciel d’analyse prédictive, quelle que soit sa qualité, sa sophistication ou la quantité de données qu’il contient, n’aurait pu prédire avec une quelconque acuité la pandémie de COVID-19. De même, aucun modèle n’aurait pu raisonnablement anticiper un certain nombre d’événements relevant de la théorie du « cygne noir ». Quelle que soit la capacité du renseignement militaire de certains pays à détecter précocement de telles menaces, il s’agit d’événements qui, pour la grande majorité des entreprises et des départements financiers, sont véritablement uniques.
L’analyse prédictive, par définition, ne peut pas prévoir ce qui est imprévisible. Les événements politiques, tels que l’élection présidentielle américaine, en sont un exemple probant. Malgré la récurrence immuable de ce scrutin tous les quatre ans, dans les faits, il n’existe jamais deux élections semblables : les candidats ne sont pas les mêmes, les enjeux varient et la base électorale elle-même fluctue considérablement d’une élection à l’autre. Dès lors, aucun modèle prédictif n’est apte à prédire des élections, quoi qu’en disent beaucoup de gens persuadés du contraire.
L’analyse prédictive ne permet pas de prédire le hasard, ni les événements dépourvus de saisonnalité ou de cyclicité. Supposons par exemple que vous collaboriez avec une équipe de production vidéo afin de publier sur YouTube des explications concernant un sujet très complexe, et que par chance, l’une de ces vidéos rencontre un franc succès et devienne virale. Quand bien même votre calendrier de production serait très prévisible, il n’existe aucun moyen d’anticiper ce genre d’évolution.
Enfin, l’analyse prédictive ne permet pas non plus de prédire les modèles extraordinairement complexes qui comportent des facteurs invisibles. Le marché boursier en est un excellent exemple. D’énormes ressources ont été investies pour tenter de prédire le fonctionnement du marché boursier dans son ensemble, ou encore les performances d’actions individuelles. Or, le nombre de facteurs cachés, qui vont des algorithmes HFT aux événements macroéconomiques, est tellement élevé qu’aucun modèle ne se révèle apte, en termes de précision, à dépasser le simple stade de l’hypothèse.
Exemple d’analyse prédictive dans le domaine financier
Prenons l’exemple très concret d’une analyse prédictive que ma société Trust Insights a réalisée il y a de cela quelques années auprès d’un client du secteur des casinos. L’établissement Foxwoods situé dans le Connecticut, aux États-Unis, nous avait sollicités à l’époque pour l’aider à établir une prévision à partir de ses données financières. La fréquentation et les recettes des casinos font partie des facteurs hautement prévisibles. Les données manifestent un caractère cyclique et saisonnier évident, ce qui en fait un candidat de choix pour les prévisions.
Notre étude s’est concentrée sur trois années de recettes du casino. À l’aide d’un logiciel de Machine Learning personnalisé, nous avons calculé les prévisions de recettes hebdomadaires pour les 52 semaines à venir. L’objectif recherché était que l’établissement puisse, grâce à ces prévisions, déterminer aisément les semaines les plus susceptibles de générer des revenus moindres au cours de l’année à venir.
De même que pour toute autre analyse, la clé de l’analyse prédictive réside moins dans la prévision elle-même que dans ce que l’on en fait. Or, c’est précisément dans ce domaine que la prévision a révélé tout son pouvoir. Sachant à l’avance quelles semaines particulières de l’année seraient à l’origine d’une baisse de ses recettes, Foxwoods a pu demander à ses équipes de marketing de créer des promotions ciblées sur ces périodes. Le résultat s’est traduit par une plus forte fréquentation de l’établissement à même de compenser le ralentissement de l’activité. Le travail promotionnel a consisté en des campagnes telles que des tournées de la presse locale, des publicités numériques, des récompenses aux membres existants, ainsi que des promotions et tarifs spéciaux, autant d’outils conçus pour attirer et fidéliser la clientèle de l’établissement.
Quel fut l’effet au final ? Au lieu de connaître une décrue par rapport à ses exercices précédents et aux prévisions initiales, Foxwoods a vu ses revenus progresser de 29 % d’une année sur l’autre, un chiffre déjà stupéfiant en soi. Mais le point réellement intéressant est que l’année suivante, lors d’un changement de direction et d’agence de marketing, Foxwoods a choisi de ne pas faire appel à notre équipe. Ses recettes ont alors régressé au niveau de référence de l’année précédente, soit une chute de 29 % en glissement annuel.
Là encore, ce n’est pas la prévision elle-même qui est déterminante, mais l’action menée et les décisions prises à partir de ces informations. Il en va de même pour l’analyse prédictive que pour toute autre analyse : si nous ne faisons rien des données recueillies, celles-ci demeurent purement anecdotiques. Ce n’est que lorsque nous prenons des décisions fondées sur l’analyse prédictive que nous en libérons toute la valeur intrinsèque.