Prédiction de la performance boursière : Leviatan AI Research explore les frontières de l’IA appliquée à la gestion de risque d’actifs côtés

0 Shares

L’intelligence artificielle (IA) a profondément transformé les méthodologies employées en finance, en particulier en matière de gestion de risque d’actifs financiers. Chez Leviatan AI Research, nous menons depuis plusieurs années, de nombreux chantiers de recherche d’IA appliquée à la finance. C’est notamment dans ce cadre que nous sommes ravis de vous partager certains des travaux que notre laboratoire de recherche appliquée en intelligence artificielle est en mesure de rendre publique, et de partager à la communauté scientifique, ainsi qu’aux spécialistes de la finance.

L’une de nos dernières études intitulée « Prédiction de la performance boursière : une étude comparative entre modélisations économétriques et modélisations basées sur l’intelligence artificielle », explore précisément la comparaison systématique des capacités prédictives des modèles d’IA avec celles des modèles économétriques traditionnels, avec un accent particulier mis sur une tâche de classification d’actions cotées sur un horizon d’investissement à court terme.

Contexte et objectifs de ces travaux de recherche

La sélection d’actions en gestion de portefeuille est une étape clé qui influence directement la performance financière des investissements. Traditionnellement, cette sélection s’appuie sur l’analyse fondamentale et technique. Notre étude vise à déterminer si les modèles avancés d’IA peuvent offrir une meilleure performance prédictive par rapport aux approches économétriques classiques, notamment en termes de précision, robustesse et capacité de généralisation sur des données financières réelles.

Données et méthodologie

Nous avons utilisé dans le cadre de cette étude, un ensemble de données détaillées issues de Factset, comprenant des informations comptables et financières sur 1 935 entreprises cotées non financières, observées annuellement de 2019 à 2021. La tâche de classification a consisté à distinguer les actions surperformantes des sous-performantes selon leur performance boursière en 2021, comparée à un seuil de 10 %, correspondant à la performance historique moyenne de l’indice concerné.

Ingénierie des caractéristiques

Cette étape cruciale a permis d’identifier et sélectionner les caractéristiques financières les plus pertinentes pour la prédiction.

Plusieurs méthodes robustes ont été employées, notamment :

  • Recursive Feature Elimination (RFE)
  • LASSO
  • Random Forest
  • Gradient Boosting Decision Trees (GBDT)

Cette approche combinée nous a permis de retenir des variables essentielles telles que le dividende, la liquidité, les rendements passés, le ratio d’endettement net, etc.

Techniques de modélisation

Trois grandes catégories de modèles ont été comparées :

  • Modèles économétriques : GEE-Logit et Mundlak, adaptés aux données de panel, afin de gérer l’hétérogénéité temporelle des données.
  • Modèles de machine learning (ML) : XGBoost, LightGBM, modèles ensemblistes (moyenne de probabilités) et modèle en empilement (stacking), combinant XGBoost et LightGBM via un méta-modèle.
  • Modèles d’apprentissage profond : architectures LSTM, GRU, encodeur-décodeur basé sur Transformers et Temporal Convolutional Networks (TCN), optimisées via Optuna.

Chaque modèle a bénéficié d’une optimisation rigoureuse des hyperparamètres, réalisée avec GridSearch, validation croisée et Optuna, pour garantir la fiabilité et la reproductibilité des résultats obtenus.

Résultats empiriques détaillés

Performance des modèles économétriques

Les modèles économétriques ont montré des performances asymétriques avec des taux très élevés de vrais positifs (> 94 %) mais de faibles taux de vrais négatifs (~20 %). Cette asymétrie indique une limitation importante à identifier les actions sous-performantes, entraînant des risques importants de faux positifs.

Performance des modèles de machine learning

Les modèles ML, en particulier le modèle en empilement, se sont révélés supérieurs en offrant un meilleur équilibre entre précision (78,57 %), taux de vrais positifs (70,68 %) et taux de vrais négatifs (67,22 %). XGBoost et LightGBM, utilisés indépendamment, ont également affiché d’excellentes performances, notamment sur les critères d’exactitude globale (accuracy) et de score F1.

Performance des modèles d’apprentissage profond

Les réseaux neuronaux ont démontré une capacité modérée à gérer les dépendances temporelles complexes, avec des performances légèrement inférieures à celles des modèles ML en termes de précision et de score F1. Le modèle TCN a été le plus performant parmi les réseaux neuronaux, suggérant néanmoins un besoin de davantage de données temporelles pour améliorer leur capacité prédictive.

Discussion approfondie

Notre analyse révèle clairement que les modèles basés sur l’IA surpassent les modèles économétriques traditionnels en matière de classification d’actions pour une gestion optimale de portefeuille. L’approche par empilement, notamment grâce à son méta-modèle qui combine efficacement les forces de XGBoost et LightGBM, se démarque par une gestion optimisée des faux positifs, critère essentiel dans le contexte financier.

Perspectives futures et travaux internes de Leviatan

Si cette étude scientifique offre déjà des perspectives prometteuses, Leviatan AI Research a poursuivi le développement de modèles propriétaires encore plus sophistiqués, spécifiquement optimisés pour répondre aux exigences pointues des fonds d’investissement, hedge funds et family offices que nous accompagnons. Ces modèles, déjà opérationnels et déployés, démontrent des performances supérieures, notamment grâce à une ingénierie avancée des caractéristiques financières et à des techniques d’apprentissage automatique sur-mesure.

Conclusion

Cette étude comparative met en évidence les bénéfices substantiels que l’intelligence artificielle peut apporter à la finance moderne, notamment en gestion d’actifs. Les approches avancées en machine learning et apprentissage profond, bien qu’ayant des limites, offrent déjà une supériorité nette sur les approches économétriques classiques, ouvrant la voie à une gestion plus efficace, robuste et éclairée des investissements financiers.

Papier scientifique : Prédiction de la performance boursière : une étude comparative entre modélisations économétriques et modélisations basées sur l’intelligence artificielle