École Polytechnique Executive Education

Advanced AI for Data Analysis

Découvrez notre formation

Maîtrisez les méthodes avancées d’intelligence artificielle appliquées à la donnée massive

Le volume et la diversité des données disponibles sur Internet explosent. Textes, images, séries temporelles, données industrielles : ces données massives et hétérogènes constituent un enjeu stratégique majeur pour les organisations.
Les récentes avancées en intelligence artificielle, apprentissage profond, apprentissage par renforcement, IA générative, ouvrent des perspectives inédites pour analyser, exploiter et valoriser ces données à grande échelle.


Une formation certifiante, 100 % à distance

Le programme Advanced AI for Data Analysis vous offre une immersion complète dans ces nouvelles méthodes et leurs applications concrètes.
Porté par des enseignants-chercheurs experts en intelligence artificielle avancée et en analyse industrielle des données, ce parcours de 11 jours (84 heures) vous permet de développer des compétences pointues et immédiatement opérationnelles.


Contenu du programme

  • Introduction à l'écosystème de l'IA et de la Data Science

Objectif : Faire des rappels sur les fondamentaux en science des données, présenter les spécificités des données massives et non structurées.
Ce module rappelle l'écosystème actuel de la data et de l'IA, les opportunités, les enjeux et les points de vigilance à considérer pour un projet de ce type. Il permet à tous les participants de revoir les bases essentielles (normalement déjà acquises par les participants) en Data Science et Big Data.
(Data Science ML and DL ecosystem)

  • Deep Learning pour texte / traitement du langage naturel (NLP)

Objectif : Les textes sont des données non structurées fréquentes, notamment dans les données web mais aussi celle des contrats, des lois (par exemple).
Ce module présente les méthodes et les outils pour le prétraitement, l'indexation, la recherche et le classement de textes dans un document ou une collection.
(Text Mining, IR, NLP methods, Word Embeddings, Graph based NLP, Contextual WE, CNNs for text, ELMO)

  • IA appliquée aux graphes et réseaux sociaux

Objectif : Les graphes sont des données issus notamment du web et des réseaux sociaux.
Ce module explique et permet de mettre en oeuvre des méthodes et outils de niveau avancé pour le pré-traitement des graphes, leur recherche et classement ainsi que l'évaluation de noeuds ou de communautés.
(Graph Mining and Exploration, Graph Kernels, GNNs, Graph generators, Applications)

  • IA pour les séries temporelles, l'images/vision et les recommandations pour le web marketing

Objectif : Donner les outils et les méthodologies permettant la prévision des données de type séries temporelles. Présenter l'état de l'art des méthodes de recommandation. Présenter une introduction complète aux méthodes d'IA pour les images et les applications de computer vision.
(Introduction to TS concepts (stationarity) TS preprocessing and feature extraction, Statistical approaches for Time series (ARIMA), Prophet, Deep learning methods for time series forecasting and classification, Deep learning and GNN methods for recommendations)

  • IA générative et grands modèles pré-entraînés

Objectif : Exposer les dernières évolutions de l'IA générative avec les modèles récents. Exemples : BARD, GPT, GLM, PALM2 ; modèles de langage et de génération multimodale (image et son).
(Transformer, BERT, BART, GPT, instruction, safety (alignment), evaluation of LLMs, optimization of LLMs (quantization, QLORA, Multimodal LMs (i.e. image captioning (CLIP), Text2mol, Graph generative models, applications in Chemo/Bio/Medical)
 

  • Data Challenge

Objectif : appliquer les techniques vues dans les cours précédents à une étude de cas venant d'un problème industriel ou académique. Deux journées complètes en équipe pour réaliser une analyse permettant de mettre en oeuvre la méthodologie et les techniques vues dans les modules précédents.


Objectifs pédagogiques

À l’issue de cette formation, vous serez capable de :

  • Appliquer les techniques récentes de machine learning et deep learning aux données complexes

  • Exploiter les algorithmes avancés pour l’analyse des graphes (prédiction de liens, classification de nœuds)

  • Utiliser le traitement du langage naturel pour le minage de texte et l’analyse sémantique

  • Développer des solutions d’intelligence artificielle pour le commerce en ligne et l’extraction de connaissances depuis le web

  • Intégrer les dimensions techniques et écosystémiques dans la conception de projets basés sur la data science

  • Identifier les opportunités, défis et impacts liés à l’IA dans différents secteurs industriels


Pour qui ?

Cette formation s’adresse aux professionnels ayant déjà une première expérience en data science, notamment en machine learning, deep learning, données non structurées, NLP et graph mining.
Elle est idéale pour :

  • Chefs de projet
  • Consultants
  • Data scientists
  • Data analysts

Les prérequis incluent une bonne connaissance des sciences des données (algorithmes, apprentissage supervisé et non supervisé), des compétences en programmation (Python), en informatique (bases de données) et en mathématiques (statistiques, probabilités, algèbre linéaire).


Modalités pratiques

  • Durée : 11 jours (84 heures)

  • Format : 100 % distanciel

  • Langue : enseignement et supports en anglais


Intervenants

  • Michalis VAZIRGIANNIS : Professeur et chercheur au Département d'Informatique de l'École polytechnique (DIX/LIX). Il a créée et il dirige l'équipe DaSciM (Data Science and Mining Team). Ses recherches se focalisent sur le Data Mining le Machine / Deep Learning avec des applications industrielles aux données de grande échelle. Il est titulaire de chaires scientifiques et industrielles dans le domaine de la Science des Données et de l'Intelligence Artificielle.

  • Giannis Nikolentzos : Post-doctoral researcher au Computer Science Laboratory (LIX) de l'Ecole polytechnique.
    Diplômé d'un Doctorat en Graph Mining de Athens University of Economics and Business.


Statistiques de résultat

  • Taux de présentation à la certification sur les deux dernières promotions : 92%

  • Taux de réussite des participants pour l'obtention de leur certification : 80%*

  • Note de satisfaction obtenue suite à une enquête en fin de formation : 4,5 / 5*

  • Nombre moyen de participants par session de formation : 8 participants*

*sur les six dernières promotions

Nous contacter