Altitud
Édition · 25 mai 2026
Toutes les formations

FORMATION IA

LlamaIndex pour les Applications RAG Intensives

Construisez des systèmes de récupération augmentée en production avec les connecteurs, index et moteurs de requêtes LlamaIndex.

Voir si cette formation est la bonne pour votre équipe, diagnostic gratuit

Lancer le diagnostic
Format
bootcamp
Durée
16-24h
Niveau
practitioner
Taille de groupe
4-14
Prix / participant
€2K-€3K
Prix groupe
€12K-€30K
Public
Ingénieurs logiciel et ingénieurs ML construisant des systèmes de récupération de connaissances ou de QA sur documents
Prérequis
Maîtrise de Python, familiarité avec les APIs REST et embeddings vectoriels ; utilisation basique des APIs LLM (OpenAI ou équivalent)

Ce qu'elle couvre

Ce programme technique intensif couvre l'architecture LlamaIndex de bout en bout : pipelines d'ingestion de données, index vectoriels et par mots-clés, composition de moteurs de requêtes et raisonnement multi-documents. Les participants implémentent de vrais systèmes RAG, apprennent quand LlamaIndex surpasse LangChain pour les charges documentaires intensives, et repartent avec des patterns de code réutilisables prêts pour la production. Le format allie ateliers de codage en direct et modules conceptuels courts, avec environ 60 % de pratique.

À l'issue, vous saurez

  • Construire un pipeline RAG end-to-end utilisant les connecteurs de données LlamaIndex et un vector store index à partir de zéro
  • Configurer et comparer au moins trois types d'index et justifier le choix pour un cas d'usage de récupération donné
  • Implémenter un query engine SubQuestion multi-document capable de synthétiser des réponses à travers des sources hétérogènes
  • Évaluer la qualité de la récupération en utilisant les métriques hit rate et faithfulness, et itérer sur les stratégies de chunking et embedding
  • Déployer un service de requête powered par LlamaIndex avec logging, caching et contrôles de coûts tokens

Sujets abordés

  • Architecture LlamaIndex : nodes, documents et pipeline d'indexation
  • Connecteurs de données et loaders pour PDFs, bases de données, APIs et sources web
  • Vector store indexes vs. list indexes vs. tree indexes, compromis et sélection
  • Composition de query engines et router query engines pour la récupération multi-index
  • Raisonnement multi-document avec SubQuestion et knowledge graph query engines
  • Évaluation de la récupération : hit rate, MRR et métriques de faithfulness
  • LlamaIndex vs. LangChain : framework de décision pour les workloads RAG-heavy
  • Déploiement de pipelines LlamaIndex en production avec observabilité et caching

Modalité

Délivré sur 2-3 jours en présentiel ou en live-remote via appel vidéo avec environnement de codage partagé (JupyterHub ou GitHub Codespaces). Chaque module suit un pattern de walkthrough conceptuel de 20 minutes suivi d'un lab guidé de 40 minutes. Les participants reçoivent un repo GitHub privé contenant des notebooks de démarrage, des branches de solution et un brief de projet capstone. Un canal Slack ou Discord partagé fournit un support asynchrone jusqu'à quatre semaines après la formation.

Ce qui fait que ça marche

  • Commencer avec un corpus de documents interne réel durant la formation pour que les labs soient immédiatement pertinents
  • Instrumenter les pipelines de récupération avec des métriques d'évaluation dès le jour un, pas en arrière-pensée
  • Désigner un propriétaire technique post-formation pour maintenir la version LlamaIndex et les dépendances des connecteurs
  • Coupler le bootcamp avec une revue architecturale de suivi deux semaines après le déploiement

Erreurs fréquentes

  • Utiliser un flat list index pour les grands corpus, causant des requêtes lentes et coûteuses à balayage complet
  • Ignorer l'évaluation de la récupération, les équipes déploient des systèmes RAG sans mesurer la qualité de la récupération, puis blâment le LLM
  • Sur-ingénierie avec les abstractions LangChain quand le document store natif de LlamaIndex couvre le cas d'usage plus proprement
  • Ignorer l'ajustement de la taille et du chevauchement des chunks, entraînant des fenêtres de contexte pauvres et des résumés hallucinez

Quand NE PAS suivre cette formation

Cette formation n'est pas appropriée pour une équipe qui n'a pas encore choisi une stack LLM ou évalue toujours si RAG est la bonne architecture, elle a d'abord besoin d'un workshop plus large sur la conception d'applications LLM.

Fournisseurs à considérer

Sources

Cas d'usage que cette formation débloque

Autres formations à ce niveau

Cette formation fait partie d'un catalogue Data & IA construit pour les leaders sérieux sur l'exécution. Lancez le diagnostic gratuit pour voir quelles formations sont prioritaires pour votre équipe.