FORMATION IA

LlamaIndex pour les Applications RAG Intensives

Construisez des systèmes de récupération augmentée en production avec les connecteurs, index et moteurs de requêtes LlamaIndex.

Voir si cette formation est la bonne pour votre équipe, diagnostic gratuit

Lancer le diagnostic

Format: bootcamp
Durée: 16-24h
Niveau: practitioner
Taille de groupe: 4-14
Prix / participant: €2K-€3K
Prix groupe: €12K-€30K
Public: Ingénieurs logiciel et ingénieurs ML construisant des systèmes de récupération de connaissances ou de QA sur documents
Prérequis: Maîtrise de Python, familiarité avec les APIs REST et embeddings vectoriels ; utilisation basique des APIs LLM (OpenAI ou équivalent)

Ce qu'elle couvre

Ce programme technique intensif couvre l'architecture LlamaIndex de bout en bout : pipelines d'ingestion de données, index vectoriels et par mots-clés, composition de moteurs de requêtes et raisonnement multi-documents. Les participants implémentent de vrais systèmes RAG, apprennent quand LlamaIndex surpasse LangChain pour les charges documentaires intensives, et repartent avec des patterns de code réutilisables prêts pour la production. Le format allie ateliers de codage en direct et modules conceptuels courts, avec environ 60 % de pratique.

À l'issue, vous saurez

Construire un pipeline RAG end-to-end utilisant les connecteurs de données LlamaIndex et un vector store index à partir de zéro
Configurer et comparer au moins trois types d'index et justifier le choix pour un cas d'usage de récupération donné
Implémenter un query engine SubQuestion multi-document capable de synthétiser des réponses à travers des sources hétérogènes
Évaluer la qualité de la récupération en utilisant les métriques hit rate et faithfulness, et itérer sur les stratégies de chunking et embedding
Déployer un service de requête powered par LlamaIndex avec logging, caching et contrôles de coûts tokens

Sujets abordés

Architecture LlamaIndex : nodes, documents et pipeline d'indexation
Connecteurs de données et loaders pour PDFs, bases de données, APIs et sources web
Vector store indexes vs. list indexes vs. tree indexes, compromis et sélection
Composition de query engines et router query engines pour la récupération multi-index
Raisonnement multi-document avec SubQuestion et knowledge graph query engines
Évaluation de la récupération : hit rate, MRR et métriques de faithfulness
LlamaIndex vs. LangChain : framework de décision pour les workloads RAG-heavy
Déploiement de pipelines LlamaIndex en production avec observabilité et caching

Modalité

Délivré sur 2-3 jours en présentiel ou en live-remote via appel vidéo avec environnement de codage partagé (JupyterHub ou GitHub Codespaces). Chaque module suit un pattern de walkthrough conceptuel de 20 minutes suivi d'un lab guidé de 40 minutes. Les participants reçoivent un repo GitHub privé contenant des notebooks de démarrage, des branches de solution et un brief de projet capstone. Un canal Slack ou Discord partagé fournit un support asynchrone jusqu'à quatre semaines après la formation.

Ce qui fait que ça marche

Commencer avec un corpus de documents interne réel durant la formation pour que les labs soient immédiatement pertinents
Instrumenter les pipelines de récupération avec des métriques d'évaluation dès le jour un, pas en arrière-pensée
Désigner un propriétaire technique post-formation pour maintenir la version LlamaIndex et les dépendances des connecteurs
Coupler le bootcamp avec une revue architecturale de suivi deux semaines après le déploiement

Erreurs fréquentes

Utiliser un flat list index pour les grands corpus, causant des requêtes lentes et coûteuses à balayage complet
Ignorer l'évaluation de la récupération, les équipes déploient des systèmes RAG sans mesurer la qualité de la récupération, puis blâment le LLM
Sur-ingénierie avec les abstractions LangChain quand le document store natif de LlamaIndex couvre le cas d'usage plus proprement
Ignorer l'ajustement de la taille et du chevauchement des chunks, entraînant des fenêtres de contexte pauvres et des résumés hallucinez

Quand NE PAS suivre cette formation

Cette formation n'est pas appropriée pour une équipe qui n'a pas encore choisi une stack LLM ou évalue toujours si RAG est la bonne architecture, elle a d'abord besoin d'un workshop plus large sur la conception d'applications LLM.

Fournisseurs à considérer

Sources

Cas d'usage que cette formation débloque

Autres formations à ce niveau

Cette formation fait partie d'un catalogue Data & IA construit pour les leaders sérieux sur l'exécution. Lancez le diagnostic gratuit pour voir quelles formations sont prioritaires pour votre équipe.

Lancer le diagnostic Réserver un appel