FORMATION IA
LlamaIndex pour les Applications RAG Intensives
Construisez des systèmes de récupération augmentée en production avec les connecteurs, index et moteurs de requêtes LlamaIndex.
Voir si cette formation est la bonne pour votre équipe, diagnostic gratuit
Lancer le diagnostic →Ce qu'elle couvre
Ce programme technique intensif couvre l'architecture LlamaIndex de bout en bout : pipelines d'ingestion de données, index vectoriels et par mots-clés, composition de moteurs de requêtes et raisonnement multi-documents. Les participants implémentent de vrais systèmes RAG, apprennent quand LlamaIndex surpasse LangChain pour les charges documentaires intensives, et repartent avec des patterns de code réutilisables prêts pour la production. Le format allie ateliers de codage en direct et modules conceptuels courts, avec environ 60 % de pratique.
À l'issue, vous saurez
- Construire un pipeline RAG end-to-end utilisant les connecteurs de données LlamaIndex et un vector store index à partir de zéro
- Configurer et comparer au moins trois types d'index et justifier le choix pour un cas d'usage de récupération donné
- Implémenter un query engine SubQuestion multi-document capable de synthétiser des réponses à travers des sources hétérogènes
- Évaluer la qualité de la récupération en utilisant les métriques hit rate et faithfulness, et itérer sur les stratégies de chunking et embedding
- Déployer un service de requête powered par LlamaIndex avec logging, caching et contrôles de coûts tokens
Sujets abordés
- Architecture LlamaIndex : nodes, documents et pipeline d'indexation
- Connecteurs de données et loaders pour PDFs, bases de données, APIs et sources web
- Vector store indexes vs. list indexes vs. tree indexes, compromis et sélection
- Composition de query engines et router query engines pour la récupération multi-index
- Raisonnement multi-document avec SubQuestion et knowledge graph query engines
- Évaluation de la récupération : hit rate, MRR et métriques de faithfulness
- LlamaIndex vs. LangChain : framework de décision pour les workloads RAG-heavy
- Déploiement de pipelines LlamaIndex en production avec observabilité et caching
Modalité
Délivré sur 2-3 jours en présentiel ou en live-remote via appel vidéo avec environnement de codage partagé (JupyterHub ou GitHub Codespaces). Chaque module suit un pattern de walkthrough conceptuel de 20 minutes suivi d'un lab guidé de 40 minutes. Les participants reçoivent un repo GitHub privé contenant des notebooks de démarrage, des branches de solution et un brief de projet capstone. Un canal Slack ou Discord partagé fournit un support asynchrone jusqu'à quatre semaines après la formation.
Ce qui fait que ça marche
- Commencer avec un corpus de documents interne réel durant la formation pour que les labs soient immédiatement pertinents
- Instrumenter les pipelines de récupération avec des métriques d'évaluation dès le jour un, pas en arrière-pensée
- Désigner un propriétaire technique post-formation pour maintenir la version LlamaIndex et les dépendances des connecteurs
- Coupler le bootcamp avec une revue architecturale de suivi deux semaines après le déploiement
Erreurs fréquentes
- Utiliser un flat list index pour les grands corpus, causant des requêtes lentes et coûteuses à balayage complet
- Ignorer l'évaluation de la récupération, les équipes déploient des systèmes RAG sans mesurer la qualité de la récupération, puis blâment le LLM
- Sur-ingénierie avec les abstractions LangChain quand le document store natif de LlamaIndex couvre le cas d'usage plus proprement
- Ignorer l'ajustement de la taille et du chevauchement des chunks, entraînant des fenêtres de contexte pauvres et des résumés hallucinez
Quand NE PAS suivre cette formation
Cette formation n'est pas appropriée pour une équipe qui n'a pas encore choisi une stack LLM ou évalue toujours si RAG est la bonne architecture, elle a d'abord besoin d'un workshop plus large sur la conception d'applications LLM.
Fournisseurs à considérer
Sources
Cas d'usage que cette formation débloque
- Assistant de Recherche Juridique par IAAccélérez la recherche juridique en faisant remonter instantanément jurisprudences, textes de loi et citations pertinentes.
- Graphe de Connaissances et Recherche Sémantique d'EntrepriseConnectez documents, code et conversations dans un graphe de connaissances interrogeable pour vos équipes.
- Recherche et Analyse Automatisées par IAAccélérez la recherche et la rédaction d'analyses en synthétisant plusieurs sources grâce à la GenAI.
- Résumé automatique de notes cliniques par NLPRésumez automatiquement les dossiers patients pour mettre en évidence les informations critiques à destination des médecins.
- Appariement IA de patients pour essais cliniquesIdentifiez automatiquement les patients éligibles aux essais cliniques en analysant les dossiers médicaux avec l'IA.
- Suivi des obligations contractuelles par NLPExtrayez et suivez automatiquement les obligations, échéances et renouvellements de vos portefeuilles de contrats.
Autres formations à ce niveau
Cette formation fait partie d'un catalogue Data & IA construit pour les leaders sérieux sur l'exécution. Lancez le diagnostic gratuit pour voir quelles formations sont prioritaires pour votre équipe.