Altitud
Édition · 25 mai 2026
Toutes les formations

FORMATION IA

Ingénierie des agents IA avec Claude et MCP

Construisez des agents autonomes en production avec boucles de planification, outils, mémoire et garde-fous de sécurité.

Voir si cette formation est la bonne pour votre équipe, diagnostic gratuit

Lancer le diagnostic
Format
bootcamp
Durée
24-40h
Niveau
advanced
Taille de groupe
6-16
Prix / participant
€2K-€4K
Prix groupe
€18K-€45K
Public
Ingénieurs logiciels et ingénieurs ML construisant des systèmes d'agents IA autonomes ou semi-autonomes
Prérequis
Maîtrise solide de Python, expérience des API REST, et familiarité basique avec les prompts LLM et les schémas JSON

Ce qu'elle couvre

Ce bootcamp intensif apprend aux ingénieurs logiciels à concevoir, construire et évaluer des agents IA autonomes en utilisant l'API Claude d'Anthropic, le SDK Agent et le Model Context Protocol (MCP). Les participants implémentent des boucles de planification, l'utilisation d'outils multi-étapes, des architectures mémoire et des harnais d'évaluation de sécurité dans des scénarios réels. Le format alterne courtes séquences théoriques et longues sessions de laboratoire où les équipes livrent des prototypes d'agents fonctionnels. À l'issue de la formation, les ingénieurs peuvent architecturer, instrumenter et robustifier des agents autonomes pour un déploiement en production.

À l'issue, vous saurez

  • Implémenter une boucle agent ReAct multi-étapes avec Claude qui planifie, appelle des outils, observe les résultats et s'auto-corrige
  • Enregistrer et consommer des serveurs d'outils compatibles MCP au sein d'un graphe d'orchestration d'agents
  • Concevoir un système mémoire hybride combinant l'état in-context, une couche de retrieval vectoriel et un store episodic structuré
  • Appliquer des safety gates qui interrompent l'exécution d'un agent quand la confiance chute sous un seuil ou que des contraintes de politique sont violées
  • Écrire un harness d'évaluation automatisé qui note les trajectoires d'agents par rapport aux complétions de tâche ground-truth

Sujets abordés

  • Fondamentaux de l'API Claude : tool use, function calling, et structured outputs
  • Architecture de l'Agent SDK : agent loops, state machines, et execution graphs
  • Model Context Protocol (MCP) : configuration serveur, context injection, et tool registration
  • Patterns de planification : ReAct, Reflexion, et orchestration multi-agents
  • Architectures mémoire : in-context, external vector stores, et episodic memory
  • Safety gates : guardrails, constitutional AI checks, et human-in-the-loop triggers
  • Frameworks d'évaluation : trajectory scoring, tool-call accuracy, et regression harnesses
  • Observabilité et debugging : tracing des agent runs, cost control, et latency profiling

Modalité

Livré sur 3-5 jours, soit sur site soit en live-remote via vidéoconférence. Chaque jour suit un ratio théorie-labs de 30/70. Les participants ont besoin d'un laptop avec Python 3.11+, une clé API Anthropic, et accès à un vector store (les comptes d'essai Pinecone ou Qdrant suffisent). Un repo GitHub partagé fournit le code de démarrage, les scaffoldings d'évaluation, et les implémentations de référence. Les cohorts en remote utilisent VS Code Live Share ou GitHub Codespaces pour les exercices de pair-lab. Un canal Slack privé reste ouvert 30 jours après le bootcamp pour les Q&A asynchrones.

Ce qui fait que ça marche

  • Commencer chaque projet d'agent avec un harness d'évaluation avant d'écrire le premier prompt, cela force la discipline de décomposition de tâches
  • Définir un contrat clair entre l'orchestrateur et chaque outil (schéma d'input, error codes, timeout) avant l'intégration
  • Instrumenter chaque agent run avec des traces de trajectoire complètes dès le premier jour pour activer un debugging rapide et l'optimisation des coûts
  • Planifier une session de red-team hebdomadaire où les ingénieurs essaient délibérément de casser les safety gates de l'agent

Erreurs fréquentes

  • Ignorer l'évaluation de trajectoire : les équipes déploient des agents sans scoring automatisé, laissant les régressions de qualité indétectées en production
  • Boucles infinies sans circuit-breaker : les agents avec des boucles de planification non bornées épuisent les budgets de tokens ou entrent dans des spirales de retry
  • Traiter les tool schemas comme un détail secondaire : les descriptions de outils mal typées causent bien plus souvent des erreurs d'appel chez Claude que les problèmes de qualité de prompt
  • Ignorer la stratégie d'eviction mémoire : stocker tout in-context provoque des pics de latence et des dépassements de context window sur les tâches longues

Quand NE PAS suivre cette formation

Ce bootcamp n'est pas adapté pour une équipe qui n'a pas encore déployé en production une seule feature alimentée par un LLM, elle manquera de l'intuition de debugging nécessaire pour comprendre les modes de défaillance des agents et devrait d'abord compléter un programme de prompt-engineering de niveau practitioner ou un programme RAG.

Fournisseurs à considérer

Sources

Cas d'usage que cette formation débloque

Autres formations à ce niveau

Cette formation fait partie d'un catalogue Data & IA construit pour les leaders sérieux sur l'exécution. Lancez le diagnostic gratuit pour voir quelles formations sont prioritaires pour votre équipe.