BlogAgents IA · Stratégie process
Agents IA · Stratégie process

Votre agent IA ne peut pas automatiser un workflow qu'il n'a jamais vu

La connaissance des workflows reposait sur trois personnes seniors. En 2026, ce goulot devient un problème d'automatisation : les agents IA ne lisent pas les têtes, ils lisent des traces.

Portrait of Elliot Bensabat
Rédigé par
Elliot Bensabat
Co-founder, Capture
Publié
Carte de guide enregistré à gauche reliée par une flèche horizontale à une icône abstraite d'agent en cube-circuit à droite, illustration éditoriale brutaliste suggérant la documentation qui alimente l'automatisation par agent
Les chiffres
Tickets IT Tier-1
−35%
Après 20 guides enregistrés
Délai première PR
1 semaine
3 semaines
Une fois le workflow enregistré
Points de décision par workflow
3 à 7
Ce qu'un agent doit apprendre
Workflows en savoir tacite
~80%
Baseline mid-market
En 60 secondes

L'essentiel.

Chaque workflow que tourne votre équipe vit aujourd'hui dans une tête. Brigitte connaît la réconciliation. Marc connaît le déploiement. Antoine connaît le processus de renouvellement. Le senior qui sait comment une chose se fait a toujours été le goulot pour les nouvelles recrues et les clients. En 2026, ce goulot devient le goulot IA. Les agents IA ne lisent pas les têtes. Ils lisent des traces enregistrées de la façon dont le workflow s'est déroulé un mardi précis. Les boîtes qui ont enregistré leurs workflows en 2025 sont celles qui déploient des agents en 2026. Les autres sont encore en interview, à essayer d'extraire le workflow du senior.

01 · Section

Le nouveau goulot : trois personnes seniors détiennent tous les workflows

La connaissance des workflows est concentrée chez trois personnes seniors. Une scale-up de 220 personnes faisait tourner son helpdesk IT avec trois ingénieurs qui répondaient aux mêmes vingt questions chaque lundi. Les questions vivaient dans la tête des seniors, le wiki avait des screenshots de 2022, et l'équipe continuait à recruter des support engineers parce que c'était le seul moyen de scaler. Puis l'équipe a enregistré vingt guides en deux jours et le volume de tickets Tier-1 a chuté de 35% en huit semaines. Le goulot est passé de la disponibilité humaine à la couverture de la bibliothèque.

Ce qui vient ensuite, c'est la couche agent. Une fois un workflow enregistré, il peut être rejoué par une personne, résumé par un LLM, ou exécuté par un agent. Le même artefact sert trois publics. La recherche du Nielsen Norman Group sur pourquoi les utilisateurs scannent au lieu de lire explique pourquoi les humains ont besoin de guides courts et structurés. La même propriété (structuré, scannable, traçable) est ce dont un agent IA a besoin pour apprendre le workflow.

Le problème en 2026 : 80% des workflows d'une équipe mid-market typique n'ont jamais été enregistrés. Ils ont été exécutés des milliers de fois par Brigitte, Marc, Antoine. Ils ont été décrits dans des pages Notion auxquelles personne ne fait confiance. Ils ont été racontés dans des Zooms d'onboarding que personne n'a re-regardés. Aucun de ces formats ne produit une trace exploitable par un agent.

Un staff engineer dans une fintech B2B a trouvé exactement ce pattern quand il a remplacé un README de 2 400 lignes par douze guides : le README décrivait le setup, les guides le traçaient. Les nouveaux ingénieurs livraient leur première PR en une semaine au lieu de trois. Un agent qui automatisera le setup de l'environnement de dev aura besoin des mêmes traces, pas du README.

02 · Section

Ce dont un agent IA a réellement besoin pour automatiser un workflow

Un agent IA qui automatise un workflow a besoin de cinq entrées. Une description ne les fournit pas. Un guide enregistré, oui.

Entrée
Séquence d'étapes
Ce que c'est
La liste ordonnée des clics et actions clavier
Où le guide enregistré la fournit
La step list de Capture, dans l'ordre
Entrée
État écran attendu
Ce que c'est
À quoi l'écran doit ressembler avant chaque étape
Où le guide enregistré la fournit
Le screenshot horodaté de chaque étape
Entrée
Points de décision
Ce que c'est
Branches où le jugement opérateur est requis
Où le guide enregistré la fournit
La narration au clic ("si le client est en zone UE, cliquer ici")
Entrée
Gestion des exceptions
Ce que c'est
Quoi faire quand une étape échoue
Où le guide enregistré la fournit
Guides de troubleshooting liés par mode d'échec
Entrée
Raisonnement
Ce que c'est
Pourquoi ce clic et pas l'alternative
Où le guide enregistré la fournit
Voix-off convertie en texte d'étape

Une SOP Notion fournit la séquence et parfois le raisonnement. Elle rate l'état écran, les points de décision et la gestion des exceptions. Une vidéo Loom fournit l'état écran et le raisonnement, mais l'agent doit OCR chaque image et transcrire l'audio pour les extraire. L'approche Loom marche, mais le coût d'extraction est assez élevé pour que la plupart des équipes ne s'en donnent pas la peine.

Un guide enregistré écrit pour des lecteurs humains contient déjà les cinq entrées sous forme structurée. La documentation Computer Use de Claude chez Anthropic et le Model Context Protocol consomment tous deux des step lists structurées avec preuve écran ; le format se convertit vers l'un ou l'autre avec une transformation minimale. Un guide enregistré est, en pratique, la donnée d'entraînement agent la moins chère qu'une boîte puisse produire. Le dur, c'est l'enregistrement. L'intégration agent, c'est la partie facile.

03 · Section

Pourquoi les guides enregistrés battent SOPs et vidéos pour entraîner un agent

Le format qui minimise le coût d'extraction de l'agent est celui qui s'automatise le plus vite. Trois formats, trois coûts d'extraction.

SOP Notion ou Confluence (coût d'extraction : élevé). L'agent reçoit de la prose. Il doit parser l'intention, inférer la séquence, deviner les points de décision, postuler l'état écran. La plupart des agents qui essaient d'automatiser depuis de la prose hallucinent les étapes non décrites. Les équipes qui ont essayé en 2025 ont fini par réécrire la SOP en prompt structuré, ce qui représente le même travail qu'un enregistrement unique.

Loom ou screen recording (coût d'extraction : moyen-élevé). L'agent doit lancer l'OCR sur chaque frame, transcrire l'audio, et aligner les deux flux. C'est techniquement possible. La recherche du Nielsen Norman Group sur la lisibilité et la compréhension souligne pourquoi les humains ne consomment pas Loom comme documentation ; le même problème de densité fait de la vidéo une entrée inefficace pour les agents. Le coût compute d'un agent-sur-vidéo n'est pas négligeable non plus quand vous passez à l'échelle d'une bibliothèque de 50 guides.

Guide enregistré (coût d'extraction : faible). L'agent reçoit du JSON structuré : étapes ordonnées, screenshots horodatés, raisonnement narré par étape, gestionnaires d'exception liés. C'est proche de ce que la recherche Anthropic sur les workflows agent-readable décrit comme format d'entrée idéal. L'agent tourne contre le guide de manière déterministe, et se réentraîne sur une étape isolée quand l'UI bouge.

L'asymétrie de coût se compose au niveau bibliothèque. Vingt SOP Notion, c'est vingt projets de conversion agent. Vingt guides enregistrés, c'est une intégration. Les équipes qui construisent la bibliothèque sur le bon format obtiennent la couche agent quasi gratuitement.

04 · Section

Comment enregistrer pour les humains et pour les agents en même temps

Le flow d'enregistrement qui produit un guide utilisable pour un lecteur humain est le même qui produit une trace utilisable pour un agent. Trois ajouts l'affûtent pour les deux publics.

1. Narrer le pourquoi à chaque clic. "Je clique Save" est une étape. "Je clique Save avant d'ajouter l'intégration pour que le workflow ne s'orpheline pas si la connexion timeout" est un exemple d'entraînement. Le nouveau qui lit le guide et l'agent qui apprend le workflow ont besoin du second. Les trois premières descriptions d'étape sont ce que la recherche du Nielsen Norman Group sur le pattern de lecture en F montre comme le critère que les lecteurs utilisent pour décider s'ils continuent ; même chose pour un agent qui décide de suivre le guide tel quel ou de basculer sur un autre.

2. Être explicite aux points de décision. "Si le client est sur le plan UE, cliquer Configurer RGPD. Sinon, sauter à l'étape 7." Les points de décision sont là où la plupart des agents échouent quand ils automatisent depuis de la prose. Un guide enregistré qui nomme la branche et le critère se convertit directement en flow de contrôle pour l'agent. La plupart des workflows ont entre trois et sept points de décision ; les retrouver en re-regardant un Loom coûte cher, les retrouver dans un guide structuré, c'est une recherche.

3. Documenter les modes d'échec en frères. Chaque échec connu a son propre court guide de troubleshooting, lié au principal. Un staff engineer dans une fintech B2B a fait exactement ça : chaque mode d'échec connu est devenu un court guide, lié depuis une seule entrée du wiki engineering. Les nouveaux retrouvaient leur mode d'échec en secondes. Un agent fait pareil : quand son chemin primaire échoue, il déroule le guide d'exception lié.

Ces trois ajouts coûtent grosso modo deux minutes par enregistrement. Le retour sur le temps d'intégration agent se mesure en jours. L'extension Chrome Capture est construite autour de ce flow d'enregistrement, et la même bibliothèque qui sert vos humains servira vos agents en 2026.

05 · Section

La bibliothèque se compose : de la documentation à l'infrastructure agent

La bibliothèque IT de 20 guides qui a fait chuter les tickets Tier-1 de 35% n'est pas que de la documentation. C'est une roadmap d'automatisation. Pareil pour le pattern d'onboarding client en douze minutes et la bibliothèque SOP SOC 2 : une fois le workflow enregistré, le geste suivant évident est d'automatiser les cas les plus simples.

Trois patterns se déroulent au niveau bibliothèque.

L'agent prend les cas simples. Le guide reset MFA devient un agent reset MFA qui traite 80% des cas sans supervision. Le guide config VPN devient un agent setup VPN pour les nouvelles recrues. Les premiers déploiements agents couvrent les workflows où les points de décision sont simples et les modes d'échec bien documentés. Les cas durs restent aux humains et deviennent le travail de documentation de l'année suivante.

La bibliothèque grandit en incréments agent-friendly. Une fois que l'équipe comprend ce qu'il faut à un guide pour être agent-readable (points de décision nommés, modes d'échec liés, narration explicite), les vingt guides suivants arrivent dans ce format dès le départ. La bibliothèque se compose en utilité, pas seulement en compte.

Les auditeurs arrivent ensuite. Les SOP audit-ready exigent déjà les mêmes propriétés qu'un agent : exécution horodatée, preuve aux points de décision, gestion des exceptions. Les Trust Services Criteria de l'AICPA demandent une preuve d'exécution, pas une description de politique. La méthode "enregistrement d'abord" satisfait l'auditeur et l'agent. Deux lecteurs, un artefact. Côté français, les workflows documentés chez Doctolib pour le RGPD ou les enregistrements de conformité chez Qonto sont exactement le type d'artefact qu'un agent peut rejouer demain.

Les équipes qui ont documenté en 2024-2025 sont celles qui déploient des agents en 2026. Les équipes qui ont reporté la documentation partent de zéro : elles doivent enregistrer les workflows ET construire les agents, en séquence. L'asymétrie se compose. La documentation n'est plus un side project. C'est le préalable à la vague d'automatisation 2026-2027. Le dossier complet sur six équipes est dans pourquoi adopter les guides pas à pas.

Un guide enregistré est la donnée d'entraînement la moins chère que votre boîte produira jamais pour un agent. Le dur, c'est l'enregistrement. L'intégration agent, c'est la partie facile.
Head of automation, fintech B2B
FAQ

Questions fréquentes.

Quelles plateformes d'agents IA peuvent consommer aujourd'hui des guides de workflow enregistrés ?

Claude Computer Use chez Anthropic et tout agent construit contre le Model Context Protocol consomment directement des step lists structurées avec preuve écran. Les Assistants OpenAI et l'Agents API consomment du JSON similaire. Les frameworks d'automatisation navigateur (Playwright + LLM) consomment des step lists markdown. Le pattern commun : structuré, ordonné, horodaté, avec points de décision explicites. C'est la forme qu'un guide enregistré a déjà.

Faut-il attendre que les agents IA mûrissent avant d'enregistrer ses workflows ?

Non. L'enregistrement rembourse aujourd'hui (lecteurs humains, moins de tickets, onboarding plus rapide) et plus tard (donnée d'entraînement agent). Les équipes qui ont commencé à enregistrer en 2024-2025 sont celles avec l'intégration agent la plus profonde en 2026. Il n'existe pas de version de cette stratégie où attendre aide.

Et les workflows que seule Brigitte connaît ?

Commencer par les plus expliqués. Même pattern que pour les lecteurs humains : prendre le workflow que Brigitte explique cinq fois par semaine, l'enregistrer une fois avec elle qui narre, et le voir cesser d'être expliqué. La discipline d'enregistrer transforme le savoir tacite en une forme que humains, agents et auditeurs peuvent tous consommer. Le guide de documentation onboarding client déroule la méthode.

L'agent peut-il gérer un workflow quand le guide est incomplet ?

Parfois. La plupart des déploiements agent en production en 2026 escaladent vers les humains sur états non reconnus ou points de décision non mappés. La complétude du guide détermine le taux d'escalade. Nommer les points de décision explicitement et lier les modes d'échec divise les taux d'escalade par environ un ordre de grandeur dans les déploiements observés. Le coût d'enregistrement pour ajouter des points de décision explicites est de deux minutes par guide ; le coût d'escalade évité se mesure en heures opérateur par semaine.

N'est-ce pas juste un angle hype IA pour vendre des outils de documentation ?

Le guide enregistré rembourse avec ou sans agent. L'angle agent est de l'upside, pas la proposition de valeur centrale. Une équipe CS de quatre personnes qui utilise des guides pour zapper le Zoom, une équipe IT qui taille les tickets Tier-1, une agence qui transforme la passation en ligne facturable : tous ces gains existent que la boîte déploie un agent ou pas. La couche agent est la décennie suivante qui se compose au-dessus.

Étape suivante

Commencez à enregistrer avant que vos agents en aient besoin. Les deux paient.

Capture transforme un workflow en guide structuré en douze minutes. Extension Chrome gratuite, sans inscription. La même bibliothèque qui aide vos humains à zapper le Zoom servira vos agents quand ils arriveront en 2026.

Essayer

Enregistrez un workflow.

Extension Chrome gratuite. Sans inscription.