Guides pratiques & Modèles

Liste de vérification pour la révision des prompts

Ceci est une vérification avant envoi pour un seul prompt, effectuée quelques secondes avant d'appuyer sur entrer. Ce n'est pas la liste de vérification d'évaluation des prompts, qui juge les résultats sur plusieurs exécutions selon une grille. La révision pose une question : ce prompt donne-t-il à l'assistant suffisamment de rôle, de contexte, de contraintes, d'exemples et une définition testable de l'achèvement pour retourner quelque chose que vous pouvez réellement utiliser du premier coup?

Guide pratiqueÉcriture de prompts

Quand utiliser ceci

  • Vous êtes sur le point d'envoyer un prompt qui produira du code que vous avez l'intention de conserver, comme une exportation paginée de commandes sur un service interne.
  • Vos trois dernières tentatives étaient proches mais incorrectes, et vous êtes sur le point de retaper la demande au lieu de la corriger.
  • Vous écrivez un prompt que quelqu'un d'autre réutilisera, donc un libellé vague coûtera plus cher que votre propre temps.
  • La tâche a une contrainte réelle que l'assistant ne peut deviner, comme une base de données qui ne doit pas être touchée ou une version de bibliothèque à laquelle vous êtes lié.
  • Vous voulez que le résultat soit dans un format spécifique (un objet JSON, une différence, un tableau) et la demande ne le précise pas encore.
  • Vous collez un long fichier ou journal dans le prompt et l'instruction réelle est enfouie quelque part au milieu.
  • Vous êtes tenté d'envoyer une demande d'une ligne comme « corriger l'exportation » et de l'appeler un prompt.

Ce que cela aide à clarifier

  • Que l'assistant sache qui il est censé être et à quoi ressemble le succès, ou qu'il devine les deux.
  • Quels faits manquent de contexte que le modèle ne peut pas déduire, par opposition au bruit de fond qui ne fait qu'alourdir le prompt.
  • Si vos contraintes sont énoncées comme des règles que le modèle peut suivre, ou laissées implicites dans votre tête.
  • Si le format de sortie est spécifié avec suffisamment de précision pour que vous puissiez écrire un test pour celui-ci.
  • Si un exemple réglerait l'ambiguïté plus rapidement qu'un autre paragraphe de description.
  • Si le prompt est prêt à être envoyé, ou à une simple modification près de vous éviter un aller-retour inutile.

Pourquoi une révision de trente secondes vaut mieux qu'une autre tentative

Maya a besoin de pagination par curseur pour l'exportation des commandes. Elle tape "ajouter la pagination à l'exportation des commandes, rendre ça rapide" et l'envoie. L'assistant devine un framework, invente une forme de réponse et réécrit un fichier qu'elle voulait seulement corriger. Elle retape la demande avec des mots légèrement différents. Même type d'erreur. Après quatre allers-retours, elle a passé plus de temps à diriger que le changement n'aurait pris à écrire à la main. Le prompt manquait des faits que le modèle ne pouvait pas inventer, et reformuler le même manque une quatrième fois ne les fournit pas.

C'est l'écart que la révision comble. Un modèle de langage remplit chaque blanc que vous laissez avec la supposition la plus probable, et une supposition probable n'est pas votre base de code. Les directives de prompting d'Anthropic présentent le modèle comme un employé brillant mais nouveau qui manque de contexte sur vos normes et flux de travail, et offrent un test qui vaut la peine d'être mémorisé : montrez votre prompt à un collègue avec un contexte minimal sur la tâche et demandez-lui de le suivre. S'il serait confus, le modèle le sera aussi. Cette seule règle attrape la plupart des éléments que cette liste de vérification énumère.

Ignorer la révision démarre une boucle, et la boucle est le vrai coût. Chaque nouvelle tentative semble peu coûteuse, donc vous ne vous arrêtez jamais pour diagnostiquer, et la boucle consomme tranquillement plus de temps que lire votre brouillon une fois ne l'aurait fait. La révision est une pause délibérée qui transforme "envoyer et voir" en "vérifier et envoyer". Trente secondes contre une liste de dix lignes est presque toujours moins coûteux qu'une deuxième mauvaise réponse, car une mauvaise réponse doit encore être lue, jugée et remplacée. La liste de vérification est la version structurée du test du collègue : au lieu d'espérer que vous vous souveniez du chemin du fichier et de la contrainte, vous confirmez chacun avant que le modèle ne voie jamais la demande.

Comment bien utiliser chaque ligne, avec une entrée forte et une faible

Chaque ligne est un oui/non que vous répondez en lisant votre propre brouillon. L'habileté consiste à distinguer un vrai oui d'un oui que vous souhaiteriez vrai. Voici à quoi ressemble une version forte à côté d'une version faible sur les lignes où les gens se trompent le plus.

  • Rôle et objectif. Faible : "aidez-moi avec l'exportation." Fort : "Vous travaillez dans notre service d'administration Node; ajoutez la pagination par curseur à l'exportation des commandes pour qu'un client puisse récupérer 10k lignes par pages sans délai d'attente." La version forte nomme le rôle et un résultat vérifiable d'un seul souffle.
  • Contexte, présent et épuré. Deux modes d'échec tirent dans des directions opposées. Faible par omission : pas de chemin de fichier, pas de framework, pas de mention que l'exportation est déjà en flux. Faible par inondation : le fichier entier de 800 lignes collé alors que seul le gestionnaire est important. Fort : le chemin du fichier, l'unique assistant à réutiliser, et la seule règle qui contraint le changement. Anthropic suggère d'exprimer le contexte comme un court ensemble de faits qui façonnent la décision et de garder le matériel brut clairement séparé, afin que les faits qui dirigent la réponse ne soient pas enterrés sous ceux qui ne le font pas.
  • Contraintes en tant que règles. Faible : "rendre ça rapide" ou "garder ça propre," sur lesquels le modèle ne peut pas agir. Fort : "ne pas changer le schéma de réponse au-delà de l'ajout de nextCursor; réutiliser paginate() de lib/pagination.ts; garder le gestionnaire sous 80 lignes." Une contrainte que le modèle peut vérifier est une contrainte qui survit au contact avec la sortie.
  • Format de sortie nommé. Faible : le laisser ouvert, puis être ennuyé qu'il ait réécrit le fichier. Fort : "retourner uniquement un diff unifié, pas de prose," ou "retourner JSON avec les clés orders et nextCursor." Quand la forme est facile à se tromper, ajoutez un court exemple. Les directives d'Anthropic sont directes ici : un bon exemple vaut mieux que cinq adjectifs, et les exemples à quelques coups (utilisez-en trois à cinq, chacun enveloppé pour qu'il se lise comme un échantillon) sont parmi les moyens les plus fiables de fixer le format et le ton.
  • Formulation positive. Faible : "ne pas utiliser markdown." Fort : "répondre en paragraphes de prose simple." Dire au modèle quoi faire le guide plus fiablement que lui dire quoi éviter, car l'instruction pointe vers une cible au lieu d'un mur.
  • Instruction placée en dernier. Lorsque vous collez un long fichier ou journal, mettez la demande réelle après celui-ci. Anthropic rapporte que déplacer la requête à la fin d'un prompt à long contexte peut améliorer la qualité de la réponse jusqu'à 30 % sur des entrées complexes et multi-documents. Une demande coincée au milieu rivalise avec tout ce qui l'entoure.
  • Succès testable et incertitude gérée. Faible : "rendre ça bon." Fort : "reste sous 200 ms pour 10k lignes," plus une ligne disant au modèle de s'arrêter et de demander si l'assistant ne convient pas plutôt que d'en inventer un nouveau. Une définition de terminé pour laquelle vous pourriez écrire un test est une que vous pouvez réellement vérifier.

Vous n'avez pas besoin d'un score parfait. Vous devez trouver la ligne qui est un vrai non et corriger celle-là. La plupart des prompts échoués manquent une seule chose, et la correction est généralement une phrase, pas une réécriture.

Pièges, et où la révision passe le relais

Quelques pièges font que la liste de vérification semble terminée alors que le prompt est encore faible.

  • Cochant des cases que vous souhaiteriez vraies. Le point d'échec est de lire "contraintes explicites" et de penser "rapide compte." Ce n'est pas le cas. Si vous ne pouvez pas imaginer le test, la ligne est encore un non. Soyez votre propre collègue sceptique.
  • Confondre révision avec évaluation. Cette liste de vérification juge un prompt avant qu'il ne s'exécute. Elle ne dit rien sur la tenue du prompt à travers de nombreuses entrées au fil du temps. Un prompt qui passe la révision peut encore dériver ou échouer sur les entrées que vous n'avez pas envisagées. Cette question continue appartient à la Liste de vérification d'évaluation des prompts, qui évalue les sorties par rapport à une grille sur un ensemble d'entrées fixe d'environ 50 à 200 cas, le petit ensemble doré et organisé que les équipes exécutent à chaque changement pour détecter les régressions. Utilisez la révision pour livrer un bon premier prompt; utilisez l'évaluation pour faire confiance à un prompt sur lequel vous comptez.
  • Surréagir au prompt. Les anciennes habitudes poussent les gens à crier : "CRITIQUE : vous DEVEZ retourner JSON, JAMAIS ajouter de prose." Les modèles actuels suivent bien les instructions normales et peuvent sur-réagir à un langage forcé et en majuscules, en faisant plus que demandé ou en traitant chaque clause comme urgente. Ramenez-le à une formulation simple. La clarté fait le travail, pas le volume.
  • Traiter la révision comme l'ensemble du travail. Un prompt propre produit une réponse; il ne s'en porte pas garant. La révision se termine au moment où le modèle répond. À partir de là, la sortie n'est que du code, et le code gagne la confiance en étant lu.

En équipe, la révision rapporte deux fois. Un prompt bien révisé par une personne devient un prompt que n'importe qui peut réutiliser, car le rôle, le contexte et le format sont sur la page au lieu d'être dans la tête d'une seule personne. Les prompts sauvegardés, le CLAUDE.md d'un projet, et les extraits partagés sont là où les bons prompts révisés vont vivre, pour que la prochaine personne commence à partir d'un brouillon réussi.

Pour votre prochaine tâche réelle, n'adoptez pas toutes les dix lignes à la fois. Choisissez la ligne que vous sautez le plus souvent, probablement "format de sortie nommé" ou "le succès est testable," et forcez un oui dessus avant votre prochain envoi. Lorsque vous délimitez le travail de codage, commencez par le Brief de session de codage IA et Donner le bon contexte à l'IA pour que le prompt ait des faits à référencer. Lorsque l'assistant retourne un diff, passez à la Liste de vérification de révision de code IA et au guide Réviser le code IA en toute sécurité. La révision vous donne une question forte; ceux-ci gèrent si vous pouvez faire confiance à la réponse.

La liste de vérification

Passez de haut en bas avant d'envoyer. Chaque ligne est un oui/non que vous pouvez répondre en lisant votre propre brouillon. Un non est une chose à corriger, pas une chose à noter.

  • Rôle et objectif : Le prompt indique quel rôle l'assistant doit jouer et ce à quoi ressemble le "terminé" en une phrase concrète.
  • Contexte présent : Chaque fait que le modèle ne peut pas déduire est dans le prompt, comme la stack, le fichier, la contrainte, la forme des données.
  • Contexte réduit : Le contexte qui ne change pas la réponse est coupé, afin que les faits influençant la décision ressortent.
  • Contraintes explicites : Les limites sont écrites comme des règles, par exemple ne pas modifier le schéma, garder sous 150 lignes, utiliser l'assistant de pagination existant.
  • Format de sortie nommé : La forme exacte est spécifiée, par exemple retourner un diff unifié, un objet JSON avec ces clés, ou une liste numérotée.
  • Exemple quand le format compte : Un court exemple travaillé montre la forme souhaitée, clairement encadré pour être lu comme un échantillon, pas une instruction.
  • Le succès est vérifiable : La définition de "terminé" est quelque chose que vous pourriez vérifier ou pour lequel vous pourriez écrire un test, pas une humeur comme "rendre ça bien".
  • Formulation positive : Les instructions disent quoi faire plutôt que seulement quoi éviter, ce qui guide le modèle de manière plus fiable.
  • Instruction placée en dernier : Lorsque vous collez un long fichier ou journal, la demande réelle se trouve à la fin, sous le matériel collé.
  • Incertitude gérée : Le prompt indique au modèle de demander ou de signaler les suppositions lorsqu'un détail manque, plutôt que d'en inventer un.

Exemple

Exemple travaillé : Maya révise un prompt avant de l'envoyer
Tâche : ajouter la pagination par curseur à l'exportation des commandes sur le service d'administration interne. Brouillon de prompt (avant révision) : "Ajoutez la pagination à l'exportation des commandes. Rendez-le rapide." Passage en revue : - Rôle et objectif : manquants. Aucune déclaration de "terminé". - Contexte : fichier, cadre, et que l'exportation est déjà en flux manquants. - Contraintes : "rapide" est une humeur, pas une règle. La vraie règle n'est pas énoncée. - Format de sortie : non nommé. Maya veut un diff, pas une réécriture. - Exemple : pas encore nécessaire; la règle de format le portera. - Vérifiable : "rapide" ne peut pas être vérifié. "Reste sous 200 ms pour 10k lignes" peut l'être. Prompt révisé (après révision) : "Vous travaillez dans notre service admin Node. Le fichier est routes/orders-export.ts; il diffuse actuellement toutes les commandes en une réponse. Ajoutez une pagination par curseur en utilisant l'assistant paginate() existant dans lib/pagination.ts. Ne changez pas le schéma de réponse au-delà de l'ajout d'un champ nextCursor. Retournez uniquement un diff unifié, pas de prose. Gardez le gestionnaire sous 80 lignes. Si l'assistant ne convient pas, arrêtez et dites-moi pourquoi au lieu d'en écrire un nouveau." Résultat : un aller-retour au lieu de quatre.

Notes d'utilisation

  • Utilisez ceci avant d'envoyer. Pour évaluer un prompt déjà en usage, passez à la Liste de vérification d'évaluation des prompts, qui évalue les sorties sur un ensemble fixe d'entrées sur de nombreuses exécutions.
  • La plupart des prompts échoués manquent exactement une ligne de cette liste. Trouvez cette ligne et corrigez-la plutôt que de réécrire toute la demande.
  • Gardez les prompts exempts de demandes agressives en majuscules comme "CRITIQUE : vous DEVEZ". Les modèles actuels suivent bien les instructions normales et peuvent réagir de manière excessive à un langage forcé, donc une formulation simple suffit.
  • Pour les prompts de codage, associez cela avec le Brief de session de codage IA pour définir d'abord la portée de la tâche, puis avec Donner à l'IA le bon contexte pour assembler les fichiers et les contraintes référencés par le prompt.
  • Une fois que l'assistant retourne du code, la révision est terminée et une autre norme s'applique. Exécutez la Liste de vérification de révision de code IA sur le diff avant de le conserver.
  • Revisitez vos propres habitudes mensuellement. La ligne que vous sautez le plus souvent est celle qui vaut la peine d'être transformée en extrait sauvegardé ou en note CLAUDE.md.

Copiez ceci dans vos notes

# Liste de vérification de révision de prompt Prompt en cours de révision : > (collez votre brouillon de prompt ici) ## Vérifications avant envoi - [ ] Rôle et objectif énoncés; "terminé" est une phrase concrète - [ ] Contexte présent : stack, fichier, contrainte, forme des données - [ ] Contexte réduit : pas de contexte qui ne change pas la réponse - [ ] Contraintes écrites comme des règles, pas implicites - [ ] Format de sortie nommé (diff / clés JSON / tableau / liste) - [ ] Exemple inclus lorsque le format est facile à mal comprendre - [ ] Le succès est vérifiable, pas une humeur - [ ] Formulé comme quoi faire, pas seulement quoi éviter - [ ] Instruction placée après tout long fichier ou journal collé - [ ] Modèle invité à demander ou signaler les suppositions lorsqu'un détail manque ## Journal des corrections - La ligne qui était un non : - Ce que j'ai changé :

Version téléchargeable

Une vérification pré-envoi sur une page pour un seul prompt, avant qu'il ne soit exécuté.

Aperçu

Rôle et intention

  • Le prompt nomme le rôle que l'assistant doit prendre, même si c'est en une phrase.
  • L'objectif est formulé comme une définition concrète de l'accomplissement, pas une demande vague.
  • Le résultat le plus important est évident dès les deux premières lignes.

Contexte

  • Chaque fait que le modèle ne peut pas déduire est inclus : stack, chemin de fichier, framework, structure des données.
  • La contrainte pertinente du système plus large est présente, comme un schéma qui doit rester stable.
  • Les informations de fond qui ne changent pas la réponse ont été coupées pour que les faits clés ressortent.
  • Lorsqu'un long fichier ou journal est collé, l'instruction réelle se trouve à la fin, en dessous.

Contraintes et format

  • Les limites sont écrites comme des règles explicites, pas laissées implicites dans votre tête.
  • La forme exacte de la sortie est nommée : un diff, un objet JSON avec des clés définies, un tableau, une liste numérotée.
  • Un court exemple travaillé est inclus lorsque le format est facile à mal interpréter.
  • Les instructions indiquent quoi faire plutôt que seulement quoi éviter.

Définition de l'accomplissement

  • Le succès est quelque chose que vous pourriez vérifier ou pour lequel vous pourriez écrire un test, pas une humeur comme « rendre ça bien ».
  • Le prompt indique au modèle de demander ou de signaler les suppositions lorsqu'un détail manque.
  • Vous seriez prêt à parier que la première réponse est utilisable ; sinon, trouvez la ligne faible et corrigez-la.
Liste de vérification pour la révision des prompts