Agentisk ingenjörskonst — Implementeringschecklista

Innehåll

Skapa en CLAUDE.md / AGENTS.md i repo-roten. Börja med 10 rader.
Täck in fyra saker:
- Stack och versioner
- Konventioner (mappstruktur, namngivning, mönster du faktiskt använder)
- Hårda regler som agenten aldrig får bryta (förbjudna paket, hantering av hemligheter, lagerindelning)
- Arbetsflöde att följa före och efter kodgenerering
Lägg till en ny regel varje gång agenten gör något du inte vill ska upprepas.
Lista de verktyg agenten får anropa och när de ska användas (API:er, skript, DB-scheman).
Fatta arkitekturbeslut själv; låt agenten implementera dem, inte välja dem.

Bestäm vad som är statiskt (alltid laddat) kontra dynamiskt (laddat vid behov):
- Statiskt: regelfiler, systeminstruktioner, globalt minne
- Dynamiskt: skills, verktygsresultat, hämtade dokument, nylig historik
Håll den statiska kontexten kort och innehållsrik. Skär bort allt agenten inte behöver vid varje anrop.
Flytta återkommande know-how till skills som bara laddas när uppgiften matchar.
Klistra aldrig in hela repot i prompten. Hämta det som är relevant.

Välj ett läge per uppgift:
- Dirigent (realtid, i IDE:n) för komplex logik, felsökning, okänd kodbas
- Orkestratör (asynkront, delegera och granska) för buggfixar, migreringar, testgenerering
Välj agentplats per uppgift:
- Editoragent — in-flow-redigeringar och förslag
- Terminalagent — arbete med flera filer, kör-och-reagera
- Bakgrundsagent — paragraf-spec-uppgifter du kan lämna
Kör kodgenerering inuti en sandlåda, med enbart godkända verktyg.
Hantera de sista 20% själv: edge cases, felhantering, integrationspunkter, affärslogik. Koden som "ser rätt ut" är där buggarna gömmer sig.

Använd agenten som en första granskare (buggar, stil, säkerhet, prestanda).
Granska varje rad som levereras:
- Var skeptisk mot smart kod
- Bekräfta att importerade paket är verkliga
- Kontrollera felhantering mot realistiska fel
Lägg till hooks vid commit/redigerings-punkter (t.ex. blockera commits med hårdkodade hemligheter).
Aktivera observerbarhet: traces, evalueringsresultat, token/latens/kostnad, drift.
Peka agenten mot äldre arbete du undvikit: omstruktureringar, migreringar, föråldrade API:er.

Mät total ägandekostnad, inte bara hastighet.
Höj första-försökets-framgång med en tät regelfil för att undvika upprepningsloops.
Rutt modeller efter uppgift:
- Frontiermodeller för arkitektur och svår implementering
- Billiga modeller för testgenerering, granskning, CI-övervakning
Använd dynamisk kontext och skills så du bara betalar för de tokens du behöver.

Bestäm vad du bygger:
- Ett skript — agenten är ändpunkten
- En produkt för riktiga användare — agenten behöver ett substrat
För produkter, lägg till: beständigt minne, avgränsade behörigheter, evalueringstäckning i CI, spårning av hela körningar.
Använd ett skills-paket så din befintliga kodagent hanterar bygg → utvärdera → driftsätt → observera.
För multi-agent-upplägg, koordinera via delat tillstånd, MCP för verktyg, A2A för delegering.

Versionshantera regelfiler, promptar, evalueringssviter och skills. Granska dem i PR:er. Tilldela ägare.
Gate:a leverans på en godkänd evalueringssvit med ett tydligt rubric, inte en fungerande demo.
Träna granskare i hur genererad kod misslyckas.
Gör prototype-kontra-produktion-gränsen explicit (vilka repos, grenar, miljöer).
Bygg harnessen en gång och fortsätt förfina den.
Anställ och befordra för omdöme: specifikation, utvärdering, arkitektur.