Agentic Engineering — कार्यान्वयन चेकलिस्ट
विषय-सूची
- Rule file तैयार करें
- Context engineer करें
- Verification बनाएँ
- काम चलाएँ
- Review करें और ship करें
- Cost नियंत्रित करें
- Production agents ship करें
- Team standard बनाएँ
1. Rule file तैयार करें
- Repo root में
CLAUDE.md/AGENTS.mdबनाएँ। 10 lines से शुरुआत करें। - चार चीज़ें cover करें:
- Stack और versions
- Conventions (folder structure, naming, वे patterns जो आप वाकई उपयोग करते हैं)
- Hard rules जो agent को कभी नहीं तोड़नी चाहिए (forbidden packages, secrets handling, layering)
- Code generate करने से पहले और बाद में follow करने का Workflow
- जब भी agent कुछ ऐसा करे जो आप दोबारा नहीं चाहते, एक नया rule जोड़ें।
- वे tools list करें जिन्हें agent call कर सकता है और उनका उपयोग कब करना है (APIs, scripts, DB schemas)।
- Architecture decisions खुद लें; agent को implement करने दें, choose नहीं करने दें।
2. Context engineer करें
- तय करें कि क्या static है (हमेशा load) बनाम dynamic (माँगने पर load):
- Static: rule files, system instructions, global memory
- Dynamic: skills, tool results, retrieved docs, recent history
- Static context छोटा और high-signal रखें। जो चीज़ agent को हर call में नहीं चाहिए, उसे हटाएँ।
- दोहराने योग्य know-how को skills में डालें जो केवल तब load हों जब task match करे।
- पूरा repo prompt में कभी paste न करें। जो relevant है वही retrieve करें।
3. Verification बनाएँ
- Feature generate करने से पहले tests लिखें। Tests ही spec हैं।
- Non-deterministic हिस्सों के लिए evals लिखें:
- क्या agent ने sensible path लिया?
- क्या उसने सही tools चुने?
- क्या output quality bar को पूरा करता है?
- Result (compiles, tests pass) और trajectory (कैसे पहुँचा) दोनों जाँचें।
- Feedback loop तैयार करें:
- Benchmark suite के खिलाफ run करें
- Failures को root cause से cluster करें
- उस prompt या tool को ठीक करें जिसने उन्हें पैदा किया
- Regression suite दोबारा run करें
- नई failures के लिए production monitor करें
4. काम चलाएँ
- प्रत्येक task के लिए एक mode चुनें:
- Conductor (real-time, in-IDE) — complex logic, debugging, अपरिचित code के लिए
- Orchestrator (async, delegate and review) — bug fixes, migrations, test generation के लिए
- प्रत्येक task के लिए agent location चुनें:
- Editor agent — in-flow edits और suggestions
- Terminal agent — multi-file work, run-and-react
- Background agent — paragraph-spec tasks जिन्हें आप छोड़ सकते हैं
- Code generation sandbox के अंदर, केवल approved tools का उपयोग करके चलाएँ।
- अंतिम 20% खुद संभालें: edge cases, error handling, integration points, business logic। जो code "सही लगता है" वहीं bugs छिपे होते हैं।
5. Review करें और ship करें
- Agent को first-pass reviewer के रूप में उपयोग करें (bugs, style, security, performance)।
- हर वह line review करें जो ship हो:
- Clever code पर संदेह करें
- Confirm करें कि imported packages असली हैं
- Realistic failures के लिए error handling जाँचें
- Commit/edit points पर hooks जोड़ें (जैसे hard-coded secrets वाले commits block करें)।
- Observability चालू करें: traces, eval results, token/latency/cost, drift।
- Agent को उस legacy work पर लगाएँ जिसे आप टालते रहे हैं: refactors, migrations, deprecated APIs।
6. Cost नियंत्रित करें
- केवल speed नहीं, total cost of ownership मापें।
- Retry loops से बचने के लिए tight rule file से first-pass success बढ़ाएँ।
- Task के अनुसार models route करें:
- Architecture और कठिन implementation के लिए frontier models
- Test generation, review, CI monitoring के लिए सस्ते models
- Dynamic context और skills उपयोग करें ताकि आप केवल वे tokens के लिए pay करें जिनकी ज़रूरत है।