Агентна інженерія — контрольний список впровадження
Зміст
- Налаштуйте файл правил
- Спроєктуйте контекст
- Побудуйте верифікацію
- Виконуйте роботу
- Рев'ю та випуск
- Контролюйте вартість
- Виводьте агентів у продакшн
- Зробіть це командним стандартом
1. Налаштуйте файл правил
- Створіть
CLAUDE.md/AGENTS.mdу корені репозиторію. Почніть із 10 рядків. - Охопіть чотири аспекти:
- Стек і версії
- Конвенції (структура папок, іменування, патерни, які ви реально використовуєте)
- Жорсткі правила, які агент не повинен порушувати ніколи (заборонені пакети, робота з секретами, шарування)
- Робочий процес, якого слід дотримуватися перед генерацією коду
- Додавайте нове правило щоразу, коли агент робить те, що ви не хочете повторювати.
- Перелічте інструменти, які агент може викликати, і коли їх використовувати (API, скрипти, схеми БД).
- Приймайте архітектурні рішення самостійно; дозволяйте агенту їх реалізовувати, а не обирати.
2. Спроєктуйте контекст
- Визначте, що є статичним (завжди завантажується) і що динамічним (завантажується за потребою):
- Статичне: файли правил, системні інструкції, глобальна пам'ять
- Динамічне: навички, результати інструментів, отримані документи, нещодавня історія
- Тримайте статичний контекст коротким і щільним. Видаляйте все, що агенту не потрібно в кожному виклику.
- Переносьте повторювані знання в навички, які завантажуються лише коли завдання відповідає їм.
- Ніколи не вставляйте весь репозиторій у промпт. Отримуйте лише те, що релевантно.
3. Побудуйте верифікацію
- Пишіть тести до того, як генерувати функціональність. Тести — це специфікація.
- Пишіть евали для недетермінованих частин:
- Чи пройшов агент розумним шляхом?
- Чи вибрав він правильні інструменти?
- Чи відповідає результат планці якості?
- Перевіряйте як результат (компілюється, тести проходять), так і траєкторію (як він туди дістався).
- Налаштуйте цикл зворотного зв'язку:
- Запускайте проти набору бенчмарків
- Кластеризуйте збої за першопричиною
- Виправляйте промпт або інструмент, що їх спричинив
- Повторно запускайте регресійний набір
- Відстежуйте нові збої в продакшні
4. Виконуйте роботу
- Обирайте режим для кожного завдання:
- Диригент (в реальному часі, в IDE) для складної логіки, налагодження, незнайомого коду
- Оркестратор (асинхронно, делегуйте й перевіряйте) для виправлення помилок, міграцій, генерації тестів
- Обирайте місце агента для кожного завдання:
- Агент у редакторі — редагування та пропозиції в потоці роботи
- Агент у терміналі — робота з кількома файлами, запуск і реакція
- Фоновий агент — завдання, описані в абзаці, від яких можна відійти
- Запускайте генерацію коду всередині пісочниці з використанням лише затверджених інструментів.
- Беріть останні 20% на себе: крайні випадки, обробка помилок, точки інтеграції, бізнес-логіка. Саме в коді, який «виглядає правильно», ховаються баги.
5. Рев'ю та випуск
- Використовуйте агента як рецензента першого проходу (баги, стиль, безпека, продуктивність).
- Переглядайте кожен рядок, який іде в продакшн:
- Ставтеся скептично до хитромудрого коду
- Перевіряйте, що імпортовані пакети реально існують
- Перевіряйте обробку помилок для реальних збоїв
- Додавайте хуки в точках коміту/редагування (наприклад, блокуйте коміти з жорстко закодованими секретами).
- Увімкніть спостережуваність: трейси, результати евалів, токени/затримки/вартість, дрейф.
- Направляйте агента на легасі-код, якого ви уникали: рефакторинг, міграції, застарілі API.
6. Контролюйте вартість
- Вимірюйте сукупну вартість володіння, а не лише швидкість.
- Підвищуйте успішність першого проходу за допомогою щільного файлу правил, щоб уникнути циклів повторних спроб.
- Маршрутизуйте моделі за завданням:
- Фронтирні моделі для архітектури та складної реалізації
- Дешеві моделі для генерації тестів, рев'ю, моніторингу CI
- Використовуйте динамічний контекст і навички, щоб платити лише за потрібні токени.
7. Виводьте агентів у продакшн
- Визначте, що саме ви будуєте:
- Скрипт — агент є кінцевою точкою
- Продукт для реальних користувачів — агенту потрібна інфраструктура
- Для продуктів додайте: постійну пам'ять, обмежені дозволи, покриття евалами в CI, трасування повних запусків.
- Використовуйте пакет навичок, щоб ваш наявний агент-кодер міг будувати → оцінювати → розгортати → спостерігати.
- Для мультиагентних налаштувань координуйтеся через спільний стан, MCP для інструментів, A2A для делегування.
8. Зробіть це командним стандартом
- Версіонуйте файли правил, промпти, набори евалів і навички. Переглядайте їх у PR. Призначайте власників.
- Ставте умовою випуску проходження набору евалів із чітким рубриком, а не лише працюючу демо.
- Навчайте рецензентів того, як генерований код дає збої.
- Чітко визначайте межу між прототипом і продакшном (репозиторії, гілки, середовища).
- Побудуйте харнес один раз і постійно його вдосконалюйте.
- Наймайте та просувайте тих, хто здатний приймати рішення: специфікація, оцінювання, архітектура.
Джерело
На основі The New SDLC With Vibe Coding (Google): https://www.kaggle.com/whitepaper-the-new-SDLC-with-vibe-coding