Частина 4: Виконуйте роботу
У вас є файл правил, спроєктований контекст і верифікація. Тепер ви реально виконуєте роботу. Два питання, що визначають, наскільки добре вона піде: у якому режимі ви перебуваєте і який вид агента підходить для завдання.
Два режими: диригент і оркестратор
Більшість розробників перемикаються між двома режимами протягом дня. Вони вимагають різних навичок, а використання невідповідного для завдання — часте джерело розчарування.
Режим диригента — реальний час, практичний. Ви в редакторі, спостерігаєте, як з'являється код, керуєте промптами й виправленнями, тримаєте деталізований контроль. Ви розумієте кожну зміну в міру її внесення.
- Найкраще для: складної логіки, хитрого налагодження, незнайомих кодових баз — скрізь, де потрібно розуміти кожен крок.
- Ризик: якщо ви диригуєте кожним натисканням клавіші, ви стаєте вузьким місцем і прискорення зникає.
Режим оркестратора — асинхронний, на вищому рівні. Ви визначаєте мету, передаєте її агенту й перевіряєте результат — не натискання клавіш. Агенти можуть працювати у фоні, паралельно, над різними частинами кодової бази.
- Найкраще для: чітко специфікованої роботи — виправлення помилок, міграції, генерація тестів, функціональність за усталеним патерном.
- Застереження: це вимагає більше дисципліни заздалегідь, а не менше. Потрібно написати точну специфікацію, перш ніж делегувати. Окупність приходить на другому завданні, не на першому.
Режим оркестратора винагороджує інший набір навичок, ніж знання синтаксису:
- Специфікація — визначте завдання достатньо точно, щоб агент міг виконати його без здогадок.
- Декомпозиція — розбийте велику роботу на одиниці, посильні для агента.
- Оцінювання — швидко оцінюйте якість результату.
- Проєктування систем — будуйте обмеження й цикли зворотного зв'язку, що тримають агентів продуктивними.
Три місця, де агенти вписуються у ваш день
Інший зріз тієї ж картини: агенти з'являються в трьох місцях. Більшість людей використовує всі три.
- У редакторі — вбудоване завершення й чат на місці, з усвідомленням усієї кодової бази. Тут ви залишаєтеся в потоці. (Copilot, Cursor, Windsurf, JetBrains AI.)
- У терміналі — ви запускаєте агента, даєте йому мету звичайною мовою і дозволяєте йому працювати з файлами, запускати інструменти й тести й реагувати на результати. Тут відбувається серйозна практична робота. (Claude Code, Codex CLI та подібні.)
- У фоні — агент виконує роботу автономно в пісочниці, іноді годинами, і повертає pull request для перегляду пізніше. (Jules, Copilot agent mode, Cursor background agents.)
Відображення інтуїтивно зрозуміле, як тільки ви його побачите: агенти в редакторі підходять під час написання; агенти в терміналі — для роботи з кількома файлами та запуску-реакції; фонові агенти — для будь-чого, що можна описати в абзаці й відійти. Правильна відправна точка — завдання, а не той інструмент, який заявляє про найбільшу автономію.
Запускайте всередині пісочниці
Коли агент виконує код — запускає тести, пробує виправлення, читає файли — він повинен робити це всередині ізольованої пісочниці з визначеним, обмеженим набором інструментів і доступу. Це те, що робить автономний цикл «думати → діяти → спостерігати» безпечним: агент може пробувати й помилятися, не торкаючись нічого зайвого.
Проблема 80% (де все йде не так)
Агент генерує приблизно 80% функціональності швидко. Решта 20% — крайні випадки, обробка помилок, точки інтеграції, тонка коректність — потребує глибокого контексту, якого зазвичай бракує моделі. І саме тут живуть продакшн-збої.
Небезпека змінилася. Ранні AI-помилки були очевидними синтаксичними помилками. Сьогоднішні помилки — концептуальні: невірне припущення про бізнес-логіку, пропущений крайній випадок, архітектурний вибір, що тихенько накопичує технічний борг. Їх важко помітити саме тому, що код виглядає правильно і може навіть пройти базові тести.
Конкретно:
# The agent's 80%: looks correct, passes the happy-path test
def apply_discount(price, percent):
return price * (1 - percent / 100)
Відсутні 20% — це все, про що агент не знав запитати: чи може percent перевищувати 100? price — це ціле число в центах чи float? Яке округлення валюти застосовується? Чи взагалі дозволена 100%-знижка, чи це сигнал про баг у верхньому шарі? Нічого з цього не видно в коді — це бізнес-правила, якими ви володієте, а модель ні.
Розробники, які досягають успіху, не намагаються йти швидше, приймаючи все. Вони використовують агента для чітко специфікованих 80% і витрачають власну увагу на 20%, що вимагають судження.
Налаштуйте власний робочий процес
- Перед завданням свідомо обирайте режим диригента або оркестратора — і помічайте, коли ви диригуєте роботою, яку мали б делегувати.
- Підбирайте місце агента під завдання: редактор для потоку, термінал для роботи з кількома файлами, фон для того, від чого можна відійти.
- Переконайтеся, що виконання коду відбувається в пісочниці з обмеженим доступом.
- Для кожної функціональності запишіть ті 20% — крайні випадки та бізнес-правила — і перегляньте ці рядки самостійно, навіть якщо тести проходять.