Частина 6: Контролюйте вартість
Типове питання про AI-розробку — «як швидко ми можемо випускати?» Краще питання — «скільки коштує це підтримувати?» Швидкість приховує реальну економіку. Чесна метрика — сукупна вартість володіння, і в AI-робочому процесі вона визначається одним: токенною економікою.
Прихований борг від швидкості
Безсистемні промпти виглядають майже безкоштовно — підписка й кілька випадкових запитів, майже нульова початкова вартість. Рахунок приходить пізніше, і він накопичується:
- Витрата токенів. Скидання величезних неструктурованих файлів у контекстне вікно й прохання моделі виправити власні неперевірені помилки створює дорогий цикл повторних спроб із низькою успішністю першого проходу. Кожна невдала спроба — витрачені токени ні за що.
- Податок на підтримку. Неструктурований генерований код позбавлений узгодженості. Через шість місяців інженер витрачає дні на зворотне проєктування «спагеті», яке ніхто не проєктував.
- Ліквідація вразливостей безпеки. Без харнесу оцінювання швидка генерація коду стає швидкою генерацією вразливостей. Виправлення дефекту в продакшні коштує набагато більше, ніж його виявлення на стадії проєктування.
Структурований підхід перевертає це: ви інвестуєте заздалегідь у схеми, тести й контекст, і гранична вартість випуску й підтримки кожної функціональності різко знижується. Вища вартість побудови, але значно нижча вартість володіння.
Важіль перший: успішність першого проходу
Найдешевший токен — той, який ви не витрачаєте на повторну спробу. Щільний, насичений сигналом файл правил (частина 1) і добре керований контекст (частина 2) підвищують успішність першого проходу агента, що безпосередньо скорочує цикли «спроба-і-помилка», що спалюють гроші. Інженерія контексту — це не лише практика якості, а й практика контролю витрат. Той самий щільний CLAUDE.md, що покращує результат, також скорочує витрати.
Передавати цілий репозиторій на 100 000 токенів у кожен промпт фінансово нежиттєздатно у масштабі. Отримуйте релевантне; платіть за те, що використовуєте.