Vận hành hệ thống AI agent với ngân sách $20/tháng: Cách một lập trình viên giữ 60% token đến cuối tuần

#openclaw #ai #agent #workflow

Một bài chia sẻ thực tế trên cộng đồng OpenClaw gần đây đã thu hút sự chú ý của nhiều anh em đang vật lộn với vấn đề đốt token khi dùng AI agent. Một lập trình viên chia sẻ cách anh ta vận hành một hệ thống sản xuất nội dung khá phức tạp mà đến cuối tuần vẫn còn 55-60% ngân sách gói Codex Plus.

Điều này nghe có vẻ khó tin với những ai thường xuyên cháy token chỉ sau vài ngày. Nhưng chiến lược của anh ấy thực ra rất đơn giản và có thể áp dụng được.

Agent ở vai trò giám sát, không phải lập trình viên

Nguyên tắc cốt lõi đầu tiên: agent AI nên đóng vai trò người điều hành hệ thống, không phải là người viết code chính. Hầu hết các tác vụ trong hệ thống của anh đều chạy bằng Python script — đầu ra ổn định, có thể kiểm soát, và quan trọng nhất là không tiêu tốn token AI.

Vai trò của OpenClaw agent chỉ là:

Giám sát quá trình thực thi script
Gửi thông báo ngắn gọn qua Telegram về kết quả (thường chỉ một từ)
Phát hiện lỗi và mô tả vấn đề khi script dừng
Đề xuất cách sửa lỗi — nhưng chỉ sửa khi được con người phê duyệt

Mô hình này giúp tiết kiệm token đáng kể vì agent không phải "suy nghĩ" để viết code từ đầu. Nó chỉ cần đọc output, phát hiện bất thường, và đề xuất hướng xử lý.

Pipeline coding agent – reviewing agent

Một điểm đáng chú ý khác trong hệ thống của anh là pipeline hai lớp cho việc sửa lỗi:

Coding agent nhận nhiệm vụ viết hoặc sửa code
Reviewing agent kiểm tra code đã sửa
Nếu bản review sạch, code được gửi về main agent để tích hợp

Nghe có vẻ dư thừa, nhưng thực tế cách làm này tiết kiệm thời gian và token vì code được duyệt qua hai lớp luôn chạy đúng ngay lần đầu, tránh được vòng lặp sửa đi sửa lại tốn kém.

Viết code bằng desktop app, agent chỉ tích hợp

Một chiến lược tiết kiệm token thông minh khác: thay vì để agent viết code trực tiếp (tốn token), code được viết trong Claude desktop hoặc ChatGPT desktop (đã bao gồm trong gói $20/tháng). Sau đó code được đưa vào hệ thống và agent chỉ làm nhiệm vụ review:

Nếu không có lỗi → tích hợp vào hệ thống
Nếu có lỗi → tạo error log

Error log này được đưa ngược lại vào desktop app để sửa, thay vì dùng token của agent để debug. Cách tiếp cận này tận dụng được token đã trả tiền từ các dịch vụ khác thay vì đốt token agent cho những việc có thể làm rẻ hơn.

Chiến lược quản lý ngân sách token theo tuần

Tác giả bài viết cũng chia sẻ cách tiếp cận ngân sách token hàng tuần khá thực dụng:

Ưu tiên công việc theo token còn lại. Đợi đến ngày trước khi reset gói tuần, dựa vào số token còn lại để quyết định làm gì. Không cố nhồi nhét mọi thứ vào đầu tuần.

Giữ hệ thống ổn định. Nếu phiên bản hiện tại đang chạy tốt, đừng vội nâng cấp chỉ vì có bản mới. Một lần nâng cấp gặp lỗi config đã ngốn hơn 40% ngân sách token cả tuần của anh ấy.

Dùng model cao cấp cho việc khó. Khi cần giải quyết bug cứng đầu, chuyển lên model mạnh hơn (như GPT 5.5 High) thay vì để model yếu hơn loay hoay nhiều vòng tốn token.

Checklist thực hành cho anh em

Dựa trên chia sẻ này, mình tổng hợp một checklist thực tế cho anh em muốn vận hành hệ thống AI agent hiệu quả với ngân sách hạn chế:

Script hóa mọi thứ có thể. Python script cho các tác vụ lặp lại, agent chỉ giám sát kết quả
Phân tách vai trò agent. Coding agent + reviewing agent cho các tác vụ quan trọng cần độ chính xác cao
Tận dụng token từ dịch vụ khác. Viết code bằng Claude hoặc ChatGPT desktop app, agent chỉ review và tích hợp
Thông báo ngắn gọn. Telegram message một từ cho kết quả thành công, chỉ chi tiết khi có lỗi
Quản lý ngân sách theo tuần. Ưu tiên việc dựa trên token còn lại, không chạy đua làm hết mọi thứ
Đừng nâng cấp vội. Nếu hệ thống đang chạy ổn, đợi đến khi thực sự cần mới nâng cấp
Phê duyệt trước khi sửa. Luôn yêu cầu agent đề xuất giải pháp thay vì tự động thực thi thay đổi

Tổng kết

Điểm mấu chốt không phải là agent của bạn mạnh đến đâu, mà là bạn thiết kế workflow thông minh đến đâu. Một gói $20/tháng hoàn toàn có thể vận hành được hệ thống phức tạp nếu bạn dùng agent đúng vai trò: người giám sát và điều phối, không phải cỗ máy viết code toàn năng.

Bài học lớn nhất từ chia sẻ này: token rẻ nhất là token không phải dùng đến. Mọi thứ có thể chạy bằng script thì nên chạy bằng script.

AI & Automation (vnROM)