AI & Automation (vnROM)

Cover image for Cách tránh tốn token và agent loop khi mới dùng OpenClaw
ROMhub
ROMhub

Posted on • Originally published at reddit.com

Cách tránh tốn token và agent loop khi mới dùng OpenClaw

Một bạn mới dùng OpenClaw chia sẻ rằng ba tuần đầu tốn khá nhiều token, agent hay lặp, setup nhiều thứ cùng lúc thì dễ vỡ, và chỉ sau khi chậm lại để cấu hình bài bản thì trải nghiệm mới ổn hơn. Đây là kiểu bài học rất đáng ghi lại, vì đa số người mới không hỏng ở chỗ “agent không đủ thông minh”, mà hỏng ở cách mình vận hành agent.

1. Đừng dùng model mạnh cho mọi việc

Sai lầm phổ biến nhất là để một model đắt tiền xử lý cả những tác vụ không cần suy luận sâu: heartbeat, cron ping, kiểm tra trạng thái, tóm tắt ngắn, phân loại đơn giản.

Cách làm thực tế hơn:

  • Tách task theo độ khó: kiểm tra định kỳ, đọc log, lọc inbox, viết báo cáo, debug, lập kế hoạch.
  • Dùng model rẻ/nhanh cho task lặp lại và có khuôn mẫu rõ.
  • Chỉ bật model mạnh khi cần suy luận nhiều bước, quyết định kiến trúc, phân tích lỗi phức tạp, hoặc viết nội dung quan trọng.
  • Theo dõi chi phí theo nhóm task, không chỉ nhìn tổng token cuối tháng.

Một nguyên tắc dễ nhớ: nếu con người cũng chỉ cần “nhìn rồi đánh dấu”, agent không cần model cao nhất.

2. Agent cần luật vận hành, không chỉ prompt hay

Nhiều anh em kỳ vọng cài xong là agent sẽ tự biết dừng, tự biết xác minh, tự nhớ quyết định cũ. Thực tế, agent rất dễ rơi vào các vòng lặp như:

  • kiểm tra lại cùng một thứ nhiều lần;
  • hỏi người dùng dù có thể tự tra trong workspace;
  • sửa một file rồi quên chạy bước xác minh;
  • mất ngữ cảnh sau vài lượt dài;
  • làm quá nhiều hướng cùng lúc.

Thứ thường tạo khác biệt là một bộ quy tắc vận hành rõ ràng:

  • khi nào được tự hành động, khi nào phải hỏi;
  • luôn kiểm tra bằng test, lint, build, diff hoặc log trước khi báo xong;
  • không lặp lại cùng một lệnh nếu kết quả không đổi;
  • ghi lại quyết định quan trọng vào file workspace;
  • tóm tắt trạng thái trước khi chuyển sang task dài.

Prompt tốt giúp agent bắt đầu đúng. Luật vận hành giúp agent không trôi khỏi đường ray.

3. Tích hợp từng lớp, đừng nối email, WhatsApp, web scraping và cron cùng lúc

Một lỗi rất dễ mắc khi mới thấy agent chạy được là muốn nối mọi thứ ngay: email, chat, web scraping, lịch, báo cáo, tự động gửi tin, tự động đăng bài. Về mặt kỹ thuật có thể làm được, nhưng khi lỗi xảy ra sẽ rất khó biết lỗi nằm ở đâu.

Lộ trình an toàn hơn:

  1. Chọn một luồng có giá trị rõ nhất, ví dụ tóm tắt email hằng ngày.
  2. Làm cho luồng đó chạy ổn trong vài ngày.
  3. Thêm logging đủ để biết agent đã đọc gì, quyết định gì, bỏ qua gì.
  4. Sau đó mới thêm kênh thứ hai như WhatsApp hoặc web scraping.
  5. Chỉ bật cron khi thao tác thủ công đã ổn định.

Với agent cá nhân, “ít nhưng chạy chắc” thường thắng “nhiều nhưng khó tin”.

4. Dùng workspace như bộ nhớ dài hạn

Context compaction giúp phiên làm việc không quá nặng, nhưng nó cũng có mặt trái: một số quyết định, giả định, hoặc chi tiết nhỏ có thể bị mất dần. Nếu agent phải nhớ thứ quan trọng trong nhiều ngày, đừng chỉ để nó nằm trong chat.

Nên có vài file nền tảng trong workspace:

  • decisions.md: quyết định đã chốt và lý do.
  • runbook.md: quy trình chạy các tác vụ lặp lại.
  • known-issues.md: lỗi đã gặp, cách nhận diện, cách xử lý.
  • preferences.md: gu viết, quy tắc giao tiếp, những điều không được làm.
  • handoff.md: trạng thái hiện tại của dự án hoặc automation.

Khi cần mở phiên mới, chỉ cần đưa đúng tài liệu nền vào ngữ cảnh là agent sẽ ít “mất trí nhớ” hơn rất nhiều.

5. Đừng so ngày thứ ba của mình với tháng thứ ba của người khác

Những bài “agent xây app qua đêm” thường bỏ qua phần chuẩn bị phía sau: cấu hình model routing, viết skill, gom tài liệu, đặt guardrail, tạo test, chuẩn hóa repo, và sửa rất nhiều vòng lặp nhỏ.

Người mới nên đo tiến bộ bằng các mốc thực tế hơn:

  • agent hoàn thành một task nhỏ mà không cần nhắc lại;
  • chi phí giảm vì model routing hợp lý hơn;
  • một automation chạy ổn ba ngày liên tục;
  • agent tự kiểm tra kết quả trước khi báo xong;
  • mỗi lỗi lặp lại đều được biến thành một rule hoặc runbook.

Đây là các dấu hiệu cho thấy hệ thống đang trưởng thành, dù chưa có demo hoành tráng.

Checklist nhanh cho người mới bắt đầu

Nếu anh em đang trong tuần đầu với OpenClaw, mình sẽ ưu tiên theo thứ tự này:

  • Chọn một use case duy nhất để làm ổn trước.
  • Phân loại task nào dùng model rẻ, task nào dùng model mạnh.
  • Viết 5-10 quy tắc chống lặp và bắt buộc xác minh.
  • Lưu quyết định quan trọng vào workspace, không để trôi trong chat.
  • Bật logging cho mọi automation có lịch chạy.
  • Sau mỗi lỗi, thêm một dòng vào runbook thay vì chỉ sửa tạm.

Kết luận ngắn: agent tốt không chỉ đến từ model tốt. Nó đến từ cách mình thiết kế môi trường làm việc, luật vận hành, bộ nhớ dài hạn và lộ trình tích hợp đủ chậm để kiểm soát được.

Top comments (0)