ROMhub

Posted on May 7 • Originally published at reddit.com

Mình đã log từng đồng OpenClaw tiêu trong 2 tuần: 67% ngân sách bị đốt cho heartbeat và đọc file

#openclaw #agent #cost #optimization

Nếu bạn đang chạy OpenClaw agent 24/7, có một câu hỏi mình nghĩ anh em nào cũng nên tự trả lời: bao nhiêu phần trăm tiền token của mình đang thực sự tạo ra giá trị?

Một thành viên trên r/openclaw đã dành 2 tuần log toàn bộ tương tác của agent Telegram + Discord mà anh ta đang chạy. Kết quả gây sốc hơn mình tưởng.

Phân tích 14 ngày: tiền đi đâu?

Sau 672 lần heartbeat (mỗi 30 phút) và hàng trăm tác vụ khác, bức tranh chi phí hiện ra thế này:

Heartbeat (ping định kỳ): 38% token — đang chạy trên Opus
Đọc và tóm tắt file: 29% token — cũng trên Opus
Hội thoại thực sự (cần chất lượng): 22% token
Tác vụ phức tạp (Opus tốt hơn hẳn): 11% token

Con số đập vào mắt: 67% lượng token được dùng cho những việc mà model rẻ nhất (flash, $0.14/M) cho chất lượng y hệt model đắt nhất (opus, ~$6.75/M).

Nói cách khác: cứ 3 đồng anh em bỏ ra thì 2 đồng đang bị đốt.

Vì sao chuyện này xảy ra?

Khi thiết lập OpenClaw, phần lớn anh em (kể cả mình) chọn luôn model mạnh nhất làm default. Claude Opus, GPT-5 Codex — model càng xịn càng yên tâm. Nhưng agent không chỉ chạy hội thoại. Nó còn:

Heartbeat mỗi 30 phút: Kiểm tra inbox, calendar, trạng thái. Về bản chất là một câu lệnh ping — không cần suy luận phức tạp.
Đọc và tóm tắt file: Mở file log, đọc config, parse JSON. Flash làm y hệt opus.
Các câu hỏi đơn giản: "Mấy giờ rồi?", "Thời tiết hôm nay thế nào?".

Tất cả những tác vụ này không cần model xịn. Nhưng vì default model là opus, agent cứ thế dùng opus cho mọi thứ.

Cách fix: chỉ mất 2 phút config

Người dùng này đã thử một chiến lược đơn giản và hiệu quả:

Bước 1: Đổi primary model mặc định sang model rẻ

Trong openclaw.json, set:

"agents": {
  "defaults": {
    "model": {
      "primary": "deepseek/deepseek-v4-flash"
    }
  }
}

Model này đủ khỏe cho 90% tác vụ thường ngày của agent.

Bước 2: Chỉ nâng model khi thực sự cần

Khi gặp tác vụ phức tạp (debug logic, viết code dài, phân tích đa bước), gõ ngay trong session:

/model anthropic/claude-opus-4-7

Xong việc thì quay về:

/model deepseek/deepseek-v4-flash

Không cần restart, không mất session. Chuyển model mất đúng 1 dòng lệnh.

Kết quả thực tế

Trước: ~$170/tháng
Sau: ~$35/tháng
Tiết kiệm: gần 80%, không giảm chất lượng ở bất kỳ đâu

Điều thú vị là tác giả bài gốc cũng thừa nhận: "Phần bực nhất là mất 2 tuần log thủ công chỉ để phát hiện ra điều này." Anh ta có chạy thêm một agent Gmail trên BetterClaw free tier với BYOK. Bên đó có tính năng hiển thị chi tiêu theo từng tác vụ, và phát hiện ra vấn đề heartbeat waste ngay lập tức — thay vì mất 2 tuần tracking tay.

Checklist cho anh em

Trước khi đóng tab này, làm nhanh mấy bước sau:

Kiểm tra agents.defaults.model.primary trong openclaw.json — model nào đang là default?
Nếu đang là opus hoặc model đắt tương đương, cân nhắc chuyển về flash cho tác vụ thường ngày
Tập thói quen /model lên model mạnh khi vào việc khó, /model về model rẻ khi xong
Nếu xài BetterClaw hoặc tool có cost breakdown, bật lên xem tiền đang đi đâu
Đừng đợi "surprise bill" như tác giả bài gốc mới bắt đầu theo dõi

Lời kết

Đây không phải chuyện tiết kiệm vài chục đô một tháng. Đây là bài học vận hành: agent càng chạy nhiều, chi phí ẩn từ những tác vụ nhỏ càng lớn. 67% ngân sách bay vào heartbeat và đọc file không phải là lỗi kỹ thuật — đó là lỗi thiết kế config.

Sửa nó mất 2 phút. Nhưng không sửa thì mỗi tháng ví anh em vẫn đều đặn nhẹ đi 100-130$.

AI & Automation (vnROM)