AI & Automation (vnROM)

Cover image for Mình đã log từng đồng OpenClaw tiêu trong 2 tuần: 67% ngân sách bị đốt cho heartbeat và đọc file
ROMhub
ROMhub

Posted on • Originally published at reddit.com

Mình đã log từng đồng OpenClaw tiêu trong 2 tuần: 67% ngân sách bị đốt cho heartbeat và đọc file

Nếu bạn đang chạy OpenClaw agent 24/7, có một câu hỏi mình nghĩ anh em nào cũng nên tự trả lời: bao nhiêu phần trăm tiền token của mình đang thực sự tạo ra giá trị?

Một thành viên trên r/openclaw đã dành 2 tuần log toàn bộ tương tác của agent Telegram + Discord mà anh ta đang chạy. Kết quả gây sốc hơn mình tưởng.

Phân tích 14 ngày: tiền đi đâu?

Sau 672 lần heartbeat (mỗi 30 phút) và hàng trăm tác vụ khác, bức tranh chi phí hiện ra thế này:

  • Heartbeat (ping định kỳ): 38% token — đang chạy trên Opus
  • Đọc và tóm tắt file: 29% token — cũng trên Opus
  • Hội thoại thực sự (cần chất lượng): 22% token
  • Tác vụ phức tạp (Opus tốt hơn hẳn): 11% token

Con số đập vào mắt: 67% lượng token được dùng cho những việc mà model rẻ nhất (flash, $0.14/M) cho chất lượng y hệt model đắt nhất (opus, ~$6.75/M).

Nói cách khác: cứ 3 đồng anh em bỏ ra thì 2 đồng đang bị đốt.

Vì sao chuyện này xảy ra?

Khi thiết lập OpenClaw, phần lớn anh em (kể cả mình) chọn luôn model mạnh nhất làm default. Claude Opus, GPT-5 Codex — model càng xịn càng yên tâm. Nhưng agent không chỉ chạy hội thoại. Nó còn:

  • Heartbeat mỗi 30 phút: Kiểm tra inbox, calendar, trạng thái. Về bản chất là một câu lệnh ping — không cần suy luận phức tạp.
  • Đọc và tóm tắt file: Mở file log, đọc config, parse JSON. Flash làm y hệt opus.
  • Các câu hỏi đơn giản: "Mấy giờ rồi?", "Thời tiết hôm nay thế nào?".

Tất cả những tác vụ này không cần model xịn. Nhưng vì default model là opus, agent cứ thế dùng opus cho mọi thứ.

Cách fix: chỉ mất 2 phút config

Người dùng này đã thử một chiến lược đơn giản và hiệu quả:

Bước 1: Đổi primary model mặc định sang model rẻ

Trong openclaw.json, set:

"agents": {
  "defaults": {
    "model": {
      "primary": "deepseek/deepseek-v4-flash"
    }
  }
}
Enter fullscreen mode Exit fullscreen mode

Model này đủ khỏe cho 90% tác vụ thường ngày của agent.

Bước 2: Chỉ nâng model khi thực sự cần

Khi gặp tác vụ phức tạp (debug logic, viết code dài, phân tích đa bước), gõ ngay trong session:

/model anthropic/claude-opus-4-7
Enter fullscreen mode Exit fullscreen mode

Xong việc thì quay về:

/model deepseek/deepseek-v4-flash
Enter fullscreen mode Exit fullscreen mode

Không cần restart, không mất session. Chuyển model mất đúng 1 dòng lệnh.

Kết quả thực tế

  • Trước: ~$170/tháng
  • Sau: ~$35/tháng
  • Tiết kiệm: gần 80%, không giảm chất lượng ở bất kỳ đâu

Điều thú vị là tác giả bài gốc cũng thừa nhận: "Phần bực nhất là mất 2 tuần log thủ công chỉ để phát hiện ra điều này." Anh ta có chạy thêm một agent Gmail trên BetterClaw free tier với BYOK. Bên đó có tính năng hiển thị chi tiêu theo từng tác vụ, và phát hiện ra vấn đề heartbeat waste ngay lập tức — thay vì mất 2 tuần tracking tay.

Checklist cho anh em

Trước khi đóng tab này, làm nhanh mấy bước sau:

  • Kiểm tra agents.defaults.model.primary trong openclaw.json — model nào đang là default?
  • Nếu đang là opus hoặc model đắt tương đương, cân nhắc chuyển về flash cho tác vụ thường ngày
  • Tập thói quen /model lên model mạnh khi vào việc khó, /model về model rẻ khi xong
  • Nếu xài BetterClaw hoặc tool có cost breakdown, bật lên xem tiền đang đi đâu
  • Đừng đợi "surprise bill" như tác giả bài gốc mới bắt đầu theo dõi

Lời kết

Đây không phải chuyện tiết kiệm vài chục đô một tháng. Đây là bài học vận hành: agent càng chạy nhiều, chi phí ẩn từ những tác vụ nhỏ càng lớn. 67% ngân sách bay vào heartbeat và đọc file không phải là lỗi kỹ thuật — đó là lỗi thiết kế config.

Sửa nó mất 2 phút. Nhưng không sửa thì mỗi tháng ví anh em vẫn đều đặn nhẹ đi 100-130$.

Top comments (0)