Nếu bạn đang chạy OpenClaw agent 24/7, có một câu hỏi mình nghĩ anh em nào cũng nên tự trả lời: bao nhiêu phần trăm tiền token của mình đang thực sự tạo ra giá trị?
Một thành viên trên r/openclaw đã dành 2 tuần log toàn bộ tương tác của agent Telegram + Discord mà anh ta đang chạy. Kết quả gây sốc hơn mình tưởng.
Phân tích 14 ngày: tiền đi đâu?
Sau 672 lần heartbeat (mỗi 30 phút) và hàng trăm tác vụ khác, bức tranh chi phí hiện ra thế này:
- Heartbeat (ping định kỳ): 38% token — đang chạy trên Opus
- Đọc và tóm tắt file: 29% token — cũng trên Opus
- Hội thoại thực sự (cần chất lượng): 22% token
- Tác vụ phức tạp (Opus tốt hơn hẳn): 11% token
Con số đập vào mắt: 67% lượng token được dùng cho những việc mà model rẻ nhất (flash, $0.14/M) cho chất lượng y hệt model đắt nhất (opus, ~$6.75/M).
Nói cách khác: cứ 3 đồng anh em bỏ ra thì 2 đồng đang bị đốt.
Vì sao chuyện này xảy ra?
Khi thiết lập OpenClaw, phần lớn anh em (kể cả mình) chọn luôn model mạnh nhất làm default. Claude Opus, GPT-5 Codex — model càng xịn càng yên tâm. Nhưng agent không chỉ chạy hội thoại. Nó còn:
- Heartbeat mỗi 30 phút: Kiểm tra inbox, calendar, trạng thái. Về bản chất là một câu lệnh ping — không cần suy luận phức tạp.
- Đọc và tóm tắt file: Mở file log, đọc config, parse JSON. Flash làm y hệt opus.
- Các câu hỏi đơn giản: "Mấy giờ rồi?", "Thời tiết hôm nay thế nào?".
Tất cả những tác vụ này không cần model xịn. Nhưng vì default model là opus, agent cứ thế dùng opus cho mọi thứ.
Cách fix: chỉ mất 2 phút config
Người dùng này đã thử một chiến lược đơn giản và hiệu quả:
Bước 1: Đổi primary model mặc định sang model rẻ
Trong openclaw.json, set:
"agents": {
"defaults": {
"model": {
"primary": "deepseek/deepseek-v4-flash"
}
}
}
Model này đủ khỏe cho 90% tác vụ thường ngày của agent.
Bước 2: Chỉ nâng model khi thực sự cần
Khi gặp tác vụ phức tạp (debug logic, viết code dài, phân tích đa bước), gõ ngay trong session:
/model anthropic/claude-opus-4-7
Xong việc thì quay về:
/model deepseek/deepseek-v4-flash
Không cần restart, không mất session. Chuyển model mất đúng 1 dòng lệnh.
Kết quả thực tế
- Trước: ~$170/tháng
- Sau: ~$35/tháng
- Tiết kiệm: gần 80%, không giảm chất lượng ở bất kỳ đâu
Điều thú vị là tác giả bài gốc cũng thừa nhận: "Phần bực nhất là mất 2 tuần log thủ công chỉ để phát hiện ra điều này." Anh ta có chạy thêm một agent Gmail trên BetterClaw free tier với BYOK. Bên đó có tính năng hiển thị chi tiêu theo từng tác vụ, và phát hiện ra vấn đề heartbeat waste ngay lập tức — thay vì mất 2 tuần tracking tay.
Checklist cho anh em
Trước khi đóng tab này, làm nhanh mấy bước sau:
- Kiểm tra
agents.defaults.model.primarytrongopenclaw.json— model nào đang là default? - Nếu đang là opus hoặc model đắt tương đương, cân nhắc chuyển về flash cho tác vụ thường ngày
- Tập thói quen
/modellên model mạnh khi vào việc khó,/modelvề model rẻ khi xong - Nếu xài BetterClaw hoặc tool có cost breakdown, bật lên xem tiền đang đi đâu
- Đừng đợi "surprise bill" như tác giả bài gốc mới bắt đầu theo dõi
Lời kết
Đây không phải chuyện tiết kiệm vài chục đô một tháng. Đây là bài học vận hành: agent càng chạy nhiều, chi phí ẩn từ những tác vụ nhỏ càng lớn. 67% ngân sách bay vào heartbeat và đọc file không phải là lỗi kỹ thuật — đó là lỗi thiết kế config.
Sửa nó mất 2 phút. Nhưng không sửa thì mỗi tháng ví anh em vẫn đều đặn nhẹ đi 100-130$.
Top comments (0)