I'm here

Posted on Mar 30 • Originally published at reddit.com

Automation càng nhàm chán đôi khi càng đáng tiền

#openclaw #automation #vanchanh #stability

Có một kiểu bẫy mà rất nhiều anh em làm automation hay dính: hệ thống đang chạy ổn, nhưng vì nhìn người khác build quá nhiều thứ hay quá nên mình bắt đầu thấy setup của mình "chưa đủ đã". Rồi từ đó phát sinh nhu cầu nối thêm Jira, thêm knowledge base, thêm custom skill, thêm MCP, thêm dashboard phụ. Kết quả thường không phải là mạnh hơn ngay, mà là bề mặt lỗi tăng lên rất nhanh.

Bài đăng gốc trên Reddit mình đọc sáng nay khá thú vị ở đúng chỗ đó. Tác giả chỉ có một workflow rất đơn giản: OpenClaw kiểm tra Stripe rồi gửi Slack report mỗi sáng. Mất khoảng 20 phút để dựng trên Run Lobster, và thứ khiến họ không muốn đụng thêm vào nữa là nó đã chạy 3 tháng liên tục không hỏng.

Theo mình, đây không phải tư duy lười. Đây là tư duy vận hành.

Khi nào một automation “đủ tốt”

Trong giai đoạn đầu, anh em thường đánh giá hệ thống theo số lượng tính năng. Nhưng nếu nhìn dưới góc vận hành, có 3 tiêu chí quan trọng hơn:

nó có giải quyết đúng một việc cần giải quyết không
nó có chạy ổn định đủ lâu để mình tin nó không
chi phí bảo trì của nó có thấp hơn giá trị nó mang lại không

Nếu câu trả lời là có, thì hệ thống đó đã thắng ở mức thực tế rồi. Một con bot báo cáo doanh thu buổi sáng nghe rất chán, nhưng nếu nó giúp chủ doanh nghiệp hoặc team vận hành nhìn thấy dòng tiền đều đặn mỗi ngày mà không phải kiểm tra tay, thì đó là một automation có giá trị thật.

Càng nhiều tích hợp, xác suất gãy càng cao

Cái mà nhiều người gọi là “nâng cấp” thực ra thường chỉ là thêm dependency.

Mỗi khi anh em nối thêm một thành phần mới, mình đang âm thầm thêm vào hệ thống các lớp rủi ro:

thêm chỗ có thể đổi schema hoặc API
thêm credential cần quản lý
thêm rate limit
thêm chỗ timeout
thêm logic fallback và retry
thêm thứ phải debug khi workflow chạy sai

Nhìn trên demo thì mỗi mảnh đều hợp lý. Nhưng khi ghép lại, độ phức tạp không tăng tuyến tính. Nó tăng theo kiểu rất khó đoán trước. Một hệ thống 1 bước hỏng thì debug rất nhanh. Một hệ thống 7 bước có agent trung gian, skill riêng, webhook ngoài và lịch chạy định kỳ thì chỉ cần lệch một mắt xích là cả luồng bắt đầu tạo ra lỗi mơ hồ.

Đó là lý do nhiều setup nhìn rất xịn nhưng tuổi thọ vận hành lại thấp.

Tối giản không có nghĩa là thiếu tham vọng

Theo mình, cách làm khôn là tách rõ hai chế độ:

Chế độ vận hành ổn định

chỉ giữ những gì đang tạo giá trị lặp lại
ưu tiên độ tin cậy hơn độ ấn tượng
thay đổi rất ít và có kiểm soát

Chế độ thử nghiệm

test skill mới
thử tích hợp mới
benchmark model mới
nghịch các flow nhiều bước

Sai lầm phổ biến là trộn hai chế độ này vào cùng một pipeline. Khi đó mọi thử nghiệm đều đi thẳng vào hệ thống đang chạy tốt, và cái giá phải trả là sự ổn định.

Nếu anh em thấy một workflow đơn giản đang sống khỏe suốt 3 tháng, thì phản xạ đầu tiên không nên là “làm sao cho nó ngầu hơn”, mà nên là “mình bảo vệ độ ổn định này thế nào”.

Một khung ra quyết định trước khi thêm tính năng

Mình thấy có thể dùng 5 câu hỏi rất thực dụng trước khi nối thêm bất kỳ thứ gì vào OpenClaw:

Nếu không thêm tính năng này, hệ thống hiện tại có đang gây thiệt hại thật không?
Tính năng mới tạo ra giá trị đo được gì, hay chỉ làm mình thấy hệ thống có vẻ xịn hơn?
Nếu tính năng mới hỏng lúc 7 giờ sáng mai, ai là người phải chịu hậu quả?
Mình đã có cách quan sát, log và rollback cho phần mới chưa?
Phần này nên chạy trong môi trường thử nghiệm riêng hay xứng đáng đi vào pipeline chính?

Chỉ cần trả lời nghiêm túc 5 câu này, anh em sẽ cắt được rất nhiều quyết định thêm đồ cho vui.

Bài học cho người build OpenClaw

OpenClaw khá mạnh ở chỗ nó khiến mình rất dễ muốn mở rộng tiếp. Thêm skill được, thêm cron được, thêm MCP được, thêm session khác được. Chính vì vậy, người vận hành càng phải tỉnh táo hơn.

Khả năng mở rộng là một lợi thế. Nhưng mở rộng vô tội vạ lại là một kiểu nợ kỹ thuật tự nguyện.

Nếu mục tiêu của anh em là ra kết quả đều, bền và ít phải babysit, thì một setup "nhàm chán" đôi khi lại là setup thông minh nhất. Hệ thống tốt không phải hệ thống có nhiều mảnh nhất. Hệ thống tốt là hệ thống mình dám để nó chạy tiếp vào sáng mai mà không lo.

Kết luận

Mình khá đồng ý với tinh thần của bài Reddit này: có những lúc điều đúng đắn nhất không phải là thêm nữa, mà là dừng đúng lúc.

Với automation nói chung và OpenClaw nói riêng, sự hấp dẫn của việc build thêm gần như lúc nào cũng lớn hơn nhu cầu thực tế. Anh em nào đang có một flow nhỏ, ổn định, tạo giá trị hàng ngày thì đừng vội thấy nó "quá đơn giản". Có khi đó lại là dấu hiệu cho thấy mình đã thiết kế đúng.

AI & Automation (vnROM)