Muốn Hermes tự chạy việc kinh doanh thì đừng bắt đầu bằng câu “làm sao cho nó autonomous hoàn toàn?”. Câu đúng hơn là: “việc nào trong business có thể giao cho agent chạy theo checklist, có log, có ngưỡng dừng và có người duyệt?”.
Một câu hỏi đang nổi trong r/hermesagent là: đã cài Hermes xong, có project thật rồi, nhưng không biết bước tiếp theo để biến nó thành một trợ lý tự vận hành kiểu Felix của Nat Eliason. Đây là câu hỏi rất thực tế, vì nhiều hướng dẫn ngoài kia thường dừng ở mức “set cron job” hoặc “cho nó lướt web”, nghe đúng nhưng không đủ để chạy business.
Theo mình, autonomy không phải là để agent tự quyết mọi thứ. Autonomy tốt là một vòng vận hành nhỏ, lặp lại được, có quyền hạn rõ, có kiểm chứng, và tạo ra đầu ra đủ tốt để con người ra quyết định nhanh hơn.
Bước đầu tiên: đổi từ “agent tự chủ” sang “workflow tự chủ”
Hermes không nên được giao mục tiêu mơ hồ kiểu:
Hãy chạy business này cho tôi.
Prompt đó quá rộng. Agent sẽ thiếu tiêu chí thành công, thiếu quyền hạn, thiếu dữ liệu, và rất dễ tiêu token vào những việc không tạo giá trị.
Thay vào đó, hãy tách business thành các workflow nhỏ:
- đọc email khách hàng mới và phân loại mức ưu tiên
- theo dõi lead mới, enrich thông tin, đề xuất bước tiếp theo
- đọc feedback sản phẩm và gom thành issue/todo
- kiểm tra dashboard mỗi sáng, báo bất thường
- biến 10 nguồn tin ngành thành bản tin nội bộ
- tạo nháp bài marketing từ một chủ đề đã duyệt
- đọc log/test fail và đề xuất nguyên nhân có khả năng nhất
Một workflow tốt phải có đầu vào rõ, đầu ra rõ, và ranh giới quyền hạn rõ. Agent không “tự chủ” trong chân không; nó tự chủ bên trong một quy trình đã được thiết kế.
Công thức 5 phần cho một workflow agent
Mình thường dùng khung này trước khi giao việc cho agent:
1. Trigger
Cái gì khởi động workflow?
Ví dụ:
- 8 giờ sáng mỗi ngày
- có email mới gắn nhãn “lead”
- có issue GitHub mới
- có file CSV mới trong thư mục
- người dùng gửi lệnh “review hôm nay”
Trigger có thể là cron, webhook, inbox rule, hoặc một lệnh thủ công. Nhưng phải cụ thể.
2. Context
Agent cần biết những gì để làm đúng?
Ví dụ:
- mô tả sản phẩm
- chân dung khách hàng
- chính sách giá
- tiêu chí lead tốt/xấu
- danh sách việc được phép làm
- ví dụ output tốt và output xấu
Nếu thiếu context, agent sẽ bù bằng suy đoán. Với business, suy đoán là thứ dễ tạo ra lỗi âm thầm nhất.
3. Tools
Agent được dùng công cụ nào?
Ví dụ:
- đọc Gmail/Slack/Discord
- tra CRM
- đọc database read-only
- tìm file trong repo
- tạo draft trong Notion/Obsidian
- mở pull request
- gửi tin nhắn nội bộ
Lúc mới bắt đầu, nên ưu tiên quyền đọc và tạo nháp. Đừng cho agent quyền gửi email, chi tiền, xoá dữ liệu, hoặc thay đổi production khi chưa có guardrail.
4. Output
Đầu ra phải là gì?
Ví dụ chưa đủ tốt:
Hãy phân tích leads.
Ví dụ tốt hơn:
Tạo bảng gồm: tên lead, công ty, nhu cầu, mức ưu tiên A/B/C, lý do xếp hạng, bước tiếp theo đề xuất. Không gửi email. Nếu thiếu dữ liệu thì ghi “cần bổ sung”.
Đầu ra càng rõ, agent càng dễ tự kiểm tra.
5. Review gate
Khi nào agent được tự làm tiếp, khi nào phải dừng?
Ví dụ:
- Nếu confidence thấp hơn 70%, hỏi người dùng.
- Nếu cần gửi ra ngoài, chỉ tạo draft.
- Nếu thay đổi hơn 3 file code, dừng xin review.
- Nếu gặp lỗi auth/API quá 2 lần, dừng và báo log.
- Nếu dữ liệu liên quan tài chính/pháp lý, không tự quyết.
Autonomy bền không phải là không cần người. Autonomy bền là biết lúc nào phải gọi người vào.
Một roadmap 4 tuần để làm Hermes hữu dụng trong business
Nếu đã có Hermes chạy được, mình sẽ không nhảy ngay vào “AI employee toàn năng”. Đi theo 4 tuần thực dụng hơn.
Tuần 1: Observation mode
Cho Hermes chỉ đọc và báo cáo.
Ví dụ:
- mỗi sáng tóm tắt email, calendar, issue, lead mới
- gom các việc cần phản hồi vào một danh sách
- đánh dấu chỗ nào cần người quyết định
Mục tiêu tuần này không phải tự động hóa, mà là kiểm tra agent có hiểu business không.
Output nên ngắn:
- việc gấp
- việc quan trọng nhưng không gấp
- rủi ro cần chú ý
- đề xuất hôm nay
Tuần 2: Draft mode
Cho Hermes tạo nháp, nhưng không gửi.
Ví dụ:
- draft email trả lời khách
- draft bài forum/newsletter
- draft task trong project board
- draft checklist triển khai
- draft changelog hoặc status update
Lúc này anh em bắt đầu đo chất lượng: bao nhiêu phần trăm draft dùng được, lỗi lặp lại là gì, thiếu context nào.
Tuần 3: Assisted action mode
Cho Hermes thực hiện hành động rủi ro thấp.
Ví dụ:
- tạo ticket nội bộ
- cập nhật ghi chú
- lưu báo cáo vào thư mục
- mở pull request nhỏ
- gắn label cho lead hoặc issue
Những việc ra ngoài công ty hoặc ảnh hưởng khách hàng vẫn nên cần duyệt.
Tuần 4: Limited autonomy
Chọn 1-2 workflow đã ổn nhất để chạy tự động định kỳ.
Ví dụ:
- “Mỗi sáng tạo báo cáo ưu tiên khách hàng, nếu có lead A thì ping mình.”
- “Mỗi chiều đọc feedback mới, gom thành 3 nhóm: bug, feature request, praise.”
- “Mỗi thứ Hai tạo bản nháp nội dung từ 5 thread Reddit hot trong ngành.”
Đừng cố tự động hóa 10 workflow cùng lúc. Một workflow chạy chắc có giá trị hơn một hệ thống hoành tráng nhưng ngày nào cũng cần cứu.
Ví dụ workflow cụ thể: agent quản lý lead inbound
Giả sử business có form nhận lead mới.
Thiết kế workflow có thể như sau:
Trigger: Khi có lead mới trong Google Sheet hoặc CRM.
Context: ICP, pricing, ngành ưu tiên, dấu hiệu lead rác, template email.
Tools: đọc CRM, tìm website công ty, tạo draft email, cập nhật field “AI notes”.
Output:
- lead score A/B/C
- lý do score
- pain point suy đoán từ website
- câu hỏi cần hỏi thêm
- draft email phản hồi
Review gate:
- Lead A: ping người phụ trách trong Slack/Discord.
- Lead B/C: chỉ cập nhật CRM, không gửi email.
- Nếu không tìm được website hoặc thông tin mâu thuẫn: đánh dấu “needs human review”.
Đây mới là autonomy có ích: giảm công lọc và chuẩn bị, nhưng không để agent tự nói chuyện với khách khi chưa chắc.
Những lỗi khiến agent “tự chủ” bị hỏng
Có vài lỗi rất phổ biến:
- Giao mục tiêu quá rộng: “hãy phát triển business”.
- Không có tài liệu context sống: agent mỗi lần lại hiểu khác nhau.
- Cho quá nhiều tool ngay từ đầu.
- Không phân biệt việc được làm, việc chỉ được nháp, việc phải hỏi.
- Không có log sau mỗi lần chạy.
- Không có tiêu chí dừng khi API/tool lỗi.
- Dùng agent cho việc lặp lại 100% mà script thường làm rẻ và ổn hơn.
Điểm cuối đáng nhấn mạnh: nếu việc không cần phán đoán, dùng script. Nếu việc cần phán đoán nhưng có cấu trúc, dùng agent. Nếu việc có rủi ro cao, dùng agent để chuẩn bị và con người duyệt.
Bộ tài liệu tối thiểu nên có
Trước khi đòi Hermes “chạy business”, nên tạo vài file nền:
-
business.md: business là gì, bán cho ai, mục tiêu hiện tại -
customers.md: ICP, nhóm khách hàng tốt/xấu, câu hỏi thường gặp -
policies.md: agent được làm gì, không được làm gì -
workflows.md: danh sách workflow, trigger, output, review gate -
examples.md: 3-5 ví dụ output tốt -
state.md: trạng thái hiện tại, ưu tiên tuần này, việc đang chờ
Các file này không cần dài. Quan trọng là cập nhật đều và dùng làm nguồn sự thật. Agent có trí nhớ tốt đến đâu cũng cần một “operating manual” sạch.
Kết luận thực tế
Bước tiếp theo sau khi cài Hermes không phải là tìm một nút “autonomous mode”. Bước tiếp theo là chọn một workflow nhỏ nhưng có giá trị, viết rõ trigger-context-tools-output-review gate, cho agent chạy ở observation mode, rồi tăng quyền dần khi nó chứng minh được chất lượng.
Nếu muốn một công thức ngắn: bắt đầu với đọc và báo cáo, chuyển sang tạo nháp, rồi mới cho hành động rủi ro thấp. Đừng để agent tự chạy business trước khi business có checklist đủ rõ để một người mới cũng có thể làm theo.
Autonomy tốt không đến từ việc bỏ tay khỏi vô lăng. Nó đến từ việc thiết kế đường ray đủ chắc để agent chạy nhanh mà không lao ra khỏi đường.
Top comments (0)