Chako Lab

Posted on Apr 26 • Originally published at reddit.com

Hermes qua Telegram: tiện thật, nhưng phải giới hạn quyền ngay từ đầu

#ai #security #automation #hermes

Cuộc thảo luận đang nóng ở r/hermesagent đặt ra một điểm rất đáng chú ý: nhiều anh em nối Hermes vào Telegram rồi cho quyền truy cập email, lịch, file, automation nội bộ. Về mặt trải nghiệm thì rất tiện, nhưng về mặt vận hành rủi ro thì không nên xem Telegram như một kênh riêng tư tuyệt đối.

Telegram bot là một lựa chọn thực dụng vì có Bot API chính thức, ổn định và dễ triển khai. Nhưng tin nhắn Telegram thông thường không được mã hóa đầu cuối mặc định, bot phải đăng ký qua hạ tầng của Telegram, và nội dung hội thoại có thể đi qua máy chủ bên thứ ba. Nếu con bot đó có quyền đọc mail, xem lịch, gọi tool nội bộ hoặc kích hoạt workflow, thì kênh chat đã trở thành một lớp điều khiển hệ thống.

Vấn đề không phải là “Telegram xấu”

Điểm cần nói cho công bằng: Telegram không vô dụng cho agent. Ngược lại, nó là một trong những kênh dễ vận hành nhất:

Bot API chính thức, ít rủi ro bị ban hơn các tích hợp reverse-engineered.
Có username riêng, không lộ số điện thoại như một số kênh khác.
Hỗ trợ file, nút bấm, voice, formatting khá tốt.
Dễ triển khai cho cá nhân hoặc team nhỏ.

Nhưng “dễ chạy” không đồng nghĩa với “an toàn để cấp toàn quyền”. Sai lầm thường nằm ở cấu hình quyền của agent, không chỉ ở Telegram.

Khi nào rủi ro bắt đầu lớn

Rủi ro tăng mạnh khi anh em để Hermes làm nhiều hơn trả lời chat:

Đọc email cá nhân hoặc email công ty.
Xem và sửa lịch.
Gửi tin nhắn ra ngoài thay người dùng.
Truy cập CRM, đơn hàng, tài liệu nội bộ.
Chạy lệnh trên máy hoặc server.
Kích hoạt automation có tác động tiền, dữ liệu, khách hàng.

Lúc này, một đoạn chat không còn là “prompt” nữa. Nó là yêu cầu vận hành. Nếu kênh bị lộ, token bot bị leak, group bị thêm sai người, hoặc prompt injection lọt qua nội dung được đọc từ email/web, hậu quả có thể đi thẳng vào hệ thống thật.

Cách triển khai thực tế hơn

Mình sẽ không khuyên anh em bỏ Telegram ngay. Cách hợp lý hơn là phân tầng quyền.

1. Tách kênh theo mức nhạy cảm

Dùng Telegram cho các tác vụ rủi ro thấp:

Hỏi đáp trạng thái.
Nhận thông báo.
Tạo draft.
Tra cứu dữ liệu đã được lọc.
Kích hoạt workflow không phá hủy.

Với tác vụ nhạy cảm như gửi email, xóa dữ liệu, chuyển tiền, thay đổi quyền truy cập, nên yêu cầu xác nhận ở một lớp khác hoặc ít nhất có bước duyệt rõ ràng.

2. Cấp quyền tối thiểu cho agent

Đừng cấp một API key “toàn năng” rồi tin agent sẽ luôn dùng đúng. Nên tách token theo phạm vi:

Token chỉ đọc lịch thay vì đọc/sửa.
Token chỉ xem inbox metadata thay vì toàn bộ nội dung mail.
Token chỉ tạo draft email, không gửi trực tiếp.
Tool production tách khỏi tool thử nghiệm.

Nếu một bot chat bị khai thác, thiệt hại sẽ bị chặn ở biên quyền.

3. Thêm xác nhận cho hành động có tác động ngoài đời

Một nguyên tắc vận hành tốt: đọc thì có thể tự động, ghi thì phải cân nhắc, gửi ra ngoài thì cần xác nhận.

Các hành động nên có confirmation:

Gửi email hoặc tin nhắn cho người khác.
Sửa/xóa dữ liệu.
Thay đổi lịch họp có người ngoài.
Chạy lệnh hệ thống.
Gọi webhook ảnh hưởng khách hàng, đơn hàng, tài chính.

Confirmation không cần làm hệ thống nặng nề. Chỉ cần agent nói rõ “sắp làm gì, với dữ liệu nào, tác động gì” trước khi chạy.

4. Không đưa bí mật vào chat

Đừng paste API key, cookie, private link, thông tin khách hàng nhạy cảm vào Telegram chỉ vì bot đang ở đó. Nếu agent cần secret, nên để secret trong vault hoặc biến môi trường phía server, còn chat chỉ là giao diện yêu cầu.

5. Log và audit theo hành động, không chỉ theo hội thoại

Khi agent có quyền thao tác hệ thống, cần log lại:

Ai yêu cầu.
Kênh nào.
Tool nào được gọi.
Dữ liệu đầu vào chính.
Kết quả thành công/thất bại.
Hành động có cần duyệt không.

Log này quan trọng hơn transcript chat, vì nó trả lời câu hỏi vận hành: “Agent đã thật sự làm gì?”

Checklist nhanh trước khi nối Hermes với Telegram

Trước khi cấp quyền sâu, anh em nên tự hỏi:

Nếu toàn bộ lịch sử chat với bot bị đọc, có dữ liệu nào quá nhạy cảm không?
Nếu token bot bị lộ, người khác có thể kích hoạt hành động gì?
Agent có quyền gửi email/tin nhắn ra ngoài mà không cần duyệt không?
API key đang dùng có quyền quá rộng không?
Có log tool-call đủ để audit sau sự cố không?
Có cách thu hồi token và tắt bot nhanh không?
Group/chat nào được phép gọi bot, có whitelist chưa?

Nếu trả lời chưa chắc ở nhiều câu, nên giảm quyền trước khi mở rộng automation.

Kết luận

Tin tức đáng chú ý ở đây không phải là “Telegram không dùng được”, mà là cộng đồng Hermes đang bắt đầu nhìn agent như một hệ thống vận hành thật, chứ không chỉ là chatbot. Khi agent được nối vào email, calendar và các tool nội bộ, kênh giao tiếp trở thành một phần của mô hình bảo mật.

Telegram có thể là giao diện tốt cho Hermes, nhưng đừng biến nó thành chìa khóa vạn năng. Hãy dùng nó như remote control có giới hạn: tiện, nhanh, nhưng quyền phải nhỏ, hành động nhạy cảm phải có duyệt, và mọi thao tác quan trọng phải audit được.

AI & Automation (vnROM)