I'm here

Posted on Mar 20 • Originally published at reddit.com

Khi Brave API trục trặc, anh em nên tổ chức web_search trong OpenClaw thế nào cho đỡ vỡ trận?

#openclaw #search #automation #ops

Mấy hôm nay mình thấy một câu hỏi khá thực tế trong cộng đồng OpenClaw: nếu Brave API bị vướng chuyện thanh toán hoặc không muốn phụ thuộc vào một nhà cung cấp duy nhất, anh em nên tổ chức web_search thế nào để vẫn dùng ổn trong vận hành hàng ngày?

Điểm hay của thread này là nó không bàn lý thuyết. Vấn đề rất đời thường: cấu hình xong nhưng agent vẫn tìm kiếm kém, skill local không được gọi đúng lúc, hoặc chi phí tăng mà không biết chặn ở đâu. Với anh em đang chạy OpenClaw cho việc thật, đây là chỗ dễ âm thầm làm chất lượng agent tụt xuống.

Bài toán thật sự không phải chỉ là "chọn search provider nào"

Khi đọc kỹ câu hỏi và phần trả lời, mình thấy có ba lớp vấn đề khác nhau:

lớp 1 là độ sẵn sàng: Brave API có thể bị chặn ở khâu billing hoặc giới hạn tài khoản
lớp 2 là độ tương thích: một số công cụ tìm kiếm tự host như SearXNG có thể hoạt động tốt về mặt kỹ thuật nhưng không đi theo đường gọi web_search native, dẫn tới agent hành xử thiếu ổn định
lớp 3 là chi phí và kiểm soát: nếu không tách vai trò rõ giữa các agent, anh em rất dễ để con nào cũng dùng cùng một search backend, vừa tốn vừa khó debug

Nói ngắn gọn, chuyện search trong OpenClaw nên được nhìn như một phần của kiến trúc agent, không phải một checkbox cấu hình.

Điều mình rút ra từ thảo luận này

Một số ý trong thread khá đáng chú ý:

có người chuyển hẳn sang Perplexity Search khi Brave không còn phù hợp
có người chạy nhiều agent và gán search khác nhau cho từng agent: agent nghiên cứu sâu dùng Perplexity, agent chính dùng Brave
có ý kiến nhắc tới Gemini, Grok, Kimi như các lựa chọn search provider khác mà OpenClaw hỗ trợ
có người dùng thêm Tavily qua skill, chủ yếu vì quota miễn phí tương đối dễ chịu
cũng có người chọn DuckDuckGo vì miễn phí, nhưng lại gặp vấn đề agent vẫn ưu tiên search native mặc định rồi báo thiếu key

Mấu chốt ở đây là: cộng đồng không đi tìm một đáp án duy nhất. Họ đang ngầm xác nhận rằng search nên có phương án dự phòng và nên được gắn với từng vai trò sử dụng.

Cách mình nghĩ anh em nên triển khai thực chiến

Nếu đang vận hành OpenClaw cho công việc thật, mình nghiêng về mô hình 3 tầng sau.

1. Có một provider native làm đường chính

Nếu hệ thống của anh em phụ thuộc vào chất lượng truy xuất web ở mức cao, nên có ít nhất một search provider native mà runtime hiểu trực tiếp. Lý do rất đơn giản:

hành vi của agent dễ đoán hơn
prompt và tool routing ít bị lệch hơn
ít gặp tình trạng có skill cài rồi nhưng agent vẫn không chịu dùng đúng tool
dễ theo dõi lỗi vì đường đi ngắn hơn

Brave có thể là lựa chọn quen thuộc, nhưng nếu billing đang gây cản trở thì Perplexity hoặc một provider native khác thường thực tế hơn việc cố vá một skill không được runtime ưu tiên.

2. Tách search theo loại agent, đừng dùng một cấu hình cho tất cả

Đây là ý mình thấy đáng tiền nhất trong thread.

Anh em đừng để mọi agent đều dùng cùng một cấu hình search. Thay vào đó, nên chia ít nhất như sau:

agent chính hoặc agent chat nhanh: dùng provider rẻ hơn, nhanh hơn, đủ cho nhu cầu tra cứu tức thời
agent nghiên cứu sâu: dùng provider mạnh hơn, chấp nhận chi phí cao hơn nhưng giới hạn tần suất
agent workflow nội bộ: nếu phần lớn làm việc với dữ liệu sẵn có thì tắt hoặc giảm quyền search, chỉ mở khi thật sự cần

Làm vậy có ba lợi ích:

kiểm soát chi phí tốt hơn
đỡ nhiễu khi debug vì biết agent nào dùng search nào
tránh việc một agent không cần web vẫn âm thầm gọi web_search liên tục

3. Quota phải đặt ở cả phía provider lẫn phía workflow

Trong thread có một ý ngắn nhưng rất đúng: quota không nên chỉ trông chờ vào agent tự tiết kiệm.

Kinh nghiệm của mình là nên chặn ở hai đầu:

đầu provider: đặt hạn mức usage, budget, hoặc rate limit nếu dịch vụ hỗ trợ
đầu workflow: thiết kế prompt và routing để agent chỉ search khi thiếu dữ kiện thật sự

Nếu chỉ chặn ở prompt, agent vẫn có thể lỡ tay gọi search quá nhiều. Nếu chỉ chặn ở provider, khi chạm trần thì chất lượng hệ thống sẽ tụt đột ngột. Phải làm cả hai thì mới bền.

Còn SearXNG, DuckDuckGo hay Tavily thì sao?

Mình không nghĩ các lựa chọn này là vô dụng. Ngược lại, chúng hợp với một số bối cảnh rất rõ:

SearXNG hợp khi anh em ưu tiên self-host, muốn kiểm soát hạ tầng và chấp nhận tự xử thêm lớp tích hợp
DuckDuckGo hợp khi cần một phương án miễn phí để dự phòng hoặc làm bước thử nghiệm ban đầu
Tavily hợp khi anh em muốn một dịch vụ thiên về AI search hơn, lại có quota miễn phí đủ để kiểm chứng use case

Nhưng điểm cần nói thẳng là: nếu mục tiêu là độ ổn định cho production, anh em phải kiểm tra kỹ việc OpenClaw sẽ gọi chúng theo đường nào. Một công cụ tìm kiếm tốt chưa chắc đã là một tool integration tốt trong runtime thực tế.

Một chiến lược an toàn cho anh em đang bị kẹt Brave API

Nếu hôm nay anh em đang đúng tình huống trong thread, mình sẽ không khuyên lao vào chỉnh lung tung. Mình sẽ đi theo thứ tự này:

chọn ngay một provider native thay thế để hệ thống có lại đường search ổn định
giữ SearXNG hoặc DuckDuckGo ở vai trò phụ, dùng để thử nghiệm hoặc làm fallback
tách cấu hình search theo từng agent thay vì cấu hình một chỗ cho toàn bộ workspace
bật quota hoặc ngân sách ở phía provider trước khi mở lại cho agent dùng rộng rãi
theo dõi log xem agent thực sự đang gọi tool nào, đừng đoán bằng cảm giác

Cách đi này hơi chậm hơn một chút, nhưng đổi lại anh em sẽ biết chính xác mình đang sửa vấn đề nào: thiếu provider, lệch routing, hay mất kiểm soát chi phí.

Kết

Thread Reddit này nhắc một chuyện rất cơ bản nhưng nhiều đội hay bỏ qua: chất lượng search không chỉ nằm ở engine, mà nằm ở cách mình gắn nó vào từng agent và từng workflow.

Nếu anh em xem web_search là hạ tầng lõi thay vì tiện ích phụ, quyết định sẽ rõ hơn rất nhiều. Chọn một đường native đủ ổn để chạy chính, thêm một lớp dự phòng hợp lý, và khóa chi phí từ đầu. Làm được ba thứ đó thì kể cả phải đổi nhà cung cấp, hệ thống vẫn không bị chao đảo.

AI & Automation (vnROM)