Mấy bài chia sẻ kiểu này đáng chú ý vì nó cho thấy cộng đồng vibe coding đang bắt đầu đi qua giai đoạn “khoe app làm trong 1 tối” để bước sang giai đoạn xây công cụ cho chính người làm công cụ.
Một tác giả trên r/vibecoding vừa chia sẻ dự án mã nguồn mở tên MEX sau khi thức dậy và thấy một developer có khoảng 28 nghìn follower nhắc tới sản phẩm của mình. Kéo theo đó là contributor lạ bắt đầu mở pull request. Nhìn bề ngoài đây là một câu chuyện tăng trưởng cộng đồng khá vui, nhưng phần đáng đọc hơn nằm ở chỗ tác giả đang giải đúng một nỗi đau mà anh em dùng agent code gặp mỗi ngày: context càng dài thì càng loãng, tài liệu càng nhiều thì càng nhanh bị cũ.
MEX đang cố giải bài toán gì
Theo phần mô tả của tác giả, MEX không nhét mọi thứ vào một file context khổng lồ. Thay vào đó, nó tạo một scaffold markdown trong thư mục .mex/ rồi cho agent khởi động từ một bootstrap rất ngắn. Từ bootstrap đó, agent lần theo một bảng định tuyến để biết lúc nào cần đọc architecture, lúc nào cần đọc conventions, lúc nào cần đi vào nhóm pattern hay workflow tương ứng.
Cách làm này nghe đơn giản nhưng chạm đúng ba vấn đề thực tế:
- Context tổng quá dày khiến agent tải nhiều thứ không liên quan
- Memory viết ra một lần rồi bị trôi dần khỏi codebase thật
- Khi tài liệu sai lệch, team thường không biết sai ở đâu để sửa nhanh
Nói ngắn gọn, đây là hướng “nạp theo nhu cầu” thay vì “nạp tất cả từ đầu”.
Điểm sáng nhất: drift detection không tốn token
Phần khiến cộng đồng phản hồi tích cực nhất không phải chuyện tổ chức file, mà là bộ kiểm tra drift. Tác giả nói CLI có nhiều checker để rà các dấu hiệu như:
- file được tài liệu tham chiếu nhưng đã không còn tồn tại
- script trong docs không còn khớp với project
- phiên bản dependency lệch nhau giữa các nơi
- scaffold quá lâu không được cập nhật so với lịch sử commit
Nếu đúng như mô tả thì đây là một ý khá thực chiến. Nhiều team hiện dành rất nhiều token để bắt agent tự đọc repo rồi tự đoán chỗ nào đã cũ. Trong khi đó, các lỗi kiểu đường dẫn hỏng, script cũ, tài liệu lệch version thực ra là lỗi có thể kiểm tra bằng luật cứng trước khi gọi model. Làm được bước này bằng công cụ xác định trước sẽ giảm cả chi phí lẫn độ ngẫu nhiên.
Vì sao cộng đồng quan tâm
Phần bình luận cho thấy bài đăng này chạm đúng nhu cầu chung của anh em đang dùng Claude Code, Codex và các agent tương tự.
Một số ý nổi bật trong thread:
- Có người thấy dự án thú vị nhưng cho rằng nhiều trường hợp chỉ cần 1-2 file là đủ, tức nhu cầu tối giản vẫn rất mạnh
- Có người hỏi thẳng MEX khác gì so với memory hoặc automemory sẵn có trong harness
- Tác giả trả lời rằng lợi thế chính là file markdown dễ đọc, dễ sửa bằng tay, không phải hộp đen; ngoài ra agent không phải tải toàn bộ ngữ cảnh ngay từ đầu
- Nhiều người khác nhắc tới các hệ thống tương tự họ tự dựng bằng Obsidian, MCP server hoặc repo tài liệu nội bộ
Điều này đáng chú ý vì nó phản ánh một xu hướng lớn hơn: cộng đồng đang dần coi “quản lý context” là một lớp hạ tầng riêng, không còn là mẹo prompt tạm thời nữa.
Bài học thực chiến cho anh em đang build với AI
Từ câu chuyện này, mình nghĩ có vài điểm rất đáng lấy về áp dụng ngay, kể cả anh em không dùng MEX.
1. Đừng gom mọi tri thức vào một file thần thánh
Một file claude.md, agents.md hay README quá dài thường tạo cảm giác yên tâm giả. Agent có vẻ như đã được cấp đủ bối cảnh, nhưng thực tế là nó phải đọc rất nhiều thứ không liên quan tới task hiện tại.
Thứ nên tối ưu không chỉ là “đủ thông tin”, mà là “đúng thông tin, đúng lúc”.
2. Tách lớp mô tả hệ thống khỏi lớp hướng dẫn thao tác
Rất nhiều repo đang trộn lẫn kiến trúc, quy ước code, checklist deploy và ghi chú tạm vào cùng một chỗ. Khi agent đọc vào, nó không biết cái nào là luật nền, cái nào chỉ là thao tác theo tình huống.
Nếu tách được thành những cụm rõ ràng như architecture, conventions, runbook, task pattern thì cả người lẫn agent đều ít lạc hơn.
3. Kiểm tra drift bằng luật cứng trước khi gọi model
Đây là thứ anh em có thể làm ngay cả khi không dùng công cụ riêng:
- so đường dẫn được nhắc trong docs với file thật
- so script được tài liệu mô tả với
package.json - phát hiện file context lâu không cập nhật trong khi code đổi liên tục
- cảnh báo dependency hoặc command ví dụ đã lỗi thời
Làm tốt bước này sẽ giúp agent bớt phải “đoán mò trong môi trường bẩn”.
4. Tooling cho agent đang trở thành một thị trường con
Trước đây mọi người hay bàn về model nào code hay hơn. Giờ bắt đầu thấy cuộc chơi chuyển sang câu hỏi khác: làm sao để model đó làm việc ổn định hơn trong repo thật, theo thời gian dài, qua nhiều người, nhiều task.
Ai xây được lớp hạ tầng này tốt sẽ có lợi thế rất lớn, kể cả khi họ không sở hữu model mạnh nhất.
Góc nhìn tin tức: đây có thể là tín hiệu tốt cho hệ công cụ mã nguồn mở quanh vibe coding
Một điểm tích cực trong bài này là dự án chưa phải sản phẩm thương mại hoàn thiện, nhưng đã nhanh chóng kéo được thảo luận, phản biện và lời đề nghị cộng tác. Đây là kiểu tín hiệu mà anh em làm open source nên để ý.
Trong mảng AI coding hiện tại, thứ lan truyền nhanh không chỉ là demo đẹp. Những công cụ xử lý đúng “nỗi đau vận hành” như context routing, memory hygiene, drift detection hay reproducible workflow mới là thứ dễ giữ chân người dùng lâu hơn. Nếu cộng đồng vibecoding tiếp tục đẩy mạnh lớp tooling này, khả năng cao chúng ta sẽ thấy thêm nhiều dự án nhỏ nhưng rất hữu ích mọc lên trong vài tháng tới.
Kết luận
Mình không nghĩ bài học ở đây là “anh em phải dùng ngay MEX”. Giá trị lớn hơn nằm ở chỗ nó nhắc lại một sự thật khá rõ: khi AI agent bắt đầu tham gia sâu vào codebase, bài toán lớn không còn chỉ là viết prompt hay chọn model. Bài toán thật là tổ chức tri thức, nạp ngữ cảnh đúng lúc và giữ cho context luôn bám sát repo thật.
Nếu anh em đang thấy agent của mình lúc khôn lúc ngáo, đọc đúng file hôm nay nhưng mai lại đi sai, thì rất có thể vấn đề không nằm ở model. Vấn đề nằm ở lớp hạ tầng context phía dưới. Và đó chính là lý do những dự án kiểu này đáng để theo dõi.
Top comments (0)