AI & Automation (vnROM)

Duy Nghiện
Duy Nghiện

Posted on

Công cụ miễn phí dịch phụ đề SRT bằng Gemini AI - Không cần API Key

Hi ae,
Hôm nay mình muốn chia sẻ một phát hiện thú vị mà mình vừa tìm được khi cần dịch phụ đề cho một video hành động (2 người). Mình đã tìm thấy một tool open-source siêu tiện lợi tên là SRT-Subtitle-Translator-Validator, và thực sự ấn tượng với nó.

Chuyện là như thế này...

Vài tuần trước, mình cần dịch một file SRT (phụ đề) từ tiếng Nhật sang tiếng Việt, nhưng mình không muốn tốn tiền cho API nên định dùng CLIProxyAPI, thì phát hiện ra nó cũng được build dựa trên CLIProxyAPI. Ai đang cần tìm một tool dịch phụ đề thì thử xem nhé.

Tool này là gì?

SRT-Subtitle-Translator-Validator là một ứng dụng web-based (chạy trên trình duyệt) giúp bạn dịch file SRT một cách tự động. Điểm tuyệt vời nhất là:

  • Dùng Gemini AI – Sử dụng Gemini (của Google) để dịch, nhưng thông qua CLI Proxy, không cần API key riêng
  • Xác thực & sửa lỗi tự động – Tool tự động kiểm tra lỗi timecode, format, và các vấn đề khác, rồi sửa chúng
  • Dễ sử dụng - Giao diện đơn giản, chỉ cần upload file SRT, chọn ngôn ngữ, và click "Dịch"
  • Miễn Phí – Không cần trả tiền API, chỉ cần gói Gemini của bạn (hoặc free tier)
  • Nhanh chóng – Dịch xong trong vài giây, thậm chí với file lớn

Tại sao mình thích nó?

Trước đây, mình thường dùng các tool dịch phụ đề khác, nhưng hầu hết đều yêu cầu:

  • Cấu hình API key phức tạp
  • Trả tiền subscription hàng tháng
  • Hoặc phải dùng dịch vụ web trực tuyến với giới hạn file

Nhưng SRT-Subtitle-Translator-Validator không! Nó hoàn toàn open-source, miễn phí, và dễ setup. Nếu ae đã có sẵn CLIProxyAPI thì chỉ việc clone repo GitHub, chạy file index.html trong thư mục dự án để kết nối với CLIProxyAPI và dùng.

Lợi ích tuyệt vời khác là nó tự động kiểm tra và sửa lỗi. Mình không cần lo lắng về những vấn đề như phụ đề trùng lặp, timecode sai, hay format không đúng. Tool sẽ xử lý hết.

Ai chưa cài CLIProxyAPI thì xem bài này:

Cách sử dụng

Bước 1. Chạy server CLIProxyAPI, nếu ai chưa cài thì xem bài này: Biến gói thuê bao AI (Gemini/Claude) thành API gần như “không giới hạn” với CLIProxyAPI

Bước 2. Clone repo từ GitHub: git clone https://github.com/VjayC/SRT-Subtitle-Translator-Validator.git

Bước 3. Chạy file index.html để vào trang setup và sử dụng

SRT Translator & Validator

Bước 4. Cấu hình trên Web

  1. CLI Proxy API Endpoint: Mặc định là http://localhost:8317/v1/chat/completions.
  2. Model Name: Mặc định là gemini-2.5-pro.
  3. API Key: Nhập key giống trong CLIProxyAPI mà ae đã setup.

Bước 5. Thiết lập Bảng mã/Ngôn ngữ cho phép (Allowed Scripts)

Mặc định công cụ cho phép: Tiếng Anh (Basic Latin), Ký tự bổ trợ (Latin Supplement), và các ký tự đặc biệt.

Để thêm ngôn ngữ đích của bạn (ví dụ: Tiếng Việt):

  1. Gõ tên ngôn ngữ vào ô tìm kiếm (ví dụ: "Vietnamese").
  2. Chọn hệ chữ viết gợi ý để thêm vào.
  3. Hoặc thêm dải mã Unicode thủ công nếu cần.

Bước 6. Tạo Prompt (Câu lệnh dịch)

Lưu ý: Trong câu lệnh prompt, KHÔNG ĐƯỢC yêu cầu AI dịch cả timestamp (thời gian). Tool sẽ tự xử lý phần đó. AI chỉ cần dịch nội dung văn bản.

Viết hướng dẫn dịch vào ô Prompt.

  • Bạn có thể dùng markdown.
  • Hoặc sử dụng template.

Để tiết kiệm thời gian, bạn có thể tạo file .txt chứa mẫu prompt với các biến số dạng {{tên biến}}.

  1. Kéo thả file template .txt vào ô Prompt hoặc nhấn "📥 Import Template".
  2. Điền các thông tin được yêu cầu (Tên phim, Tập số mấy, Ngôn ngữ nguồn, Ngôn ngữ đích...).
  3. Nhấn "Apply Template" để tạo prompt hoàn chỉnh.
**Ví dụ prompt mẫu:**
You are translating subtitles for {{Show Name}}, Season {{Season}}, Episode {{Episode}}.

Translate from {{Source Language}} to {{Target Language}}.

**Style Guidelines:**
- Use {{Formality Level}} language
- Keep character names in {{Name Language}}

[Rest of your translation instructions...]
Enter fullscreen mode Exit fullscreen mode

Bước 7. Tải file lên và dịch

  1. Nhấn "Choose Input SRT file..." và chọn file phụ đề tiếng Nhật gốc.
  2. Nhấn nút "Translate with Gemini".
  3. Công cụ sẽ:
  4. Gửi file lên Gemini để dịch.
  5. Tự động phát hiện ngôn ngữ.
  6. Tự động kiểm tra lỗi ngay khi có kết quả.

Bước 8. Xử lý khi dịch bị ngắt quãng (Partial Translation)

Nếu Gemini dừng dịch giữa chừng (do file quá dài), bạn sẽ thấy:

  • Cảnh báo: "⚠️ Partial Translation Detected!"
  • Nút "⏩ Continue Translating".

Hãy nhấn nút đó để tool tự động dịch tiếp phần còn thiếu. Lặp lại cho đến khi xong hết file.

Bước 9. Xem lại và Chỉnh sửa

  • Bạn có thể đọc và sửa trực tiếp bản dịch trong khung soạn thảo.
  • Nhấn "💾 Save Edits" nếu bạn sửa thủ công.

Bước 10. Tự động sửa lỗi

Nếu công cụ báo lỗi (màu đỏ hoặc vàng), nhấn nút "🔧 Fix All Errors":

  • Nó sẽ tự động đồng bộ lại thời gian cho khớp file gốc.
  • Nó gửi các dòng bị lỗi ký tự lạ về Gemini để dịch lại cho đúng.
  • Sau đó tự kiểm tra lại lần nữa.

Bước 11. Tải file kết quả

  • "💾 Download Translated SRT": Tải file phụ đề đã hoàn thiện.
  • Tên file sẽ có dạng: TênGốc(NgônNgữ)(Model).srt

  • "📄 Download Raw Output": Tải log dữ liệu gốc (dùng để kiểm tra nếu có lỗi lạ).

Các ngôn ngữ hỗ trợ

Công cụ hỗ trợ sẵn hơn 130 hệ chữ viết, bao gồm:

  • Tiếng Việt (Thuộc nhóm Latin Supplement/Extended)
  • Châu Á: Trung, Nhật, Hàn, Thái, Lào, Khmer...
  • Ấn Độ: Telugu, Hindi, Tamil...
  • Châu Âu, Trung Đông, Châu Phi...

Khắc phục sự cố thường gặp

"Translation Error: Failed to fetch"

  • Kiểm tra xem bạn đã bật CLI Proxy API chưa?
  • Kiểm tra đường dẫn Endpoint có đúng là http://localhost:8317... không.

"No subtitles were translated" (Không dịch được gì)

  • Kiểm tra hạn mức (quota) của Gemini.
  • Thử đổi Model sang gemini-2.5-flash (nhẹ hơn).
  • Kiểm tra lại Prompt xem đã rõ ràng chưa.

"API Error: 401 Unauthorized"

  • Sai API Key. Hãy kiểm tra lại key trên web và trong file config.yaml.
  • Thử đăng nhập lại: cliproxyapi --login.

"API Error: 503 Service Unavailable"

  • Gemini đang quá tải. Hãy đợi vài phút hoặc đổi sang model khác.

Cấu hình nâng cao

Đổi Model AI

Bạn có thể nhập tên model khác vào ô Model Name:

  • gemini-2.5-flash: Nhanh, rẻ, phù hợp dịch đơn giản.
  • gemini-2.5-pro: Chính xác hơn, tốt cho văn cảnh phức tạp.
  • gemini-3-pro-preview: Model mới nhất, thông minh nhất.

Dải Unicode tùy chỉnh

Dành cho các ký tự đặc biệt:

  • Emoji: U+1F600-U+1F64F
  • Ký tự toán học, khung viền...

Nếu bạn từng gặp khó khăn với việc dịch phụ đề, hoặc bạn là creator video cần dịch nhanh chóng, mình recomments bạn thử tool này. Nó đã giúp mình tiết kiệm rất nhiều thời gian.

Bạn có thể:

  • Để lại một star trên GitHub nếu bạn thích
  • Report bug hoặc suggest tính năng mới
  • Đóng góp code nếu bạn là developer

Nếu bạn đã dùng tool này, hãy chia sẻ kinh nghiệm của bạn dưới đây để mình và mọi người học hỏi thêm nhé :D

Top comments (0)