AI & Automation (vnROM)

Cover image for Hướng dẫn sử dụng Droidrun - Công cụ tự động hoá Android
Duy Nghiện
Duy Nghiện

Posted on • Originally published at vnrom.net

Hướng dẫn sử dụng Droidrun - Công cụ tự động hoá Android

Trong thời đại phát triển ứng dụng di động, việc kiểm thử, gỡ lỗi và tự động hóa các tác vụ trên thiết bị Android đòi hỏi những công cụ mạnh mẽ và linh hoạt. Droidrun chính là một trong những giải pháp giải quyết được vấn đề này.

Droidrun là một framework mã nguồn mở, được thiết kế để điều khiển các thiết bị Android và iOS thông qua các lệnh tự nhiên được hỗ trợ bởi AI (LLM agents). Điều này có nghĩa là bạn có thể tương tác với ứng dụng Android một cách trực quan, gần giống như một người thực sự đang sử dụng thiết bị, nhưng hoàn toàn tự động.

Tại sao nên sử dụng Droidrun?

Droidrun cung cấp một loạt tính năng ấn tượng giúp tiết kiệm thời gian và nâng cao hiệu suất công việc:

  • Điều khiển bằng ngôn ngữ tự nhiên: Thay vì viết script phức tạp, bạn có thể sử dụng các lệnh bằng tiếng Anh hoặc tiếng Việt để điều khiển thiết bị.

  • Hỗ trợ nhiều nhà cung cấp LLM: Tương thích với OpenAI, Anthropic, Gemini, Ollama và DeepSeek, cho phép bạn chọn mô hình AI phù hợp nhất.

  • Khả năng lập kế hoạch: Xử lý các tác vụ phức tạp gồm nhiều bước một cách tự động và thông minh.

  • Giao diện dòng lệnh (CLI) dễ sử dụng: Với các tính năng gỡ lỗi nâng cao giúp bạn theo dõi quá trình thực thi.

  • API Python mở rộng: Tạo các tự động hóa tùy chỉnh cho nhu cầu cụ thể của dự án.

  • Phân tích ảnh chụp màn hình: Hiểu và phân tích giao diện người dùng bằng thị giác máy tính.

  • Truy vết thực thi: Tích hợp với Arize Phoenix để giám sát và gỡ lỗi chi tiết.

Những trường hợp sử dụng thực tế

Droidrun có thể được áp dụng trong nhiều tình huống khác nhau:

  • Kiểm thử tự động (Automated Testing): Kiểm thử giao diện người dùng (UI testing) của các ứng dụng di động mà không cần viết các test case phức tạp.

  • Tự động hóa quy trình: Tự động hóa các tác vụ lặp đi lặp lại như nhập dữ liệu, điều hướng ứng dụng, hoặc tương tác với giao diện.

  • Hỗ trợ từ xa: Giúp những người dùng không am hiểu công nghệ thực hiện các tác vụ trên di động một cách dễ dàng.

  • Khám phá giao diện: Thử nghiệm và khám phá các tính năng của ứng dụng một cách nhanh chóng.


Hướng dẫn cài đặt Droidrun

Yêu Cầu Hệ Thống

Trước khi cài đặt Droidrun, hãy đảm bảo rằng hệ thống của bạn đáp ứng các yêu cầu sau:

  • Python: Phiên bản 3.8 trở lên (tối ưu nhất là 3.10 hoặc mới hơn)
  • pip: Trình quản lý gói Python (thường được cài đặt cùng Python)
  • Android SDK (tùy chọn): Nếu bạn muốn sử dụng Droidrun với thiết bị Android vật lý hoặc emulator
  • Kết nối Internet: Để tải xuống các thư viện và giao tiếp với các dịch vụ LLM

Ngoài ra, nếu bạn đang sử dụng macOS và cài đặt Python thông qua Homebrew, bạn có thể cần cài đặt một số công cụ hỗ trợ thêm.

Bước 1: Clone Repository từ GitHub

Mở terminal hoặc command prompt và chạy lệnh sau để tải mã nguồn Droidrun:

git clone https://github.com/droidrun/droidrun.git
cd droidrun
Enter fullscreen mode Exit fullscreen mode

Nếu bạn chưa có Git cài đặt, hãy tải về từ git-scm.com trước.

Bước 2: Cài đặt Droidrun bằng pip

Cách nhanh nhất để cài đặt Droidrun và tất cả các dependency là sử dụng pip với các gói bổ sung:

pip install 'droidrun[google,anthropic,openai,deepseek,ollama,dev]'
Enter fullscreen mode Exit fullscreen mode

Lệnh này cài đặt Droidrun cùng với hỗ trợ cho nhiều nhà cung cấp LLM:

  • google: Hỗ trợ Google Gemini
  • anthropic: Hỗ trợ Claude của Anthropic
  • openai: Hỗ trợ GPT của OpenAI
  • deepseek: Hỗ trợ DeepSeek LLM
  • ollama: Hỗ trợ các mô hình chạy cục bộ qua Ollama
  • dev: Các công cụ phát triển bổ sung

Nếu bạn muốn cài đặt phiên bản cơ bản mà không cần tất cả các dependency:

pip install droidrun
Enter fullscreen mode Exit fullscreen mode

Sau đó, bạn có thể cài đặt các provider cụ thể mà bạn cần.

Bước 3: Xác minh cài đặt

Để kiểm tra xem Droidrun đã được cài đặt thành công, hãy chạy:

droidrun --version
Enter fullscreen mode Exit fullscreen mode

Nếu cài đặt thành công, bạn sẽ thấy số phiên bản hiện tại của Droidrun. Hiện tại, phiên bản mới nhất là v0.4.0 (tính đến tháng 10 năm 2025).

Bước 4: Cấu hình API Keys

Tùy thuộc vào nhà cung cấp LLM bạn chọn, bạn sẽ cần cấu hình API keys:

Nếu sử dụng OpenAI (GPT):

export OPENAI_API_KEY="your_openai_api_key_here"
Enter fullscreen mode Exit fullscreen mode

Nếu sử dụng Google Gemini:

export GOOGLE_API_KEY="your_google_api_key_here"
Enter fullscreen mode Exit fullscreen mode

Nếu sử dụng Anthropic (Claude):

export ANTHROPIC_API_KEY="your_anthropic_api_key_here"
Enter fullscreen mode Exit fullscreen mode

Nếu sử dụng Ollama (chạy cục bộ):
Không cần API key, nhưng bạn cần cài đặt và chạy Ollama trước.

Lưu ý bảo mật: Không bao giờ commit các API keys vào repository Git. Sử dụng tệp .env hoặc biến môi trường thay thế.

Bước 5: Cài đặt Android SDK (Tùy chọn)

Nếu bạn muốn sử dụng Droidrun với thiết bị Android vật lý hoặc emulator, bạn cần cài đặt Android SDK:

  1. Tải về Android Studio từ developer.android.com
  2. Cài đặt Android Studio
  3. Mở Android Studio và sử dụng SDK Manager để cài đặt Platform Tools và các API cần thiết
  4. Thiết lập biến môi trường ANDROID_HOME:
export ANDROID_HOME=$HOME/Library/Android/sdk  # macOS
export PATH=$PATH:$ANDROID_HOME/tools:$ANDROID_HOME/platform-tools
Enter fullscreen mode Exit fullscreen mode

Khắc phục sự cố cài đặt

Vấn đề: Lỗi "pip: command not found"

  • Giải pháp: Cài đặt Python từ python.org hoặc sử dụng trình quản lý gói của hệ điều hành (Homebrew trên macOS, apt trên Linux).

Vấn đề: Lỗi phiên bản Python quá cũ

  • Giải pháp: Nâng cấp Python lên phiên bản 3.8 trở lên.

Vấn đề: Lỗi cài đặt dependency

  • Giải pháp: Thử xóa file requirements.txt hoặc bộ nhớ cache pip: pip cache purge

Hướng sẫn sử dụng Droidrun

Bắt đầu nhanh

Sau khi cài đặt thành công, bạn có thể bắt đầu sử dụng Droidrun. Dưới đây là cách sử dụng cơ bản:

Lệnh CLI cơ bản

1. Xem trợ giúp:

droidrun --help
Enter fullscreen mode Exit fullscreen mode

Lệnh này sẽ hiển thị tất cả các tùy chọn có sẵn và mô tả chi tiết về từng lệnh.

2. Chạy một lệnh tự động:

droidrun --command "Mở ứng dụng Gmail"
Enter fullscreen mode Exit fullscreen mode

Droidrun sẽ sử dụng AI để hiểu lệnh của bạn và tự động điều khiển thiết bị Android để mở Gmail.

3. Chạy một chuỗi lệnh phức tạp:

droidrun --command "Mở Chrome, tìm kiếm 'Droidrun GitHub', và truy cập trang web đầu tiên"
Enter fullscreen mode Exit fullscreen mode

Droidrun sẽ tự động lập kế hoạch và thực thi từng bước một.

Ví dụ thực tế: Tự động hóa một tác vụ đơn giản

Giả sử bạn muốn tự động hóa việc kiểm tra email trên ứng dụng Gmail:

droidrun --command "Mở Gmail, xác minh rằng có tin nhắn chưa đọc, và báo cáo số lượng"
Enter fullscreen mode Exit fullscreen mode

Droidrun sẽ:

  1. Bắt một ảnh chụp màn hình hiện tại
  2. Phân tích giao diện để xác định vị trí nút/ứng dụng
  3. Sử dụng AI để hiểu và thực hiện các hành động cần thiết
  4. Báo cáo kết quả

Sử dụng API Python

Nếu bạn muốn tích hợp Droidrun vào một ứng dụng Python riêng, bạn có thể sử dụng API:

from droidrun import Droidrun

# Khởi tạo Droidrun client
client = Droidrun(provider="openai")

# Chạy một tác vụ
result = client.execute("Mở Settings và điều chỉnh độ sáng lên 100%")

# In kết quả
print(result)
Enter fullscreen mode Exit fullscreen mode

Tích hợp với Android Debug Bridge (ADB)

Droidrun có thể tích hợp với ADB để có kiểm soát sâu hơn:

# Liệt kê các thiết bị kết nối
adb devices

# Chạy Droidrun trên một thiết bị cụ thể
droidrun --device "emulator-5554" --command "Mở ứng dụng Camera"
Enter fullscreen mode Exit fullscreen mode

Mẹo tối ưu hóa hiệu suất

  • Chọn mô hình LLM thích hợp: Ollama và DeepSeek thường nhanh hơn OpenAI nhưng có thể ít chính xác hơn. Hãy thử nghiệm để tìm cân bằng tốt nhất.

  • Tối ưu hóa lệnh: Lệnh rõ ràng và cụ thể sẽ cho kết quả tốt hơn. Thay vì "Làm điều gì đó", hãy nói "Mở Settings, chuyển đến Advanced, và bật Developer Mode".

  • Sử dụng execution tracing: Kích hoạt Arize Phoenix tracing để theo dõi các bước thực thi và xác định vấn đề:

droidrun --enable-tracing --command "Lệnh của bạn ở đây"
Enter fullscreen mode Exit fullscreen mode
  • Quản lý screenshots: Droidrun lưu các ảnh chụp màn hình trong quá trình thực thi. Xóa chúng định kỳ để tiết kiệm dung lượng lưu trữ.

Kiểm thử ứng dụng với Droidrun

Ví dụ: Tự động hóa kiểm thử giao diện người dùng của một ứng dụng:

droidrun --command "Mở ứng dụng Shopping, tìm kiếm 'Laptop', thêm sản phẩm đầu tiên vào giỏ hàng, và kiểm tra rằng giỏ hàng được cập nhật"
Enter fullscreen mode Exit fullscreen mode

Droidrun sẽ thực thi từng bước và báo cáo xem liệu quy trình có hoàn tất thành công hay không.


Droidrun là một công cụ mạnh mẽ và linh hoạt cho bất kỳ ai làm việc với phát triển ứng dụng Android, kiểm thử tự động, hoặc tự động hóa các tác vụ di động. Với khả năng sử dụng ngôn ngữ tự nhiên, hỗ trợ nhiều nhà cung cấp LLM, và API Python dễ sử dụng, Droidrun giúp bạn tiết kiệm thời gian và tăng năng suất.

Dù bạn là một lập trình viên mới bắt đầu hay một chuyên gia dày dạn kinh nghiệm, Droidrun đều có thể giúp ích. Hãy bắt đầu bằng cách cài đặt nó, khám phá các tính năng, và tìm ra cách nó có thể giúp dự án của bạn.

Hãy thử Droidrun ngay bằng cách truy cập GitHub Repository chính thức để tải mã nguồn, xem thêm ví dụ, và tham gia cộng đồng. Nếu bạn tìm thấy lỗi hoặc có đề xuất cải thiện, hãy tạo một issue hoặc pull request trên GitHub.

Nếu bạn đã sử dụng thành công Droidrun trong dự án của mình, hãy bình luận phía dưới để chia sẻ câu chuyện và mẹo của bạn với cộng đồng nhé!

Top comments (0)