Quay lại Blog
FirefoxAI cục bộquyền riêng tưOllama

AI riêng tư trong Firefox: chạy mô hình cục bộ, không telemetry

8 phút đọc
AI riêng tư trong Firefox: chạy mô hình cục bộ, không telemetry

Nếu bạn dùng Firefox, nhiều khả năng bạn đã chọn nó một cách có chủ đích. Không phải vì nó được cài sẵn, mà vì bạn quan tâm đến chuyện ai đang theo dõi mình, và bạn thà sở hữu trình duyệt của mình còn hơn đi thuê nó từ một công ty quảng cáo. Bản năng đó gần đây đã bị thử thách.

Chúng ta sẽ nói ngắn gọn về lý do "AI trong trình duyệt" trở thành một chủ đề nhức nhối với người dùng Firefox, rồi đi vào phần thực hành: cách thêm một trợ lý AI thật sự riêng tư vào Firefox, một trợ lý chạy bằng các mô hình trên máy của bạn, đọc trang bạn đang xem, và gửi nội dung của bạn đi đúng chỗ chẳng đâu cả.

SurfMind nay đã có mặt trên Firefox, đây là cách thiết lập nó theo hướng riêng tư.

Vì sao người dùng Firefox lo lắng về AI

Cuối năm 2025, ban lãnh đạo mới của Mozilla công bố kế hoạch biến Firefox thành một "trình duyệt AI hiện đại" trong vài năm tới. Phản ứng của cộng đồng không mấy nồng ấm. Những người đã cố tình chọn Firefox để tránh sự giám sát và cồng kềnh lại thấy các tính năng AI tích hợp sẵn chính là đúng cái thứ mà họ đến với Firefox để chạy trốn.

Làn sóng phản đối đủ ồn ào đến mức Mozilla phải hứa hẹn một "công tắc tắt AI", một thiết lập duy nhất để tắt mọi tính năng AI và giữ chúng tắt qua các bản cập nhật. Dù bạn nghĩ gì về cách nó được triển khai (những người phê bình chỉ ra một cách hợp lý rằng một công tắc tắt lặng lẽ biến AI thành vấn đề của bạn phải tự loại bỏ, thay vì là việc của trình duyệt phải biện minh), sự kiện này đã hé lộ một điều quan trọng về người dùng Firefox: đây là nhóm khán giả ý thức về quyền riêng tư và có tư duy mã nguồn mở bậc nhất trên web.

Và đây mới là điều mà những người dùng đó cứ bị bảo rằng họ không thể có: AI thật sự riêng tư. Lời chào mời chủ đạo là "gửi dữ liệu của bạn lên đám mây của chúng tôi và hãy tin chúng tôi." Với một người dùng Firefox, đó chính là toàn bộ vấn đề, chứ không phải giải pháp.

Có một câu trả lời tốt hơn, và nó không đòi hỏi bạn phải tin tưởng bất kỳ ai.

Cách làm AI theo hướng riêng tư: giữ mô hình ở cục bộ

Bạn không phải chọn giữa "AI hữu ích" và "dữ liệu của tôi vẫn là của tôi." Bạn có thể chạy các mô hình AI đủ mạnh ngay trên máy tính của mình, không tài khoản, không đám mây, không telemetry, rồi dùng chúng ngay trong Firefox.

Thiết lập gồm hai phần:

  1. Một trình chạy mô hình cục bộ như Ollama hoặc LM Studio, thứ tải về một mô hình open-weight (Llama, Mistral, Qwen, DeepSeek) và chạy nó trên phần cứng của bạn. Một khi đã tải xong, nó hoạt động ngoại tuyến. Không gì bạn gõ vào đi đến một server.
  2. Một tiện ích trình duyệt kết nối Firefox với mô hình cục bộ đó và đưa cho nó trang bạn đang đọc, để bạn có thể hỏi về những gì trên màn hình mà không phải sao chép dán bất cứ thứ gì vào một công cụ đám mây.

Đó là toàn bộ thiết lập. Khi đã nối xong, bạn có một trợ lý AI trong Firefox mà ở đó nội dung trang và các câu lệnh của bạn không bao giờ rời khỏi máy. Đó không phải "chúng tôi hứa sẽ không nhìn." Đó là chẳng có gì để mà nhìn.

Thiết lập trong Firefox

Bước 1 — Chạy một mô hình cục bộ

Nếu bạn chưa có, hãy bắt đầu với Ollama. Nó miễn phí, mã nguồn mở, và chỉ hai lệnh:

# Install (Mac/Linux)
curl -fsSL https://ollama.com/install.sh | sh

# Download and run a model
ollama run llama3.2

Trên Windows, hãy lấy trình cài đặt từ ollama.com. Một laptop với 16GB RAM xử lý thoải mái phần lớn mô hình dùng hằng ngày. Hướng dẫn Ollama đầy đủ của chúng tôi nói về việc nên chọn mô hình nào và cần phần cứng ra sao. Thích một ứng dụng có giao diện đồ họa? LM Studio làm đúng công việc đó với giao diện trỏ-và-nhấp.

Bước 2 — Cho trình duyệt giao tiếp với mô hình

Ollama chỉ cho phép trình duyệt kết nối khi bạn ra lệnh cho nó. Khởi động nó với quyền truy cập trình duyệt được bật:

# Mac/Linux
OLLAMA_ORIGINS="*" ollama serve

# Windows (PowerShell)
$env:OLLAMA_ORIGINS="*"; ollama serve

Thấy lỗi "port 11434 already in use"? Ứng dụng Ollama đã chạy ngầm rồi. Hãy thoát nó trước (thanh menu trên Mac, khay hệ thống trên Windows), rồi chạy lại lệnh.

Bước 3 — Cài SurfMind cho Firefox

Lấy SurfMind từ Firefox Add-ons và ghim nó lại. SurfMind là một trợ lý trình duyệt được tạo ra để đặt mô hình cục bộ ở vị trí trung tâm, đúng là thứ nhóm người dùng này đã thiếu lâu nay: một công cụ được trau chuốt cho người dùng phổ thông, không mặc định rằng bạn sẽ trao dữ liệu của mình cho một đám mây.

Bước 4 — Kết nối mô hình cục bộ của bạn

Mở SurfMind trên bất kỳ trang nào, nhấp vào tên mô hình để mở bộ chọn, rồi chuyển sang tab CustomAdd Custom Models. Chọn preset Ollama và nó sẽ tự điền mọi thứ:

  • API URL: http://localhost:11434/api/chat
  • Models URL: http://localhost:11434/api/tags
  • API Key: (không cần)

Lưu lại. SurfMind kết nối với Ollama cục bộ của bạn và liệt kê các mô hình bạn đã cài. Chọn một cái, và xong.

Giờ hãy mở bất kỳ trang web nào, bài viết, tài liệu kỹ thuật, file PDF dày đặc, điều khoản dịch vụ mà bạn sẽ chẳng bao giờ dán vào ChatGPT, và cứ việc hỏi. Câu trả lời đến từ một mô hình đang chạy trên chính máy của bạn.

Vì sao điều này đặc biệt hợp với Firefox

  • Trọng số mở cho một trình duyệt mở. Bạn đang chạy các mô hình mã nguồn mở trong một trình duyệt mã nguồn mở. Không có hộp đen ở đầu nào cả.
  • Thật sự không telemetry trên nội dung của bạn. Mô hình cục bộ nghĩa là các câu lệnh và trang bạn đang đọc ở lại trên thiết bị của bạn. Không có vòng đi-về đám mây nào để mà phải loại bỏ.
  • Nó hoạt động ngoại tuyến. Trên máy bay, trên wifi khách sạn tệ hại, trong lúc mất kết nối, AI cục bộ của bạn vẫn chạy.
  • Bạn không bị khóa vào đâu cả. Đổi mô hình thoải mái. Ngày mai chạy một cái khác. Không ai thay mô hình hay đổi giá sau lưng bạn.

Và nếu có lúc bạn thật sự muốn với tới một mô hình đám mây lớn cho một tác vụ khó, SurfMind cho phép bạn, theo điều kiện của bạn, với key của chính bạn (BYOK), chuyển đổi theo từng tác vụ. Vấn đề không phải AI đám mây là xấu xa. Vấn đề là bạn quyết định khi nào có thứ gì đó rời khỏi máy, và mặc định là không.

Một lưu ý thẳng thắn

Mô hình cục bộ nhỏ hơn những mô hình đám mây khổng lồ, nên với các tác vụ suy luận khó nhất bạn sẽ nhận ra khoảng cách. Với công việc hằng ngày, tóm tắt, giải thích, soạn thảo, hỏi đáp trên một trang, chúng còn hơn cả đủ tốt, và chất lượng đã tăng lên rất nhanh.

Khi công việc trở nên phức tạp hơn, SurfMind giúp việc chuyển đổi rất đơn giản. Cứ giữ cục bộ theo mặc định cho các trang riêng tư, rồi chuyển ngay trong cùng thanh bên sang một mô hình lớn hơn như Claude, GPT hay Gemini khi bạn cần suy luận sâu hơn, viết lách mạnh hơn, hoặc nhiều ngữ cảnh hơn. Những mô hình lớn hơn đó vẫn là lựa chọn của bạn, khi tác vụ xứng đáng để gửi ra ngoài.

Thiết lập AI riêng tư hợp với tinh thần Firefox

Bạn chọn Firefox để giữ quyền kiểm soát. Thêm AI không nhất thiết phải từ bỏ điều đó. Hãy chạy một mô hình cục bộ, kết nối nó với SurfMind, và bạn đã có một trợ lý có năng lực trên mọi trang bạn duyệt, với dữ liệu của bạn ở lại đúng nơi nó thuộc về.

Thiết lập nó ngay chiều nay. Mở SurfMind trên thứ tiếp theo mà đằng nào bạn cũng định đọc, và cảm nhận xem việc dùng một AI chẳng có gì để báo cáo thì như thế nào.


AI riêng tư, trong trình duyệt mà bạn vốn đã tin tưởng.

Nhận SurfMind cho Firefox →

Bài viết liên quan

Xem tất cả
AI riêng tư trong Firefox: chạy mô hình cục bộ, không telemetry | SurfMind Blog