IA privada no Firefox: rode modelos locais sem telemetria
Se você usa o Firefox, há uma boa chance de que você o tenha escolhido de propósito. Não porque veio pré-instalado, mas porque você se importa com quem está observando, e prefere ser dono do seu navegador a alugá-lo de uma empresa de anúncios. Esse instinto foi posto à prova ultimamente.
Este post é para essa pessoa. Vamos falar brevemente sobre por que "IA no navegador" virou um assunto sensível para os usuários do Firefox, e então chegar à parte prática: como adicionar ao Firefox um assistente de IA genuinamente privado, que roda em modelos na sua máquina, lê a página em que você está e envia seu conteúdo para exatamente lugar nenhum.
Como o SurfMind agora está disponível para Firefox, veja como configurá-lo do jeito privado.
Por que os usuários do Firefox se preocuparam com a IA
No fim de 2025, a nova liderança da Mozilla anunciou planos de transformar o Firefox em um "navegador de IA moderno" ao longo dos próximos anos. A reação da comunidade não foi calorosa. Pessoas que escolheram especificamente o Firefox para evitar vigilância e inchaço viram os recursos de IA integrados como exatamente aquilo de que tinham vindo ao Firefox para escapar.
A reação negativa foi forte o suficiente para que a Mozilla prometesse um "botão para desligar a IA", uma única configuração para desativar todos os recursos de IA e mantê-los desativados ao longo das atualizações. Pense o que quiser sobre como isso foi conduzido (críticos apontaram com razão que um botão de desligar transforma a IA discretamente em um problema seu a recusar, em vez de algo que o navegador deveria justificar), o episódio revelou algo importante sobre quem usa o Firefox: este é o público mais consciente de privacidade e mais ligado a código aberto da web.
E aqui está o que esses usuários vivem ouvindo que não podem ter: IA que seja realmente privada. O discurso predominante é "envie seus dados para a nossa nuvem e confie em nós". Para um usuário do Firefox, esse é o problema inteiro, não a solução.
Existe uma resposta melhor, e ela não exige confiar em ninguém.
A forma privada de fazer IA: mantenha o modelo local
Você não precisa escolher entre "IA útil" e "meus dados continuam meus". Você pode rodar modelos de IA capazes diretamente no seu próprio computador, sem conta, sem nuvem, sem telemetria, e então usá-los bem dentro do Firefox.
A configuração tem duas peças:
- Um executor de modelos local como o Ollama ou o LM Studio, que baixa um modelo de pesos abertos (Llama, Mistral, Qwen, DeepSeek) e o roda no seu hardware. Uma vez baixado, ele funciona offline. Nada do que você digita vai para um servidor.
- Uma extensão de navegador que conecta o Firefox a esse modelo local e o alimenta com a página que você está lendo, para que você possa fazer perguntas sobre o que está na tela sem copiar e colar nada em uma ferramenta de nuvem.
Essa é a configuração inteira. Quando está tudo conectado, você tem um assistente de IA no Firefox em que o conteúdo da página e seus prompts nunca saem da sua máquina. Isso não é "prometemos não olhar". Isso é não há nada para olhar.
Configurando no Firefox
Passo 1 — Rode um modelo localmente
Se você ainda não tem um, comece pelo Ollama. É gratuito, código aberto e são dois comandos:
# Instalar (Mac/Linux)
curl -fsSL https://ollama.com/install.sh | sh
# Baixar e rodar um modelo
ollama run llama3.2No Windows, baixe o instalador em ollama.com. Um laptop com 16GB de RAM dá conta confortavelmente da maioria dos modelos do dia a dia. Nosso passo a passo completo do Ollama cobre qual modelo escolher e de que hardware você precisa. Prefere um app gráfico? O LM Studio faz o mesmo trabalho com uma interface de apontar e clicar.
Passo 2 — Deixe seu navegador conversar com o modelo
O Ollama só permite conexões do navegador quando você manda. Inicie-o com o acesso do navegador habilitado:
# Mac/Linux
OLLAMA_ORIGINS="*" ollama serve
# Windows (PowerShell)
$env:OLLAMA_ORIGINS="*"; ollama serveVendo um erro de "port 11434 already in use"? O app do Ollama já está rodando em segundo plano. Feche-o primeiro (barra de menu no Mac, bandeja do sistema no Windows), depois rode o comando de novo.
Passo 3 — Instale o SurfMind para Firefox
Baixe o SurfMind no Firefox Add-ons e fixe-o. O SurfMind é um assistente de navegador feito para colocar os modelos locais no centro, exatamente o que faltava a esse público: uma ferramenta bem-acabada, pensada para usuários comuns, que não pressupõe que você vá entregar seus dados a uma nuvem.
Passo 4 — Conecte seu modelo local
Abra o SurfMind em qualquer página, clique no nome do modelo para abrir o seletor e mude para a aba Custom → Add Custom Models. Escolha a predefinição Ollama e ela preenche tudo automaticamente:
- API URL:
http://localhost:11434/api/chat - Models URL:
http://localhost:11434/api/tags - API Key: (nenhuma necessária)
Salve. O SurfMind se conecta ao seu Ollama local e lista os modelos que você instalou. Escolha um, e pronto.
Agora abra qualquer página da web, o artigo, a documentação, o PDF denso, os termos de serviço que você nunca colaria no ChatGPT, e simplesmente pergunte. A resposta vem de um modelo rodando na sua própria máquina.
Por que isso combina especificamente com o Firefox
- Pesos abertos para um navegador aberto. Você está rodando modelos de código aberto em um navegador de código aberto. Sem caixas-pretas em nenhuma das pontas.
- Telemetria genuinamente zero sobre seu conteúdo. Modelos locais significam que seus prompts e a página que você está lendo ficam no seu dispositivo. Não há ida e volta à nuvem para recusar.
- Funciona offline. Em um avião, no wifi ruim de um hotel, durante uma queda, sua IA local continua funcionando.
- Você não fica preso. Troque de modelos livremente. Rode um diferente amanhã. Ninguém muda o modelo ou o preço por baixo dos panos.
E se você um dia quiser buscar um grande modelo de nuvem numa tarefa difícil, o SurfMind permite, nos seus termos, com sua própria chave (BYOK), alternável por tarefa. A questão não é que a IA de nuvem seja má. A questão é que você decide quando algo sai da sua máquina, e o padrão é que não sai.
Uma ressalva honesta
Modelos locais são menores do que os gigantes da nuvem, então para as tarefas de raciocínio mais difíceis você vai notar uma diferença. Para o dia a dia, resumir, explicar, redigir, perguntas e respostas sobre uma página, eles são mais que bons o suficiente, e a qualidade subiu rápido.
Quando o trabalho fica mais complexo, o SurfMind facilita a troca. Fique local por padrão para páginas privadas, depois mude na mesma barra lateral para um modelo maior como Claude, GPT ou Gemini quando precisar de raciocínio mais profundo, escrita melhor ou mais contexto. Esses modelos maiores continuam sendo sua escolha, quando a tarefa vale a pena enviar para fora.
Uma configuração de IA privada com a cara do Firefox
Você escolheu o Firefox para manter o controle. Adicionar IA não precisa abrir mão disso. Rode um modelo localmente, conecte-o com o SurfMind, e você tem um assistente capaz em cada página que navega, com seus dados ficando exatamente onde devem.
Configure esta tarde. Abra o SurfMind na próxima coisa que você já ia ler mesmo, e veja como é usar uma IA que não tem nada a relatar.
IA privada, no navegador em que você já confia.
Posts relacionados
Ver tudoAs melhores extensões de navegador para modelos de IA local em 2026 (Ollama, LM Studio e mais)
As melhores extensões de navegador para rodar modelos de IA local em 2026, de barras laterais polidas local+nuvem a ferramentas Ollama de código aberto. Converse com qualquer página, de forma privada.
Como Usar Ollama para Conversar com Qualquer Página da Web
Execute modelos de IA localmente ou na nuvem com Ollama, depois use o SurfMind para conversar com qualquer página da web de forma privada e gratuita.
Ollama vs LM Studio: qual ferramenta de IA local é ideal para você?
Uma comparação prática e sem exageros entre Ollama e LM Studio para executar modelos de IA localmente em 2026, além de como usar qualquer um deles para conversar com qualquer página da web.