Private KI in Firefox: Lokale Modelle mit null Telemetrie ausführen
Wenn du Firefox nutzt, hast du ihn mit guter Wahrscheinlichkeit bewusst gewählt. Nicht, weil er vorinstalliert war, sondern weil dir wichtig ist, wer zuschaut, und weil du deinen Browser lieber besitzt, als ihn von einem Werbekonzern zu mieten. Dieser Instinkt wurde zuletzt auf die Probe gestellt.
Dieser Beitrag ist für genau diese Person. Wir sprechen kurz darüber, warum „KI im Browser“ für Firefox-Nutzer zu einem wunden Punkt wurde, und kommen dann zum praktischen Teil: wie du Firefox einen wirklich privaten KI-Assistenten hinzufügst – einen, der auf Modellen auf deinem Rechner läuft, die Seite liest, auf der du bist, und deinen Inhalt exakt nirgendwohin sendet.
Da SurfMind jetzt für Firefox verfügbar ist, hier, wie du es auf die private Art einrichtest.
Warum Firefox-Nutzer bei KI nervös wurden
Ende 2025 kündigte Mozillas neue Führung Pläne an, Firefox in den nächsten Jahren zu einem „modernen KI-Browser“ zu machen. Die Reaktion der Community war nicht herzlich. Menschen, die sich gezielt für Firefox entschieden hatten, um Überwachung und Aufblähung zu vermeiden, sahen eingebaute KI-Funktionen als genau das, dem sie mit Firefox entkommen wollten.
Der Gegenwind war laut genug, dass Mozilla einen "KI-Notausschalter" versprach – eine einzige Einstellung, um alle KI-Funktionen abzuschalten und über Updates hinweg abgeschaltet zu halten. Was du auch von der Art der Umsetzung hältst (Kritiker wiesen zu Recht darauf hin, dass ein Ausschalter KI stillschweigend zu deinem Problem macht, das du abwählen musst, statt zur Bringschuld des Browsers) – die Episode offenbarte etwas Wichtiges darüber, wer Firefox nutzt: Das ist das datenschutzbewussteste, Open-Source-orientierteste Publikum im Web.
Und hier ist das, von dem diesen Nutzern ständig gesagt wird, sie könnten es nicht haben: KI, die tatsächlich privat ist. Der Mainstream-Pitch lautet „schick deine Daten in unsere Cloud und vertrau uns“. Für einen Firefox-Nutzer ist das genau das Problem, nicht die Lösung.
Es gibt eine bessere Antwort, und sie verlangt nicht, irgendjemandem zu vertrauen.
Der private Weg, KI zu nutzen: das Modell lokal halten
Du musst dich nicht zwischen „nützlicher KI“ und „meine Daten bleiben meine“ entscheiden. Du kannst leistungsfähige KI-Modelle direkt auf deinem eigenen Computer laufen lassen – kein Konto, keine Cloud, keine Telemetrie – und sie dann direkt in Firefox nutzen.
Das Setup hat zwei Teile:
- Eine lokale Modell-Runtime wie Ollama oder LM Studio, die ein Open-Weight-Modell (Llama, Mistral, Qwen, DeepSeek) herunterlädt und auf deiner Hardware ausführt. Einmal heruntergeladen, funktioniert es offline. Nichts, was du tippst, geht an einen Server.
- Eine Browser-Erweiterung, die Firefox mit diesem lokalen Modell verbindet und ihm die Seite zuführt, die du liest, sodass du Fragen zum Bildschirminhalt stellen kannst, ohne irgendetwas in ein Cloud-Tool zu kopieren.
Das ist der ganze Stack. Wenn er verkabelt ist, hast du einen KI-Assistenten in Firefox, bei dem der Seiteninhalt und deine Eingaben nie deinen Rechner verlassen. Das ist nicht „wir versprechen, nicht hinzuschauen“. Das ist es gibt nichts anzuschauen.
Die Einrichtung in Firefox
Schritt 1 — Ein Modell lokal ausführen
Wenn du noch keines hast, fang mit Ollama an. Es ist kostenlos, Open Source und zwei Befehle:
# Install (Mac/Linux)
curl -fsSL https://ollama.com/install.sh | sh
# Download and run a model
ollama run llama3.2Unter Windows holst du dir den Installer von ollama.com. Ein Laptop mit 16 GB RAM bewältigt die meisten Alltagsmodelle komfortabel. Unsere vollständige Ollama-Anleitung behandelt, welches Modell du wählen solltest und welche Hardware du brauchst. Lieber eine grafische App? LM Studio erledigt dieselbe Aufgabe mit einer Point-and-Click-Oberfläche.
Schritt 2 — Lass deinen Browser mit dem Modell sprechen
Ollama erlaubt Browser-Verbindungen nur, wenn du es ihm sagst. Starte es mit aktiviertem Browser-Zugriff:
# Mac/Linux
OLLAMA_ORIGINS="*" ollama serve
# Windows (PowerShell)
$env:OLLAMA_ORIGINS="*"; ollama serveSiehst du einen Fehler „port 11434 already in use“? Die Ollama-App läuft bereits im Hintergrund. Beende sie zuerst (Menüleiste auf dem Mac, System-Tray unter Windows), dann führe den Befehl erneut aus.
Schritt 3 — SurfMind für Firefox installieren
Hol dir SurfMind aus den Firefox-Add-ons und hefte es an. SurfMind ist ein Browser-Assistent, der lokale Modelle ins Zentrum stellt – genau das, was diesem Publikum gefehlt hat: ein ausgefeiltes Tool für normale Nutzer, das nicht voraussetzt, dass du deine Daten einer Cloud übergibst.
Schritt 4 — Dein lokales Modell verbinden
Öffne SurfMind auf einer beliebigen Seite, klick auf den Modellnamen, um die Auswahl zu öffnen, und wechsel zum Tab Custom → Add Custom Models. Wähle das Ollama-Preset, und es füllt alles automatisch aus:
- API URL:
http://localhost:11434/api/chat - Models URL:
http://localhost:11434/api/tags - API Key: (keiner nötig)
Speichern. SurfMind verbindet sich mit deinem lokalen Ollama und listet die Modelle auf, die du installiert hast. Wähle eines, und du bist fertig.
Öffne jetzt eine beliebige Webseite – den Artikel, die Dokumentation, das dichte PDF, die Nutzungsbedingungen, die du nie in ChatGPT einfügen würdest – und frag einfach. Die Antwort kommt von einem Modell, das auf deinem eigenen Rechner läuft.
Warum das speziell zu Firefox passt
- Offene Gewichte für einen offenen Browser. Du führst Open-Source-Modelle in einem Open-Source-Browser aus. Keine Blackboxes auf beiden Seiten.
- Wirklich null Telemetrie auf deinem Inhalt. Lokale Modelle bedeuten, dass deine Eingaben und die Seite, die du liest, auf deinem Gerät bleiben. Es gibt keinen Cloud-Umweg, den man abwählen müsste.
- Es funktioniert offline. Im Flugzeug, bei schlechtem Hotel-WLAN, während eines Ausfalls – deine lokale KI funktioniert weiter.
- Du bist nicht eingesperrt. Tausche Modelle frei aus. Lass morgen ein anderes laufen. Niemand ändert dir das Modell oder den Preis unter den Füßen.
Und wenn du doch einmal für eine schwere Aufgabe nach einem großen Cloud-Modell greifen willst, lässt SurfMind das zu – zu deinen Bedingungen, mit deinem eigenen Schlüssel (BYOK), pro Aufgabe umschaltbar. Der Punkt ist nicht, dass Cloud-KI böse ist. Der Punkt ist, dass du entscheidest, wann irgendetwas deinen Rechner verlässt – und die Voreinstellung ist, dass es das nicht tut.
Ein ehrlicher Vorbehalt
Lokale Modelle sind kleiner als die riesigen Cloud-Modelle, also wirst du bei den schwersten Denkaufgaben einen Unterschied bemerken. Für den Alltag – Zusammenfassen, Erklären, Entwerfen, Fragen-und-Antworten zu einer Seite – sind sie mehr als gut genug, und die Qualität ist schnell gestiegen.
Wenn die Arbeit komplexer wird, macht SurfMind die Übergabe einfach. Bleib für private Seiten standardmäßig lokal und wechsle dann in derselben Sidebar zu einem größeren Modell wie Claude, GPT oder Gemini, wenn du tieferes Denken, stärkeres Schreiben oder mehr Kontext brauchst. Diese größeren Modelle sind immer noch deine Wahl, dann, wenn die Aufgabe es wert ist, nach außen zu gehen.
Ein privates KI-Setup, das zu Firefox passt
Du hast Firefox gewählt, um die Kontrolle zu behalten. KI hinzuzufügen muss das nicht aufgeben. Lass ein Modell lokal laufen, verbinde es mit SurfMind, und du hast einen leistungsfähigen Assistenten auf jeder Seite, die du besuchst – wobei deine Daten genau dort bleiben, wo sie hingehören.
Richte es noch heute Nachmittag ein. Öffne SurfMind beim nächsten, das du ohnehin lesen wolltest, und erlebe, wie es sich anfühlt, KI zu nutzen, die nichts zu berichten hat.
Private KI, im Browser, dem du bereits vertraust.
Ähnliche Beiträge
Alle anzeigenDie besten Browser-Erweiterungen für lokale KI-Modelle 2026 (Ollama, LM Studio & mehr)
Die besten Browser-Erweiterungen, um lokale KI-Modelle 2026 auszuführen – von ausgefeilten Local-und-Cloud-Sidebars bis zu Open-Source-Tools für Ollama. Chatte mit jeder Seite, privat.
Wie man Ollama nutzt, um mit jeder Webseite zu chatten
Führen Sie KI-Modelle lokal oder in der Cloud mit Ollama aus und verwenden Sie dann SurfMind, um privat und kostenlos mit jeder Webseite zu chatten.
Ollama vs. LM Studio: Welches lokale KI-Tool passt zu dir?
Ein praktischer, nüchterner Vergleich von Ollama und LM Studio für das lokale Ausführen von KI-Modellen im Jahr 2026 – plus, wie du mit beiden mit jeder Webseite chatten kannst.