100% offline
Lade ein Sprachmodell einmal herunter und nutze es ohne Internet. Keine Cloud, keine API.
13 kuratierte Modelle
Llama 3.2, Phi-4 Mini, Qwen 2.5, Gemma 3, SmolLM3 und mehr — direkt von Hugging Face.
Apple Metal beschleunigt
Native Inferenz mit llama.cpp und der Metal-GPU deines iPhones. Streaming Token für Token.
Keine Konten
Keine Anmeldung, keine Telemetrie, keine Werbung. Eine App. Ein Modell. Eine Konversation.
Welche Modelle?
- Llama 3.2 1B / 3B Instruct — Meta's Flaggschiff für die Hosentasche
- Qwen 2.5 0.5B / 1.5B / 3B — Alibaba, stark in Code und Mathe
- Phi-3.5 Mini & Phi-4 Mini — Microsoft, top-Reasoning bei kleiner Größe
- Gemma 2 2B & Gemma 3 1B / 4B — Google, freundlich und multilingual
- SmolLM2 1.7B & SmolLM3 3B — Hugging Face, voll offen
- TinyLlama 1.1B Chat — der Speed-Baseline
Was Lokalo nicht macht
- Daten sammeln
- Tracking oder Analytics
- Werbung
- Versteckte In-App-Käufe
- Konten oder Logins erfordern