Mac mini macht Steuerung
Auth, Session-State, Routing, RAG-Orchestrierung, Rechtefilter, Tool-Governance, Audit und Status. Keine Inferenz.
Technischer Architekturbeleg von Slavko Klincov, MSc: Mac mini als Control Plane, zwei Mac Studio Standalone-Replicas mit lokalem RAG-Stack je Studio, private LLM-Runtime, Tool-Governance, Policy und Audit.
Die alte Cluster-Architektur bleibt nur als historische Referenz erhalten. Diese Version 2 ist die neue Arbeitsgrundlage fuer das Kundenprojekt.
Qdrant, SQLite, Embeddings, Reranker und Quellenregister sind Teil des lokalen Studio-Stacks. Studio A kann initial Primary fuer Ingestion und Snapshots sein; Studio B bekommt denselben Stand per definiertem Sync, Snapshot oder Rebuild. So kann der Mac mini Requests auf beide Studios routen, ohne RAG als dritten Hardwareblock darzustellen.
Auth, Session-State, Routing, RAG-Orchestrierung, Rechtefilter, Tool-Governance, Audit und Status. Keine Inferenz.
Studio A und Studio B laufen als Kopien des Inference-Pfads. Last wird pro Request oder Session verteilt.
Qdrant plus SQLite ist auf beiden Studios vorhanden. Die Runtime bekommt nur freigegebenen Kontext.
FortiGate, Jira, Confluence, CMDB und Logs laufen ueber unseren Broker. Das Modell entscheidet nicht direkt ueber echte Systeme.