Self-Hosted in Deutschland • DSGVO-konform • OpenAI-kompatibel

Ihre Daten bleiben Ihre Daten.

Leistungsstarke LLMs über eine OpenAI-kompatible API. Gehostet in Deutschland, pay-per-token, sofort einsatzbereit — ohne Datenabgabe an US-Hyperscaler.

curl
curl https://api.simosphereai.com/v1/chat/completions \
  -H "Authorization: Bearer sk-simo-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3-8b",
    "messages": [{"role": "user", "content": "Hallo!"}]
  }'

Compliance & Vertrauen

DSGVO

Vollstaendig konform

EU AI Act

Art. 10 / Art. 27 erfüllt

ISO 27001

Zertifizierung in Vorbereitung

SOC2 Type II

Audit für 2026 geplant

Alles, was Sie brauchen — in einer Plattform

Von der schnellen Inferenz bis zum Compliance-Trail: SIMOSphere AI deckt den vollen Lebenszyklus produktiver KI-Anwendungen ab.

OpenAI-kompatibel

Drop-in Replacement. Ändern Sie nur die Base-URL — Ihre bestehende Integration funktioniert sofort.

DSGVO-konform

Gehostet auf dedizierten Servern in Deutschland. Ihre Daten verlassen nie die EU.

Pay per Token

Keine versteckten Kosten. Zahlen Sie nur für die Tokens, die Sie tatsaechlich verbrauchen.

7 Modelle

Von schnellem 8B bis leistungsstarkem 30B — waehlen Sie das richtige Modell für Ihren Use Case.

GPU-beschleunigt

NVIDIA RTX 6000 GPUs mit bis zu 16 parallelen Inference-Slots für minimale Latenz.

Token-Metering

Transparente Abrechnung über Stripe. Dashboard mit Echtzeit-Verbrauchsanalyse.

BYOK — Bring Your Own Key

Eigene API-Keys für OpenAI, Anthropic, Google sealed verschlüsselt hinterlegen. Sie behalten die Vertragsbeziehung mit Ihrem Provider.

Tamper-Resistant Audit

Append-Only Audit-Trail mit Postgres-Trigger und künftiger Hash-Chain. Compliance-Prüfer sehen jede Änderung lückenlos.

Verfuegbare Modelle

Alle Modelle sind über die gleiche API erreichbar. Waehlen Sie pro Request das optimale Modell.

Qwen3-8B

Default / Apache 2.0

8B (Native Tool-Use)qwen/qwen3-8b

Input0.15 EUR/1M
Output0.60 EUR/1M

Apertus 8B

EU / Apache 2.0

8B (ETH Zurich / Swiss AI)swiss-ai/apertus-8b-instruct-2509

Input0.15 EUR/1M
Output0.60 EUR/1M

Qwen3-30B

Premium / Apache 2.0

30B MoE (Premium)qwen/qwen3-30b

Input0.40 EUR/1M
Output1.60 EUR/1M
Compliance by Design

Sicherheit & Compliance auf jeder Schicht

Wir bauen Compliance in den Code ein, nicht nachtraeglich um ihn herum. DSGVO Art. 25 (Privacy by Design), EU AI Act Art. 10 (Datenqualitaet), BSI IT-Grundschutz — überprüfbar im Audit.

PII-Redaction by Default

E-Mail-Adressen, Telefonnummern und IBANs werden vor dem Versand an externe Modelle automatisch durch Platzhalter ersetzt und in der Antwort wiederhergestellt — auch im Streaming.

DSGVO Art. 25 • EU AI Act Art. 10

Append-Only Audit-Trail

Jede administrative Aktion wird unwiderruflich protokolliert. Postgres-Trigger blockiert UPDATE und DELETE — manipulationssicher selbst für Insider.

SOC2-CC7.2 • ISO 27001 A.12.4

Multi-Region EU

Frankfurt-First-Routing mit optionalem Hard-Lock auf EU-Datenstandort. Failover nur in zugelassene Regionen.

DSGVO Art. 44-49

Enterprise SSO

SAML 2.0 und OIDC mit JIT-Provisioning. Microsoft Entra, Okta und Google Workspace direkt unterstützt. Sealed Client-Secrets, keine Klartext-Fallbacks in Produktion.

BSI TR-03124-1 • NIST SP 800-63

Neu in v1.6.0

CI Documentor — Ihre Dokumente, Ihr Branding

Jedes generierte Dokument automatisch im Corporate Identity Ihres Unternehmens. Logo, Farben, Fonts und Sprache — wiederholbar und konsistent über alle Ausgabeformate.

PDF in Druckqualitaet

WeasyPrint + Ghostscript-Optimierung. Font-Subsetting, PDF/A-konforme Ausgabe.

Microsoft Office

DOCX und PPTX mit Logo, Farben und automatischen Dokumenteneigenschaften.

Mehrsprachig

Automatische Übersetzung DE↔EN vor dem Rendering. Wissenschaftlicher Sinntransfer.

Eigene Schriften

Google Fonts Auswahl oder eigene WOFF2 hochladen. Lokal gecached, keine externen Abhaengigkeiten.

Vorlagen-System

Lueckentexte mit {{Platzhaltern}} aus dem LLM-Kontext automatisch befuellt.

Wiederholbar

Gleiche Eingabe → gleicher Output. Konsistent über alle Mitarbeiter und Anwendungen.

Vertrauen führender deutscher Unternehmen

CUSTOMER 1
CUSTOMER 2
CUSTOMER 3
CUSTOMER 4
CUSTOMER 5

So setzen Kunden SIMOSphere AI ein

Drei typische Profile aus dem deutschen Mittelstand. Klicken auf das Profil zeigt das vollständige Setup.

B2B-SaaS · 50 Mitarbeiter

Drop-in für die bestehende OpenAI-Integration

  1. 1Base-URL in der bestehenden App von api.openai.com auf api.simosphereai.com umstellen.
  2. 2API-Key tauschen (sk-simo-... statt sk-...). Der Code bleibt unverändert.
  3. 3BYOK-Routing aktivieren: Kostspielige Sonderfälle weiterhin direkt zu OpenAI, Standard-Anfragen on-prem in Aschaffenburg.
Ergebnis
65% niedrigere Token-Kosten · DSGVO-Audit bestanden
Versicherung · 800 Mitarbeiter

On-Premise mit Audit-Trail für die Aufsichtsbehörde

  1. 1Multi-Region-EU mit Hard-Lock aktivieren — keine Anfrage verlässt das deutsche Rechenzentrum.
  2. 2PII-Redaction im Streaming für jede Kunden-Anfrage. Auditor sieht nur Platzhalter.
  3. 3Hash-Chain Audit-Log mit R2-Snapshot für jede einzelne LLM-Antwort.
Ergebnis
BaFin-Vorprüfung bestanden · Kein Eskalations-Vorfall in 9 Monaten
Beratung · 25 Mitarbeiter

Gebrandete PDF/DOCX direkt aus dem Chat

  1. 1Corporate-Identity einmalig hochladen: Logo, Farben, Fonts.
  2. 2CI-Documentor-Skill aktivieren. Jede Antwort kann als Markenkonform-PDF exportiert werden.
  3. 3Mehrsprachige Auslieferung (DE/EN/FR/ES) je Kunde mit identischem Layout.
Ergebnis
4h pro Berater pro Woche eingespart

Transparente Preise

Monatliche Grundgebuehr + Pay-per-Token. Keine versteckten Kosten, jederzeit kuendbar.

Free

Zum Ausprobieren — ohne Kreditkarte

0 EUR / Monat

100k Tokens inkl.

  • 100K Tokens / Monat
  • Nur Qwen3-8B
  • 10 RPM, 100 RPD
  • 5 Credits / Monat für Premium-Features
  • Community-Support
Kostenlos starten

Starter

Für Solo-Devs und Prototypen

9 EUR / Monat

5M Tokens inkl. · +0.25 €/1M Overage

  • 5M Tokens / Monat inkl.
  • Qwen3-8B + Apertus
  • 30 RPM
  • 100 Credits / Monat
  • E-Mail-Support
Plan waehlen
Beliebt

Professional

Für produktive Anwendungen und kleine Teams

39 EUR / Monat

50M Tokens inkl. · +0.20 €/1M Overage

  • 50M Tokens / Monat inkl.
  • Alle Modelle inkl. Qwen3-30B + BYOK
  • 90 RPM, BYOK-Routing
  • 500 Credits / Monat
  • Webhooks & Audit-Export
  • E-Mail-Support (24h)
Plan waehlen

Business

Für wachsende Teams und Agenturen

99 EUR / Monat

250M Tokens inkl. · +0.15 €/1M Overage

  • 250M Tokens / Monat inkl.
  • Alle Modelle + Workspace-Add-on bereit
  • 240 RPM
  • 1500 Credits / Monat
  • Priority-Support
  • Quartalsweises Business-Review
Plan waehlen

Enterprise

Für regulierte Branchen und Compliance

299 EUR / Monat

1000M Tokens inkl. · +0.10 €/1M Overage

  • 1B Tokens / Monat inkl.
  • Alle Modelle + Multi-Region-EU-Lock
  • 600 RPM, dedizierter Support
  • 5000 Credits / Monat
  • SAML / OIDC SSO + Audit-Hash-Chain
  • SLA 99,5% & persönlicher Ansprechpartner
Plan waehlen

Was kostet SIMOSphere AI Ihr Unternehmen?

Schieben Sie die Regler auf Ihren tatsächlichen Bedarf. Vergleich mit OpenAI gpt-4o-Listenpreisen automatisch.

Input-Tokens500K / Tag
Output-Tokens150K / Tag
SIMOSphere AI
4.95
/ Monat
OpenAI gpt-4o (Referenz)
75.90
Sie sparen €70.95 (93%)

Listenpreise zur Orientierung. Tatsächliche Kosten hängen vom Modell, von Caching-Hits und vom gewählten Plan ab. Stand 2026-05-04.

OpenAI vs SIMOSphere AI

Die zwölf Punkte, die im deutschen B2B-Compliance-Audit zählen.

MerkmalOpenAISIMOSphere AI
DSGVO-Hosting in der EUSub-Verarbeiter in den USAAschaffenburg / DE
EU-Daten-Residenz
Preis-TransparenzNutzungsbasiert, Aufschläge möglichPay-per-Token, keine Aufschläge
Bring Your Own Key
CI Documentor (PDF/DOCX)
Hash-Chain Audit-Trail
PII-Streaming-Redaction
SAML / OIDC SSONur Enterprise (ab $25k/Jahr)Ab Enterprise-Plan
White-Label / Custom Domain
Preis pro 1M Tokens (Standard)€2.30 / €9.20€0.15 / €0.60
Setup-GebührBei Enterprise üblich
Kündigung30 TageZum Periodenende
Neu — verfügbar ab Q3 2026

SIMOSphere AI Workspace

Microsoft Teams trifft ChatGPT — DSGVO-konform, on-prem in Deutschland. Messaging, KI-Chat und Custom-Provider in einem Arbeitsplatz. Per Seat abgerechnet, transparent ab dem ersten Nutzer.

Buchung läuft sofort, Workspace-Zugang wird mit Launch im Q3 2026 freigeschaltet. Bis dahin keine Abrechnung.

Starter

Für Einzelanwender und Pilotteams

€49 / Seat / Monat

Mindestens 1 Seat(s)

  • 3 Workspaces
  • 1 GB Speicher pro Seat
  • MasterLLM (qwen/qwen3-8b)
  • Skills + freigegebene MCP-Server
Vorbestellung sichern
Beliebt

Professional

Für produktive Teams ab 5 Personen

€49 / Seat / Monat

Mindestens 5 Seat(s)

  • Unbegrenzte Workspaces
  • 10 GB Speicher pro Seat
  • Custom Provider (OpenAI, Anthropic, Mistral, ...)
  • Eigene Skills (max 5)
  • Erweitertes Audit-Log
Vorbestellung sichern

Enterprise

Für Organisationen ab 50 Personen

€49 / Seat / Monat

Mindestens 50 Seat(s)

  • Unbegrenzte Workspaces
  • 100 GB Speicher pro Seat
  • Eigene MCP-Server
  • Unbegrenzt eigene Skills
  • White-Label / Custom Domain
  • Priority Support 24/7
Vorbestellung sichern

Haeufige Fragen

Was Vertrieb, IT und Compliance am häufigsten wissen wollen — in einem Satz beantwortet.

Schnellstart in 2 Minuten

# 1. API Key holen (nach Registrierung)
export SIMO_API_KEY="sk-simo-..."

# 2. Erste Anfrage senden
curl https://api.simosphereai.com/v1/chat/completions \
  -H "Authorization: Bearer $SIMO_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen/qwen3-8b", "messages": [{"role": "user", "content": "Hello!"}]}'

# 3. OpenAI SDK verwenden (Python)
from openai import OpenAI
client = OpenAI(base_url="https://api.simosphereai.com/v1", api_key="sk-simo-...")
response = client.chat.completions.create(
    model="qwen/qwen3-8b",
    messages=[{"role": "user", "content": "Hello!"}]
)
print(response.choices[0].message.content)

Bereit für souveraene KI?

30 Sekunden Registrierung, sofortiger API-Zugang. Keine Kreditkarte für den Starter-Plan nötig.