Leistungsstarke LLMs über eine OpenAI-kompatible API. Gehostet in Deutschland, pay-per-token, sofort einsatzbereit — ohne Datenabgabe an US-Hyperscaler.
curl https://api.simosphereai.com/v1/chat/completions \
-H "Authorization: Bearer sk-simo-..." \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen3-8b",
"messages": [{"role": "user", "content": "Hallo!"}]
}'Compliance & Vertrauen
DSGVO
Vollstaendig konform
EU AI Act
Art. 10 / Art. 27 erfüllt
ISO 27001
Zertifizierung in Vorbereitung
SOC2 Type II
Audit für 2026 geplant
Von der schnellen Inferenz bis zum Compliance-Trail: SIMOSphere AI deckt den vollen Lebenszyklus produktiver KI-Anwendungen ab.
Drop-in Replacement. Ändern Sie nur die Base-URL — Ihre bestehende Integration funktioniert sofort.
Gehostet auf dedizierten Servern in Deutschland. Ihre Daten verlassen nie die EU.
Keine versteckten Kosten. Zahlen Sie nur für die Tokens, die Sie tatsaechlich verbrauchen.
Von schnellem 8B bis leistungsstarkem 30B — waehlen Sie das richtige Modell für Ihren Use Case.
NVIDIA RTX 6000 GPUs mit bis zu 16 parallelen Inference-Slots für minimale Latenz.
Transparente Abrechnung über Stripe. Dashboard mit Echtzeit-Verbrauchsanalyse.
Eigene API-Keys für OpenAI, Anthropic, Google sealed verschlüsselt hinterlegen. Sie behalten die Vertragsbeziehung mit Ihrem Provider.
Append-Only Audit-Trail mit Postgres-Trigger und künftiger Hash-Chain. Compliance-Prüfer sehen jede Änderung lückenlos.
Alle Modelle sind über die gleiche API erreichbar. Waehlen Sie pro Request das optimale Modell.
8B (Native Tool-Use) • qwen/qwen3-8b
8B (ETH Zurich / Swiss AI) • swiss-ai/apertus-8b-instruct-2509
30B MoE (Premium) • qwen/qwen3-30b
Wir bauen Compliance in den Code ein, nicht nachtraeglich um ihn herum. DSGVO Art. 25 (Privacy by Design), EU AI Act Art. 10 (Datenqualitaet), BSI IT-Grundschutz — überprüfbar im Audit.
E-Mail-Adressen, Telefonnummern und IBANs werden vor dem Versand an externe Modelle automatisch durch Platzhalter ersetzt und in der Antwort wiederhergestellt — auch im Streaming.
DSGVO Art. 25 • EU AI Act Art. 10
Jede administrative Aktion wird unwiderruflich protokolliert. Postgres-Trigger blockiert UPDATE und DELETE — manipulationssicher selbst für Insider.
SOC2-CC7.2 • ISO 27001 A.12.4
Frankfurt-First-Routing mit optionalem Hard-Lock auf EU-Datenstandort. Failover nur in zugelassene Regionen.
DSGVO Art. 44-49
SAML 2.0 und OIDC mit JIT-Provisioning. Microsoft Entra, Okta und Google Workspace direkt unterstützt. Sealed Client-Secrets, keine Klartext-Fallbacks in Produktion.
BSI TR-03124-1 • NIST SP 800-63
Jedes generierte Dokument automatisch im Corporate Identity Ihres Unternehmens. Logo, Farben, Fonts und Sprache — wiederholbar und konsistent über alle Ausgabeformate.
WeasyPrint + Ghostscript-Optimierung. Font-Subsetting, PDF/A-konforme Ausgabe.
DOCX und PPTX mit Logo, Farben und automatischen Dokumenteneigenschaften.
Automatische Übersetzung DE↔EN vor dem Rendering. Wissenschaftlicher Sinntransfer.
Google Fonts Auswahl oder eigene WOFF2 hochladen. Lokal gecached, keine externen Abhaengigkeiten.
Lueckentexte mit {{Platzhaltern}} aus dem LLM-Kontext automatisch befuellt.
Gleiche Eingabe → gleicher Output. Konsistent über alle Mitarbeiter und Anwendungen.
Vertrauen führender deutscher Unternehmen
Drei typische Profile aus dem deutschen Mittelstand. Klicken auf das Profil zeigt das vollständige Setup.
Monatliche Grundgebuehr + Pay-per-Token. Keine versteckten Kosten, jederzeit kuendbar.
Zum Ausprobieren — ohne Kreditkarte
100k Tokens inkl.
Für Solo-Devs und Prototypen
5M Tokens inkl. · +0.25 €/1M Overage
Für produktive Anwendungen und kleine Teams
50M Tokens inkl. · +0.20 €/1M Overage
Für wachsende Teams und Agenturen
250M Tokens inkl. · +0.15 €/1M Overage
Für regulierte Branchen und Compliance
1000M Tokens inkl. · +0.10 €/1M Overage
Schieben Sie die Regler auf Ihren tatsächlichen Bedarf. Vergleich mit OpenAI gpt-4o-Listenpreisen automatisch.
Listenpreise zur Orientierung. Tatsächliche Kosten hängen vom Modell, von Caching-Hits und vom gewählten Plan ab. Stand 2026-05-04.
Die zwölf Punkte, die im deutschen B2B-Compliance-Audit zählen.
| Merkmal | OpenAI | SIMOSphere AI |
|---|---|---|
| DSGVO-Hosting in der EU | Sub-Verarbeiter in den USA | Aschaffenburg / DE |
| EU-Daten-Residenz | ||
| Preis-Transparenz | Nutzungsbasiert, Aufschläge möglich | Pay-per-Token, keine Aufschläge |
| Bring Your Own Key | ||
| CI Documentor (PDF/DOCX) | ||
| Hash-Chain Audit-Trail | ||
| PII-Streaming-Redaction | ||
| SAML / OIDC SSO | Nur Enterprise (ab $25k/Jahr) | Ab Enterprise-Plan |
| White-Label / Custom Domain | ||
| Preis pro 1M Tokens (Standard) | €2.30 / €9.20 | €0.15 / €0.60 |
| Setup-Gebühr | Bei Enterprise üblich | |
| Kündigung | 30 Tage | Zum Periodenende |
Microsoft Teams trifft ChatGPT — DSGVO-konform, on-prem in Deutschland. Messaging, KI-Chat und Custom-Provider in einem Arbeitsplatz. Per Seat abgerechnet, transparent ab dem ersten Nutzer.
Buchung läuft sofort, Workspace-Zugang wird mit Launch im Q3 2026 freigeschaltet. Bis dahin keine Abrechnung.
Für Einzelanwender und Pilotteams
Mindestens 1 Seat(s)
Für produktive Teams ab 5 Personen
Mindestens 5 Seat(s)
Für Organisationen ab 50 Personen
Mindestens 50 Seat(s)
Was Vertrieb, IT und Compliance am häufigsten wissen wollen — in einem Satz beantwortet.
# 1. API Key holen (nach Registrierung)
export SIMO_API_KEY="sk-simo-..."
# 2. Erste Anfrage senden
curl https://api.simosphereai.com/v1/chat/completions \
-H "Authorization: Bearer $SIMO_API_KEY" \
-H "Content-Type: application/json" \
-d '{"model": "qwen/qwen3-8b", "messages": [{"role": "user", "content": "Hello!"}]}'
# 3. OpenAI SDK verwenden (Python)
from openai import OpenAI
client = OpenAI(base_url="https://api.simosphereai.com/v1", api_key="sk-simo-...")
response = client.chat.completions.create(
model="qwen/qwen3-8b",
messages=[{"role": "user", "content": "Hello!"}]
)
print(response.choices[0].message.content)30 Sekunden Registrierung, sofortiger API-Zugang. Keine Kreditkarte für den Starter-Plan nötig.