Supportagentlive

Wie setze ich die Abrechnung zurück?

Hier sind die drei Schritte

Leads heute

+38% diese Woche

$ geist deploy agent

Modell wird gebaut

ok live in Produktion

p95-Latenz 240ms

Red Teamingbestanden

Prompt Injectionblockiert

Datenleckkeins

Jailbreakblockiert

Wissenssuche

Unsere Rückgaberichtlinie finden

policy.pdf · Seite 4

terms.md · Abschnitt 2

Automatisierungauto

PosteingangAgentCRM

1.204 Läufe heute

Supportagentlive

Wie setze ich die Abrechnung zurück?

Hier sind die drei Schritte

Leads heute

+38% diese Woche

$ geist deploy agent

Modell wird gebaut

ok live in Produktion

p95-Latenz 240ms

Red Teamingbestanden

Prompt Injectionblockiert

Datenleckkeins

Jailbreakblockiert

Wissenssuche

Unsere Rückgaberichtlinie finden

policy.pdf · Seite 4

terms.md · Abschnitt 2

Automatisierungauto

PosteingangAgentCRM

1.204 Läufe heute

Red Teamingbestanden

Prompt Injectionblockiert

Datenleckkeins

Jailbreakblockiert

Wissenssuche

Unsere Rückgaberichtlinie finden

policy.pdf · Seite 4

terms.md · Abschnitt 2

Automatisierungauto

PosteingangAgentCRM

1.204 Läufe heute

Supportagentlive

Eine Mail zum Nachfassen entwerfen

Erledigt, wird gesendet

Rechnungen gelesen

Betrag4.820 €

Fällig14 Tage

Lieferanterkannt

> rag-pipeline scannen

12.400 Dokumente indexiert

ok Guardrails aktiv

0 Lecks gefunden

Red Teamingbestanden

Prompt Injectionblockiert

Datenleckkeins

Jailbreakblockiert

Wissenssuche

Unsere Rückgaberichtlinie finden

policy.pdf · Seite 4

terms.md · Abschnitt 2

Automatisierungauto

PosteingangAgentCRM

1.204 Läufe heute

Supportagentlive

Eine Mail zum Nachfassen entwerfen

Erledigt, wird gesendet

Rechnungen gelesen

Betrag4.820 €

Fällig14 Tage

Lieferanterkannt

> rag-pipeline scannen

12.400 Dokumente indexiert

ok Guardrails aktiv

0 Lecks gefunden

Zurück zur ÜbersichtPlattform

specter

Wir greifen Ihre KI an, bevor es jemand anderes tut, und härten sie dann, bis sie hält.

specter ist die Plattform von geist für Red Teaming und die Sicherheit von KI, und das ist unsere Kernkompetenz. Wenn ein Unternehmen KI einsetzt, kann diese KI auch ausgetrickst, manipuliert oder zum Verraten von Geheimnissen gebracht werden. specter prüft Systeme mit KI so, wie es ein echter Angreifer tun würde, im Auftrag des Kunden, um die Lücken zuerst zu finden und zu schließen.

Die meisten Anbieter liefern einen Chatbot und ziehen weiter. Wir greifen dieselben Systeme an, die wir bauen, prüfen auf Prompt Injection, Jailbreaks und Datenabfluss, bis sie halten. Das Ergebnis ist Sicherheit, die Sie einem Auditor zeigen können, kein Versprechen auf einer Folie.

Live-Demo

Was es macht

Red Teaming für LLMs und Tests auf Jailbreaks

In Ihrem Auftrag versuchen wir, Ihre KI zu Dingen zu bewegen, die sie nicht tun darf, und melden die genaue Schwachstelle. Wir testen, ob sich Ihr Bot im Support überreden lässt, interne Rabatte oder Daten herauszugeben.

Audits auf Prompt Injection

Wir prüfen, ob jemand Ihrer KI über versteckten Text im Input oder in Ihrer RAG-Pipeline heimliche Befehle unterschieben kann. Ein präpariertes Dokument darf Ihre KI niemals umsteuern können.

Härten gegen Jailbreaks

Wir bauen Ihre Systemprompts und Guardrails so um, dass sich das Modell nicht mehr zu verbotenen Antworten überreden lässt. Härten heißt: Es hält auch noch, wenn wir fertig sind, nicht nur am Tag des Tests.

Tests auf Datenabfluss

Wir prüfen, ob die KI unter geschickten Fragen vertrauliche Daten, Kundendatensätze oder interne Schlüssel preisgibt, damit ein Leck von uns gefunden wird und nicht von einem Angreifer.

Sicherheitsaudits für Agenten

Für KI, die selbst Aktionen ausführt, etwa Mails senden oder Bestellungen auslösen, prüfen wir, ob sie dazu gebracht werden kann, das Falsche zu tun, zum Beispiel versehentlich Geld zu überweisen.

Adversarial Testing und Pentests

Wir nutzen unzensierte Modelle als Angriffswerkzeug, um Lücken zu finden, die ein normaler Test übersieht, fahren Bug-Bountys für KI und beschleunigen klassische Pentests mit KI im Prozess.

In der Praxis

Bevor ein Händler seinen kundenseitigen Chatbot live schaltete, griff specter ihn per Red Teaming an. Im Test brachten wir den Bot über eine mehrstufige Prompt Injection dazu, eine interne Rabattregelung preiszugeben, und schrieben dann seinen Systemprompt und seine Guardrails so um, dass derselbe Angriff nichts mehr lieferte. Der Launch ging mit einem Bericht raus, den der Vorstand lesen konnte.

Was Sie bekommen

Schwachstellen zuerst von uns gefunden, bevor ein echter Angreifer oder eine Aufsicht sie findet
Prompt Injection, Jailbreaks und Datenlecks getestet, nicht einfach vorausgesetzt
Guardrails und Systemprompts gehärtet, damit sie nach dem Test halten
Ein klarer Bericht, den Sie Auditor, Vorstand und Kunden zeigen können
Gegen die OWASP LLM Top 10 getestet und am NIST AI RMF ausgerichtet

Fragen

Testen Sie nur KI, die Sie gebaut haben, oder auch unsere?

Beides. specter prüft per Red Teaming Systeme, die wir in forge gebaut haben, und ebenso KI, die Sie bereits von anderen Anbietern betreiben. Ist es ein LLM, ein Agent oder eine RAG-Pipeline, können wir es in Ihrem Auftrag angreifen und genau berichten, wo es bricht.

Was bekommen wir am Ende konkret?

Ein Sicherheitsaudit mit klarem Bericht: wo das System gebrochen werden kann, wie schwer jeder Befund wiegt und was wir geändert haben oder zu ändern empfehlen, um die Lücke zu schließen. Sie können specter auch als laufende Überwachung weiterführen.

Warum ist Red Teaming Ihre Kernkompetenz?

Weil wir überzeugt sind: KI, die Sie nicht verteidigen können, ist ein Risiko. Wir greifen alles, was wir ausliefern, mit denselben Werkzeugen an, die ein Angreifer nutzen würde, damit Sicherheit von Anfang an eingebaut ist und nicht erst nach einem Vorfall nachgerüstet wird.

Loslegen

Lassen Sie uns Ihre KI zuerst angreifen

Buchen Sie 30 Minuten mit uns, und wir umreißen ein Engagement per Red Teaming für die KI, die Sie heute betreiben.