Zurück zur ÜbersichtPlattform

specter

Wir greifen Ihre KI an, bevor es jemand anderes tut, und härten sie dann, bis sie hält.

specter ist die Plattform von geist für Red Teaming und die Sicherheit von KI, und das ist unsere Kernkompetenz. Wenn ein Unternehmen KI einsetzt, kann diese KI auch ausgetrickst, manipuliert oder zum Verraten von Geheimnissen gebracht werden. specter prüft Systeme mit KI so, wie es ein echter Angreifer tun würde, im Auftrag des Kunden, um die Lücken zuerst zu finden und zu schließen.

Die meisten Anbieter liefern einen Chatbot und ziehen weiter. Wir greifen dieselben Systeme an, die wir bauen, prüfen auf Prompt Injection, Jailbreaks und Datenabfluss, bis sie halten. Das Ergebnis ist Sicherheit, die Sie einem Auditor zeigen können, kein Versprechen auf einer Folie.

Was es macht

Red Teaming für LLMs und Tests auf Jailbreaks

In Ihrem Auftrag versuchen wir, Ihre KI zu Dingen zu bewegen, die sie nicht tun darf, und melden die genaue Schwachstelle. Wir testen, ob sich Ihr Bot im Support überreden lässt, interne Rabatte oder Daten herauszugeben.

Audits auf Prompt Injection

Wir prüfen, ob jemand Ihrer KI über versteckten Text im Input oder in Ihrer RAG-Pipeline heimliche Befehle unterschieben kann. Ein präpariertes Dokument darf Ihre KI niemals umsteuern können.

Härten gegen Jailbreaks

Wir bauen Ihre Systemprompts und Guardrails so um, dass sich das Modell nicht mehr zu verbotenen Antworten überreden lässt. Härten heißt: Es hält auch noch, wenn wir fertig sind, nicht nur am Tag des Tests.

Tests auf Datenabfluss

Wir prüfen, ob die KI unter geschickten Fragen vertrauliche Daten, Kundendatensätze oder interne Schlüssel preisgibt, damit ein Leck von uns gefunden wird und nicht von einem Angreifer.

Sicherheitsaudits für Agenten

Für KI, die selbst Aktionen ausführt, etwa Mails senden oder Bestellungen auslösen, prüfen wir, ob sie dazu gebracht werden kann, das Falsche zu tun, zum Beispiel versehentlich Geld zu überweisen.

Adversarial Testing und Pentests

Wir nutzen unzensierte Modelle als Angriffswerkzeug, um Lücken zu finden, die ein normaler Test übersieht, fahren Bug-Bountys für KI und beschleunigen klassische Pentests mit KI im Prozess.

In der Praxis

Bevor ein Händler seinen kundenseitigen Chatbot live schaltete, griff specter ihn per Red Teaming an. Im Test brachten wir den Bot über eine mehrstufige Prompt Injection dazu, eine interne Rabattregelung preiszugeben, und schrieben dann seinen Systemprompt und seine Guardrails so um, dass derselbe Angriff nichts mehr lieferte. Der Launch ging mit einem Bericht raus, den der Vorstand lesen konnte.

Was Sie bekommen

  • Schwachstellen zuerst von uns gefunden, bevor ein echter Angreifer oder eine Aufsicht sie findet
  • Prompt Injection, Jailbreaks und Datenlecks getestet, nicht einfach vorausgesetzt
  • Guardrails und Systemprompts gehärtet, damit sie nach dem Test halten
  • Ein klarer Bericht, den Sie Auditor, Vorstand und Kunden zeigen können
  • Gegen die OWASP LLM Top 10 getestet und am NIST AI RMF ausgerichtet

Fragen

Testen Sie nur KI, die Sie gebaut haben, oder auch unsere?
Beides. specter prüft per Red Teaming Systeme, die wir in forge gebaut haben, und ebenso KI, die Sie bereits von anderen Anbietern betreiben. Ist es ein LLM, ein Agent oder eine RAG-Pipeline, können wir es in Ihrem Auftrag angreifen und genau berichten, wo es bricht.
Was bekommen wir am Ende konkret?
Ein Sicherheitsaudit mit klarem Bericht: wo das System gebrochen werden kann, wie schwer jeder Befund wiegt und was wir geändert haben oder zu ändern empfehlen, um die Lücke zu schließen. Sie können specter auch als laufende Überwachung weiterführen.
Warum ist Red Teaming Ihre Kernkompetenz?
Weil wir überzeugt sind: KI, die Sie nicht verteidigen können, ist ein Risiko. Wir greifen alles, was wir ausliefern, mit denselben Werkzeugen an, die ein Angreifer nutzen würde, damit Sicherheit von Anfang an eingebaut ist und nicht erst nach einem Vorfall nachgerüstet wird.
Loslegen

Lassen Sie uns Ihre KI zuerst angreifen

Buchen Sie 30 Minuten mit uns, und wir umreißen ein Engagement per Red Teaming für die KI, die Sie heute betreiben.

Gespräch von 30 Minuten · keine Slides, kein Blabla · wir antworten meist innerhalb eines Werktags.