specter
Wir greifen Ihre KI an, bevor es jemand anderes tut, und härten sie dann, bis sie hält.
specter ist die Plattform von geist für Red Teaming und die Sicherheit von KI, und das ist unsere Kernkompetenz. Wenn ein Unternehmen KI einsetzt, kann diese KI auch ausgetrickst, manipuliert oder zum Verraten von Geheimnissen gebracht werden. specter prüft Systeme mit KI so, wie es ein echter Angreifer tun würde, im Auftrag des Kunden, um die Lücken zuerst zu finden und zu schließen.
Die meisten Anbieter liefern einen Chatbot und ziehen weiter. Wir greifen dieselben Systeme an, die wir bauen, prüfen auf Prompt Injection, Jailbreaks und Datenabfluss, bis sie halten. Das Ergebnis ist Sicherheit, die Sie einem Auditor zeigen können, kein Versprechen auf einer Folie.
Was es macht
Red Teaming für LLMs und Tests auf Jailbreaks
In Ihrem Auftrag versuchen wir, Ihre KI zu Dingen zu bewegen, die sie nicht tun darf, und melden die genaue Schwachstelle. Wir testen, ob sich Ihr Bot im Support überreden lässt, interne Rabatte oder Daten herauszugeben.
Audits auf Prompt Injection
Wir prüfen, ob jemand Ihrer KI über versteckten Text im Input oder in Ihrer RAG-Pipeline heimliche Befehle unterschieben kann. Ein präpariertes Dokument darf Ihre KI niemals umsteuern können.
Härten gegen Jailbreaks
Wir bauen Ihre Systemprompts und Guardrails so um, dass sich das Modell nicht mehr zu verbotenen Antworten überreden lässt. Härten heißt: Es hält auch noch, wenn wir fertig sind, nicht nur am Tag des Tests.
Tests auf Datenabfluss
Wir prüfen, ob die KI unter geschickten Fragen vertrauliche Daten, Kundendatensätze oder interne Schlüssel preisgibt, damit ein Leck von uns gefunden wird und nicht von einem Angreifer.
Sicherheitsaudits für Agenten
Für KI, die selbst Aktionen ausführt, etwa Mails senden oder Bestellungen auslösen, prüfen wir, ob sie dazu gebracht werden kann, das Falsche zu tun, zum Beispiel versehentlich Geld zu überweisen.
Adversarial Testing und Pentests
Wir nutzen unzensierte Modelle als Angriffswerkzeug, um Lücken zu finden, die ein normaler Test übersieht, fahren Bug-Bountys für KI und beschleunigen klassische Pentests mit KI im Prozess.
Bevor ein Händler seinen kundenseitigen Chatbot live schaltete, griff specter ihn per Red Teaming an. Im Test brachten wir den Bot über eine mehrstufige Prompt Injection dazu, eine interne Rabattregelung preiszugeben, und schrieben dann seinen Systemprompt und seine Guardrails so um, dass derselbe Angriff nichts mehr lieferte. Der Launch ging mit einem Bericht raus, den der Vorstand lesen konnte.
Was Sie bekommen
- Schwachstellen zuerst von uns gefunden, bevor ein echter Angreifer oder eine Aufsicht sie findet
- Prompt Injection, Jailbreaks und Datenlecks getestet, nicht einfach vorausgesetzt
- Guardrails und Systemprompts gehärtet, damit sie nach dem Test halten
- Ein klarer Bericht, den Sie Auditor, Vorstand und Kunden zeigen können
- Gegen die OWASP LLM Top 10 getestet und am NIST AI RMF ausgerichtet
Fragen
Testen Sie nur KI, die Sie gebaut haben, oder auch unsere?
Was bekommen wir am Ende konkret?
Warum ist Red Teaming Ihre Kernkompetenz?
Lassen Sie uns Ihre KI zuerst angreifen
Buchen Sie 30 Minuten mit uns, und wir umreißen ein Engagement per Red Teaming für die KI, die Sie heute betreiben.
