🛡️ Aegis-ML

Adversarial Prompt Injection Detector — LLM Firewall

Real-time guardrails powered by TF-IDF + LogReg (Phase 1), fine-tuned DistilBERT (Phase 2), or multi-task DeBERTa-v3 (Phase 3)

Mode

Demo: local classifier only. API: full proxy pipeline.

Demo Mode API Proxy (live service)

Classifier

sklearn = TF-IDF (Phase 1) · hf = DistilBERT (Phase 2) · hf2 = DeBERTa Multi-Task (Phase 3) · onnx2 = Phase 3 INT8 ONNX

sklearn hf hf2 onnx2

Show guardrail analysis

Analysis will appear here after each message.