LLM SafetyJailbreakingPrompt InjectionSafety Guardrails

CySecBench

Generative AI-based CyberSecurity-focused Prompt Dataset for Benchmarking Large Language Models

View Paper

Quick Stats

Top Score

N/A

Models Evaluated

Dataset Size

12,662 samples

Last Updated

January 2, 2025

Availability

Dataset ✓Code ✓

Metrics Tracked

jailbreak success-rateresistance score

Dataset Information

12,662 close-ended prompts across 10 attack-type categories designed to evaluate jailbreaking techniques in the cybersecurity domain

Number of Tasks

Jailbreaking EvaluationSafety AssessmentPrompt Obfuscation Testing

Model Results

Detailed scores for each model evaluated on this benchmark

Verified metadata only

No verified public primary numeric leaderboard/result table has been extracted into the catalog yet; metadata and source links were refreshed during the 2026-05-12 audit.

Review Source