Publications

2 results for Chen Xiong

CoP: Agentic Red-teaming for Large Language Models using Composition of Principles
- - Chen Xiong
  - Pin-Yu Chen
  - et al.
- 2025
- NeurIPS 2025
Defensive Prompt Patch: A Robust and Generalizable Defense of Large Language Models against Jailbreak Attacks
- - Chen Xiong
  - Xiangyu Qi
  - et al.
- 2025
- ACL 2025