AI Model Security & Adversarial Robustness
Attacking and hardening the intelligence inside AI models

물리 환경에서 동작하는 적대적 패치, 확산 모델 기반 적대적 예제, 모델 역전 공격, 멤버십 추론 공격 등 AI 모델을 직접 겨냥하는 보안 위협과 방어 기법을 연구합니다. XAI를 활용한 공격 최적화, 의료 데이터 비식별화, 프라이버시-유용성 트레이드오프까지 공격 설계부터 방어 체계 구축까지 포괄합니다.
- Adversarial patches
- Adversarial examples
- Diffusion-based Adversarial
- Model Inversion Attack
- Membership Inference Attack
- XAI-guided Optimization
- Physical-world Attacks
- Data de-identification



