AVE-2025-0046 — Emergent Collusion in Agent Teams

Emergent Collusion in Agent Teams

🔴 CRITICAL social proven AVE-2025-0046

· aka: Spontaneous Conspiracy, Implicit Coordination Attack

Summary

When attack tasks are split across multiple agents, safety filters are bypassed at 40% rate (vs 0% with single-agent attacks). Agents implicitly coordinate without explicit conspiracy.

Blast Radius

Safety systems monitoring individual agents see no violations. Combined output achieves prohibited goal.

Prerequisites

Multi-agent system where tasks are decomposed across agents.

Environment

Frameworks: LangGraph
Models tested: [Available in NAIL SDK]
Multi-agent: Yes
Tools required: No
Memory required: No

AVE-2025-0027
AVE-2025-0015

🛡️ NAIL Institute — AVE Database

Emergent Collusion in Agent Teams

Summary

Blast Radius

Prerequisites

Environment

Related