
Defensive M2S: Training Guardrail Models on Compressed Multi-turn Conversations
Defensive M2S๋ ๊ธฐ์กด ๊ฐ๋๋ ์ผ ๋ชจ๋ธ์ด ์ ์ฒด ๋ํ ํ์คํ ๋ฆฌ๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์์ผ ํ๋ ๊ตฌ์กฐ์ ํ๊ณ๋ฅผ ๊ทผ๋ณธ์ ์ผ๋ก ํด๊ฒฐํ๋ค๋ ์ ์์ ์๋ฏธ๊ฐ ํฌ๋ค. ๋ค์คํด ๋ํ๋ ์ผ๋ฐ์ ์ผ๋ก ํ ํฐ ์๊ฐ O(nยฒ) ์์ค์ผ๋ก ๊ธ์ฆํ๋๋ฐ, ์ด๋ ํนํ 10ํด ์ด์์ผ๋ก ๊ธธ์ด์ง๋ ์ค์ ์๋น์ค ์๋๋ฆฌ์ค์์ GPU ๋ฉ๋ชจ๋ฆฌ์ ์ฐ์ฐ ์๊ฐ์ ๋ณ๋ชฉ์ ์ด๋ํ๋ค. ๋ ผ๋ฌธ์ ์ด๋ฅผ โMultiโturn to Singleโturn (M2S)โ ์์ถ์ด๋ผ๋ ๊ฐ๋จํ์ง๋ง ํจ๊ณผ์ ์ธ ๋ณํ ๊ท์น์ผ๋ก ์ ํํ๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ๊ฐ ํด์ ํต์ฌ ๋ฐํ๋ง์ ๋จ๊ธฐ๊ณ , ๋ํ ํ๋ฆ์ ์ ์งํ๊ธฐ ์ํด ํ์ดํ(โ),































