
Classifying long legal documents using short random chunks
์ด ๋ ผ๋ฌธ์ ๋ฒ๋ฅ ๋ฌธ์์ ๊ฐ์ด ํ ์คํธ ๊ธธ์ด๊ฐ ์์ฒ ํ ํฐ์ ๋ฌํ๋ ๋๋ฉ์ธ์์ Transformer ๋ชจ๋ธ์ ์ ๋ ฅ ์ ํ์ ์ฐํํ๊ธฐ ์ํ ์ค์ฉ์ ์ธ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค. ๊ธฐ์กด ์ฐ๊ตฌ๋ค์ ๋ณดํต ์ ์ฒด ๋ฌธ์๋ฅผ ์ฌ๋ผ์ด๋ฉ ์๋์ฐ ๋ฐฉ์์ผ๋ก ๋๋๊ฑฐ๋, ํต์ฌ ๋ฌธ์ฅ์ ์ถ์ถํ๋ ์ ์ฒ๋ฆฌ ๋จ๊ณ์ ์์กดํ๋ค. ๊ทธ๋ฌ๋ ์ฌ๋ผ์ด๋ฉ ์๋์ฐ๋ ์ฐ์ฐ๋์ด ๊ธ์ฆํ๊ณ , ํต์ฌ ๋ฌธ์ฅ ์ถ์ถ์ ๋๋ฉ์ธ ํนํ๋ ์์ฝ ๋ชจ๋ธ์ด ํ์ํด ์ถ๊ฐ ๋น์ฉ์ด ๋ฐ์ํ๋ค. ์ ์๋ค์ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ โ๋ฌด์์ ์ฒญํฌ ์ํ๋งโ์ด๋ผ๋ ๊ฐ๋จํ์ง๋ง ํจ๊ณผ์ ์ธ ์ ๋ต์ผ๋ก ํด๊ฒฐํ๋ค. 48๊ฐ์ ์ฒญํฌ๋ฅผ ๋ฌด์์๋ก ์ ํํจ์ผ๋ก์จ ๋ฌธ์ ์ ์ฒด์ ๋ค์












