Semantic Uncertainty: Linguistic Invariances for Uncertainty Estimation in Natural Language Generation
๐ ๋ ผ๋ฌธ ์ ๋ณด
๐ ์ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ๋ฌธ์ ์์
AI๋ผ๋ ๊ฐ๋ ์ด ์ฐ๋ฆฌ์๊ฒ ๋ณธ๊ฒฉ์ ์ผ๋ก ๋ค๊ฐ์จ ๊ฒ์ ์๋ง๋ ์ํ๊ณ ์ ๋ฑ์ฅ์ด ๊ณ๊ธฐ์์ ๊ฒ์ด๋ค. ๋ถ๊ณผ ๋ช ๋ ์ ๋ง ํด๋ ๋ฉ๊ฒ๋ง ๋๊ปด์ก๋ ๊ธฐ์ ์ด ์ด์ ๋ ChatGPT๋ Gemini์ ๊ฐ์ ์ธ์ด ๋ชจ๋ธ์ ํํ๋ก ์ฐ๋ฆฌ์ ์ผ์ ์ ๊น์์ด ์๋ฆฌ ์ก๊ณ ์๋ค. ์ฐ๋ฆฌ๋ ์์ฐ์ค๋ฝ๊ฒ AI์๊ฒ ์ง๋ฌธ์ ๋์ง๊ณ , ๋ณต์กํ ๊ธ์ฐ๊ธฐ๋ฅผ ๋ถํํ๋ฉฐ, ๋๋ก๋ ๋ฒ์ญ์ด๋ ์์ฝ๊น์ง๋ ๋งก๊ธด๋ค. ์ด์ฒ๋ผ ์์ฐ์ด ์์ฑ(Natural Language Generation, NLG)์ด ๋๋ฆฌ ํ์ฉ๋๋ฉด์, ํ ๊ฐ์ง ์ค์ํ ์ง๋ฌธ์ด ๋ ์ค๋ฅธ๋ค. โ์ธ์ด ๋ชจ๋ธ์ด ๋ด๋๋ ๋๋ต์ ์ฐ๋ฆฌ๋ ์ผ๋ง๋ ์ ๋ขฐํ ์ ์๋๊ฐ?โ ๋จ์ง ๋ฌธ์ฅ์ ์์ฑํ๋ค๋ ์ด์ ๋ง์ผ๋ก ๊ทธ ๋ต์ด ์ณ๋ค๊ณ ๋ณด์๋ ๋ ๊น? ํน์ ํํ์ด ์ต์ํ์ง ์๋ค๋ฉด, ๊ทธ๊ฒ์ ํ๋ฆฐ ๋ต๋ณ์ผ๊น?
๊ธฐ์กด์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ๋ค์ ์ด๋ฏธ์ง ๋ถ๋ฅ๋ ์ซ์ ์์ธก์ฒ๋ผ ๋ช ํํ ์ ๋ต์ด ์๋ ๋ฌธ์ ์์ ์์ธก์ ์ ๋ขฐ๋๋ฅผ ํ๋ฅ ๋ถํฌ๋ ์ํธ๋กํผ๋ฅผ ํตํด ์ ๋์ ์ผ๋ก ์ธก์ ํด์๋ค. ํ์ง๋ง ์์ฐ์ด๋ ๋ค๋ฅด๋ค. ํ๋์ ์ง๋ฌธ์ ๋ํด ๋์ผํ ์๋ฏธ๋ฅผ ๊ฐ์ง ๋ค์ํ ํํ๋ค์ด ์กด์ฌํ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค. ๊ฐ์ ์๋ฏธ๋ฅผ ์ฌ๋ฌ ๋ฐฉ์์ผ๋ก ํํํ ์ ์๋ ์ธ์ด์ ํน์ฑ์, ๊ธฐ์กด์ ํ๋ฅ ๊ธฐ๋ฐ ๋ถํ์ค์ฑ ์ธก์ ๋ฐฉ์์ผ๋ก๋ ํฌ์ฐฉ๋๊ธฐ ์ด๋ ต๋ค. ์๋ฅผ ๋ค์ด ์ธ์ด ๋ชจ๋ธ์ด ๊ฐ์ ์ง๋ฌธ์ ๋ํด โ์์ธ์ ๋๋คโ ๋๋ โ๋ํ๋ฏผ๊ตญ์ ์๋๋ ์์ธ์ด์์โ๋ผ๊ณ ๋ตํ ์ ์๋ค. ์ฐ๋ฆฌ๋ ์ด ๋ ๋ฌธ์ฅ์ด ๋์ผํ ์๋ฏธ๋ฅผ ๊ฐ๋๋ค๋ ๊ฒ์ ์ฝ๊ฒ ์ดํดํ์ง๋ง, ๊ธฐ์กด์ ์ธ์ด ๋ชจ๋ธ์ ํํ์ ์ฐจ์ด๋ฅผ ๊ทผ๊ฑฐ๋ก ์๋ก ๋ค๋ฅธ ๊ฒฐ๊ณผ๋ก ๊ฐ์ฃผํ๊ณ , ๋ถํ์ํ๊ฒ ๋์ ๋ถํ์ค์ฑ์ ๊ณ์ฐํด๋ธ๋ค. ์ด๋ ๊ฒฐ๊ตญ ๋ชจ๋ธ์ ์ ๋ขฐ๋๋ฅผ ์๊ณก์ํค๊ณ , ์ค์ ๋ณด๋ค ๋ถ์์ ํด ๋ณด์ด๊ฒ ๋ง๋ค ์ ์๋ค.
์ด ๋ ผ๋ฌธ์ ์ด๋ฌํ ๋ฌธ์ ์ํฉ์์ ์ถ๋ฐํ๋ค. ์ ์๋ค์ ์์ฐ์ด์ ๋ณธ์ง์ธ โ์๋ฏธโ์ ์ฃผ๋ชฉํ์ฌ, ๋ฌธ์ฅ ๋จ์๊ฐ ์๋ ์๋ฏธ ๋จ์๋ก ํ๋ฅ ์ ์ฌ๊ตฌ์ฑํ๋ ์๋ก์ด ๋ถํ์ค์ฑ ์งํ์ธ Semantic Entropy๋ฅผ ์ ์ํ๋ค. ํต์ฌ ์์ด๋์ด๋ ๋จ์ํ๋ค. ๊ฐ์ ์๋ฏธ๋ฅผ ๊ฐ์ง ํํ์ ํ๋๋ก ๋ฌถ๊ณ , ๊ทธ ์งํฉ์ ๋ํด ์ํธ๋กํผ๋ฅผ ๊ณ์ฐํ๋ค๋ ๊ฒ์ด๋ค. ์ด๋ฅผ ํตํด ๋ชจ๋ธ์ด ์ค์ ๋ก ์ผ๋ง๋ ๋ค์ํ ์๋ฏธ๋ฅผ ๋์์ ๊ณ ๋ คํ๊ณ ์๋์ง๋ฅผ ๋ณด๋ค ์ ํํ ํ์ ํ ์ ์๋ค. ๋ฌด์๋ณด๋ค๋ ์ด ๋ฐฉ๋ฒ์ ๋น์ง๋ ๋ฐฉ์, Unsupervised learning ๋ฐฉ์์ผ๋ก ๋์ํ๋ฉฐ, ๋ณ๋์ ์ถ๊ฐ ํ์ต์ด๋ ๋ชจ๋ธ ๊ตฌ์กฐ ๋ณ๊ฒฝ ์์ด๋ ๊ธฐ์กด์ ๋ํ ์ธ์ด ๋ชจ๋ธ์ ๊ทธ๋๋ก ์ ์ฉ ๊ฐ๋ฅํ๋ค๋ ์ ์์ ์ค์ฉ์ฑ๊ณผ ํ์ฅ์ฑ์ด ๋๋ค๋ ์ฅ์ ์ด ์๋ค. ๊ทธ๋ผ ์ง๊ธ๋ถํฐ ์ด๋ค ๋ฌธ์ ์ํฉ์ด ์๋์ง, ๊ทธ๋ฆฌ๊ณ ๋ฐฉ๋ฒ๋ก ๋ฐ ์คํ๊ฒฐ๊ณผ๋ฅผ ์์ธํ ์ดํด๋ณด๋๋ก ํ๊ฒ ๋ค.
๊ธฐ์กด ๋ถํ์ค์ฑ ์ธก์ ์ ํ๊ณ
๊ทธ๋ ๋ค๋ฉด ์ฐ์ , ๊ธฐ์กด์ ์ธ์ด ๋ชจ๋ธ๋ค์ ๋ถํ์ค์ฑ(uncertainty)์ ์ด๋ค ๋ฐฉ์์ผ๋ก ์ธก์ ํด์์๊น? ๊ธฐ์กด ๋ฅ๋ฌ๋์์๋ ์ถ๋ ฅ์ ๋ํ ํ์ ์ ์ ๋๋ฅผ ์์ธก ๋ถํฌ์ ์ํธ๋กํผ(entropy)๋ก ์ธก์ ํ๋ค. ์๋ฅผ ๋ค์ด, ์ ๋ ฅ \(x\)์ ๋ํด ์ถ๋ ฅ \(y\)๊ฐ ๋์ฌ ํ๋ฅ ๋ถํฌ๊ฐ \(p(y \mid x)\)๋ผ๊ณ ํ ๋, ์ด ๋ถํฌ์ ์ํธ๋กํผ๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋๋ค.
\[H(Y \mid x) = - \int p(y \mid x) \log p(y \mid x) \, dy\]์ด ๊ฐ์ด ๋์์๋ก ๋ชจ๋ธ์ ๋ถํ์คํ๋ฉฐ, ๋ฎ์์๋ก ํ์ ์ ๊ฐ์ง๊ณ ์๋ ๊ฒ์ผ๋ก ํด์๋๋ค. ์์ฐ์ด ์์ฑ์ ๊ฒฝ์ฐ, ํ๋์ ์ถ๋ ฅ ๋ฌธ์ฅ \(s = (s_1, s_2, \dots, s_n)\) ๋ ํ ํฐ ๋จ์์ ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ก ๊ณ์ฐ๋๋ค. ์ฆ, ๋ฌธ์ฅ ์ ์ฒด์ ํ๋ฅ ์ ๋ค์๊ณผ ๊ฐ๋ค.
\[p(s \mid x) = \prod_{i=1}^{n} p(s_i \mid s_{<i}, x)\]๋ฐ๋ผ์ ๋ก๊ทธ ํ๋ฅ ์ ๋ค์๊ณผ ๊ฐ์ด ๊ณ์ฐ๋๋ฉฐ,
\[\log p(s \mid x) = \sum_{i=1}^{n} \log p(s_i \mid s_{<i}, x)\]์ด๋ฅผ ํตํด ์ ์ฒด ๋ฌธ์ฅ์ ํ๋ฅ ๋๋ ๋ก๊ทธ ํ๋ฅ ์ ๊ธฐ๋ฐ์ผ๋ก ๋ถํ์ค์ฑ์ ์ถ์ ํ๋ค. ๋ค๋ง, ๋ฌธ์ฅ์ด ๊ธธ์ด์ง์๋ก ๊ณฑ์ ๋ ํ๋ฅ ์ด ์์์ง๋ ๋ฌธ์ ๊ฐ ์์ด, ์ด๋ฅผ ๋ณด์ํ๊ธฐ ์ํด ๋ฌธ์ฅ ๊ธธ์ด๋ก ์ ๊ทํํ ๋ก๊ทธ ํ๋ฅ ๋ ์์ฃผ ์ฌ์ฉ๋๋ค.
\[\frac{1}{n} \sum_{i=1}^{n} \log p(s_i \mid s_{<i}, x)\]์ด๋ฌํ ๋ฐฉ์์ ๋จ์ด ์๊ฐ ๋ง์ ๋ฌธ์ฅ์ ๋ถ๋ฆฌํ๊ฒ ์์ฉํ๋ ๊ฒ์ ๋ง๊ณ , ๋ฌธ์ฅ ๊ฐ์ ํ๋ฅ ๋น๊ต๋ฅผ ๋ณด๋ค ๊ณต์ ํ๊ฒ ๋ง๋ ๋ค. ํ์ง๋ง ์ด๋ฐ ๋ฐฉ์๋ค์ ๋ชจ๋ ๋ฌธ์ฅ ๋จ์์ ํ ํฐ ์ํ์ค๋ฅผ ๋ณ๊ฐ๋ก ๊ฐ์ฃผํ๋ค๋ ์ ์์ ํ๊ณ๊ฐ ์๋ค. ์๋ฏธ์ ์ผ๋ก ๋์ผํ ๋ฌธ์ฅ์ด๋ผ ํ๋๋ผ๋ ํํ์ด ๋ค๋ฅด๋ฉด ์๋ก ๋ค๋ฅธ ํ๋ฅ ํญ๋ชฉ์ผ๋ก ์ฒ๋ฆฌ๋์ด, ์ค์ ๋ณด๋ค ๋ ๋์ ๋ถํ์ค์ฑ์ด ๊ณ์ฐ๋๋ค. ์์ฐ์ด์์ ๊ฐ์ ์๋ฏธ๋ฅผ ๊ฐ์ง ๋ค์ํ ํํ์ด ๊ฐ๋ฅํ๋ค๋ ์ ์ ๊ณ ๋ คํ๋ฉด, ์ด๋ ๊ทผ๋ณธ์ ์ธ ํ๊ณ์ด๋ฉฐ ๋ถํ์ค์ฑ ์ธก์ ์ ์๊ณก์ํฌ ์ ์๋ค.
๋๋ถ์ด ์์ฐ์ด ์์ฑ์ ์ถ๋ ฅ ๊ณต๊ฐ์ \(O(|T|^N)\) ์ ๋ฌํ ์ ๋๋ก ๊ณ ์ฐจ์์ ์ด๊ธฐ ๋๋ฌธ์, ์ ์ฒด ์ํธ๋กํผ๋ฅผ ๊ณ์ฐํ๊ธฐ ์ํด ๋ชฌํ ์นด๋ฅผ๋ก ์ํ๋ง์ ์์กดํ ์๋ฐ์ ์๋ค. ๊ทธ๋ฌ๋ ์ด ๊ฒฝ์ฐ ํ๋ฅ ์ด ๋ฎ์ ๋ฌธ์ฅ๋ค(low-probability sequences)์ด ๋ก๊ทธ ๊ฐ์ ์ํด ์ํธ๋กํผ์ ๊ณผ๋ํ๊ฒ ๊ธฐ์ฌํ๊ฒ ๋๋ฉฐ, ์ํ ์๊ฐ ๋ถ์กฑํ ๊ฒฝ์ฐ ์ํธ๋กํผ ์ถ์ ์ด ๋ถ์์ ํด์ง๋ค๋ ๋ฌธ์ ๊ฐ ์๋ค. ๋๋ถ์ด ์์ฐ์ด ์๋ต์ ๊ธธ์ด๊ฐ ์ ๊ฐ๊ฐ์ด๊ธฐ ๋๋ฌธ์, ๊ธธ์ด์ ๋ฐ๋ฅธ ๋ก๊ทธ ํ๋ฅ ์ ๊ฐ์๋ก ์ธํด ๊ธด ๋ฌธ์ฅ์ด ๋ฌด์กฐ๊ฑด ๋ ๋ถํ์คํ๋ค๊ณ ํ๊ฐ๋๋ ๊ธธ์ด ํธํฅ(length bias) ๋ฌธ์ ๋ ์กด์ฌํ๋ค. ์ด๋ฅผ ๋ง๊ธฐ ์ํด ๊ธธ์ด ์ ๊ทํ๋ ์ํธ๋กํผ๊ฐ ์ ์๋๊ธด ํ์ง๋ง, ํญ์ ์ด์์ ์ธ ํด๋ฒ์ ์๋๋ค. ์ ๋ต์ด ์งง์ ๊ฒฝ์ฐ(์: TriviaQA)์๋ ์ ํจํ ์ ์์ง๋ง, ๋ค์ํ ๊ธธ์ด์ ์ ๋ต์ด ์กด์ฌํ๋ ๊ฒฝ์ฐ(CoQA ๋ฑ)์๋ ์คํ๋ ค ์๊ณก์ ์ด๋ํ ์ ์๋ค.
์ด์ฒ๋ผ ๊ธฐ์กด์ ๋ถํ์ค์ฑ ์ธก์ ๋ฐฉ์์ ํํ์ ๋ค์์ฑ๊ณผ ๋ฌธ์ฅ์ ๊ตฌ์กฐ์ ํน์ฑ์ ์ถฉ๋ถํ ๋ฐ์ํ์ง ๋ชปํ๋ฉฐ, ํนํ ๊ฐ์ ์๋ฏธ๋ฅผ ๊ฐ์ง ๋ค์ํ ํํ๋ค์ ๋ํด ์ธ์์ ์ผ๋ก ๋์ ๋ถํ์ค์ฑ์ ๋ถ์ฌํ๋ ๋ฌธ์ ๊ฐ ์๋ค.
์๋ฏธ ๊ธฐ๋ฐ ๋ถํ์ค์ฑ ์ธก์ (Semantic Entropy)
๊ธฐ์กด์ ๋ถํ์ค์ฑ ์ธก์ ๋ฐฉ์์ ์ธ์ด ๋ชจ๋ธ์ด ์์ฑํ ๋ฌธ์ฅ์ ๊ฐ๊ธฐ ๋ ๋ฆฝ์ ์ธ ์ํ์ค๋ก ๊ฐ์ฃผํ์ฌ ํ๋ฅ ์ ๊ณ์ฐํ๋ค. ํ์ง๋ง ์์ฐ์ด์์๋ ํํ์ด ๋ฌ๋ผ๋ ์๋ฏธ๊ฐ ๋์ผํ ๋ฌธ์ฅ๋ค์ด ๋ค์ ์กด์ฌํ๋ค. ๋ฐ๋ผ์ ๋ฌธ์ฅ ์์ฒด๊ฐ ์๋, ๋ฌธ์ฅ์ด ๋ด๊ณ ์๋ ์๋ฏธ(semantic meaning)๋ฅผ ๊ธฐ์ค์ผ๋ก ๋ถํ์ค์ฑ์ ์ธก์ ํด์ผ ํ๋ค๋ ํ์์ฑ์ด ์ ๊ธฐ๋์๊ณ , ์ ์๋ค์ Semantic Entropy๋ผ๋ ์๋ก์ด ์งํ๋ฅผ ์ ์ํ๋ค. ํต์ฌ ์์ด๋์ด๋ ๋ค์๊ณผ ๊ฐ๋ค. ์ธ์ด ๋ชจ๋ธ์ด ์์ฑํ ์ฌ๋ฌ ๋ฌธ์ฅ ์ค์์ ๊ฐ์ ์๋ฏธ๋ฅผ ๊ฐ์ง ๋ฌธ์ฅ๋ค์ ํ๋์ โ์๋ฏธ ์งํฉ(semantic class)โ์ผ๋ก ๋ฌถ๊ณ , ์ด ์๋ฏธ ๋จ์๋ก ๋ถํ์ค์ฑ์ ๊ณ์ฐํ๋ค๋ ๊ฒ์ด๋ค.
๊ตฌ์ฒด์ ์ผ๋ก, ๋ค์๊ณผ ๊ฐ์ 3๋จ๊ณ ์ ์ฐจ๋ฅผ ๋ฐ๋ฅธ๋ค.
- ์ํ๋ง: ์ฃผ์ด์ง ์ง๋ฌธ์ด๋ ๋ฌธ๋งฅ \(๐ฅ\) ์ ๋ํด ์ธ์ด ๋ชจ๋ธ๋ก๋ถํฐ \(๐\) ๊ฐ์ ๋ฌธ์ฅ \(s^{(1)},\ s^{(2)},\ \dots,\ s^{(M)}\)์ ์ํ๋งํ๋ค.
- ์๋ฏธ ํด๋ฌ์คํฐ๋ง: ์ด๋ค ๋ฌธ์ฅ์ ์๋ก ์๋ฏธ๊ฐ ๊ฐ์ ๊ฒ๋ค๋ผ๋ฆฌ ๋ฌถ๋๋ค. ๋ ๋ฌธ์ฅ์ด ์๋ก๋ฅผ ์๋ฐฉํฅ์ผ๋ก ํจ์(entailment)ํ๋ฉด ๊ฐ์ ์๋ฏธ๋ฅผ ๊ฐ์ง ๊ฒ์ผ๋ก ํ๋จํ๋ค.
- ์๋ฏธ ๊ธฐ๋ฐ ์ํธ๋กํผ ๊ณ์ฐ: ๊ฐ์ ์๋ฏธ ์งํฉ ๋ด์ ๋ฌธ์ฅ ํ๋ฅ ๋ค์ ํฉ์ฐํ์ฌ ์๋ฏธ ๋จ์์ ํ๋ฅ ๋ถํฌ๋ฅผ ๋ง๋ค๊ณ , ์ด์ ๋ํ ์ํธ๋กํผ๋ฅผ ๊ณ์ฐํ๋ค.
์ด ๊ณผ์ ์ ์์์ผ๋ก ์ ๋ฆฌํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค. ๋จผ์ ์๋ฏธ ์งํฉ \(๐ โ ๐ถ\) ์ ํ๋ฅ ์ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋๋ค.
\[p(c \mid x) = \sum_{s \in c} p(s \mid x)\]์ด์ ์ ์ฒด ์๋ฏธ ๊ณต๊ฐ \(C\)์ ๋ํด Semantic Entropy๋ ๋ค์๊ณผ ๊ฐ์ด ๊ณ์ฐ๋๋ค.
\[H_{\text{semantic}}(x) = - \sum_{c \in C} p(c \mid x) \log p(c \mid x)\]์ด๋ ์ค์ ๋ชจ๋ธ์ด ์์ฑํ๋ ๋ฌธ์ฅ๋ค์ ์ ์ฒด ์๋ฏธ ๊ณต๊ฐ์ ์ผ๋ถ๋ง ๋ฐ์ํ๊ธฐ ๋๋ฌธ์, ์ ์์์ ์ํ๋ง ๊ธฐ๋ฐ Monte Carlo ๊ทผ์ฌ๋ก ๋ค์๊ณผ ๊ฐ์ด ํํ๋๋ค:
\[H_{\text{semantic}}(x) \approx - \frac{1}{|C|} \sum_{i=1}^{|C|} \log p(C_i \mid x)\]์ด ๋ฐฉ์์ ํํ์ ๋ค์์ฑ์ ํ์ฉํ๋ฉด์๋ ์๋ฏธ์ ๋ถํ์ค์ฑ๋ง์ ์ธก์ ํ ์ ์๋ค๋ ์ ์์, ๊ธฐ์กด ๋ฐฉ์๋ณด๋ค ํจ์ฌ ๋ ์ง๊ด์ ์ด๊ณ ์ ๋ขฐํ ์ ์๋ ์งํ๋ฅผ ์ ๊ณตํ๋ค.
๐ฏ ์์: ์๋ฏธ ๊ธฐ๋ฐ ์ํธ๋กํผ ๊ณ์ฐ
Semantic Entropy๊ฐ ๊ธฐ์กด ๋ฐฉ์๊ณผ ์ด๋ป๊ฒ ๋ค๋ฅธ์ง๋ฅผ ์ง๊ด์ ์ผ๋ก ๋ณด์ฌ์ฃผ๊ธฐ ์ํด, ๊ฐ๋จํ ์์๋ฅผ ํตํด ๋น๊ตํด๋ณด์. ์๋ฅผ ๋ค์ด, โํ๋์ค์ ์๋๋ ์ด๋์ธ๊ฐ์?โ๋ผ๋ ์ง๋ฌธ์ ๋ํด ์ธ์ด ๋ชจ๋ธ์ด ๋ค์๊ณผ ๊ฐ์ ์ธ ๋ฌธ์ฅ์ ์์ฑํ๋ค๊ณ ๊ฐ์ ํ์.
๋ฌธ์ฅ | ํ๋ฅ ( p(s \(\mid\) x) ) |
---|---|
A: โํ๋ฆฌ์ ๋๋ค.โ | 0.5 |
B: โํ๋์ค์ ์๋๋ ํ๋ฆฌ์์.โ | 0.4 |
C: โ๋ฐ๋์ ๋๋ค.โ | 0.1 |
๊ธฐ์กด์ ์ํธ๋กํผ ๊ณ์ฐ ๋ฐฉ์์ ์ด ์ธ ๋ฌธ์ฅ์ ๋ชจ๋ ๋ ๋ฆฝ์ ์ผ๋ก ์ฒ๋ฆฌํ์ฌ ๋ค์๊ณผ ๊ฐ์ ์ํธ๋กํผ๋ฅผ ๊ณ์ฐํ๋ค.
\[H = - (0.5 * log 0.5 + 0.4 * log 0.4 + 0.1 * log 0.1) โ 0.94\]์ด ๊ฐ์ ๋ชจ๋ธ์ด ์๋นํ ๋ถํ์ค์ฑ์ ๊ฐ๋ ๊ฒ์ผ๋ก ํด์๋๋ค. ๊ทธ๋ฌ๋ A์ B๋ ์๋ฏธ์ ์ผ๋ก ๋์ผํ ๋ฌธ์ฅ์ด๋ฉฐ, ์ด๋ ์ฌ๋์ด๋ผ๋ฉด ์ฝ๊ฒ ์ธ์งํ ์ ์๋ค. ์ด๋ฅผ ๊ณ ๋ คํด A์ B๋ฅผ ํ๋์ ์๋ฏธ ์งํฉ(semantic class)์ผ๋ก ๋ฌถ์ผ๋ฉด, ์๋ฏธ ๊ธฐ๋ฐ ํ๋ฅ ์ ๋ค์๊ณผ ๊ฐ์ด ๊ตฌ์ฑ๋๋ค.
์๋ฏธ ์งํฉ 1 (โํ๋ฆฌโ ๊ด๋ จ ๋ต๋ณ๋ค):
- ์๋ฏธ ์งํฉ 1 (โํ๋ฆฌโ ๊ด๋ จ): 0.5 + 0.4 = 0.9
- ์๋ฏธ ์งํฉ 2 (โ๋ฐ๋โ): 0.1
์ด์ ์๋ฏธ ๋จ์๋ก ์ํธ๋กํผ๋ฅผ ๊ณ์ฐํ๋ฉด:
\[H_semantic = - (0.9 * log 0.9 + 0.1 * log 0.1) โ 0.33\]โ ์๋ฏธ๋ฅผ ๊ธฐ์ค์ผ๋ก ๋ฌถ์ผ๋ฉด ์ค์ ๋ถํ์ค์ฑ์ด ํจ์ฌ ๋ฎ๊ฒ ์ธก์ ๋จ.
์ฆ, ํ๋ฉด์ ์ผ๋ก๋ ๋ค์ํ ๋ต๋ณ์ด ์กด์ฌํ๋ ๊ฒ์ฒ๋ผ ๋ณด์์ง๋ง, ์๋ฏธ์ ๊ธฐ์ค์ผ๋ก ๋ณด๋ฉด ๋๋ถ๋ถ์ ํ๋ฅ ์ด ํ๋์ ์ ๋ต์ ๋ชฐ๋ ค ์์ผ๋ฉฐ, ์ค์ ๋ถํ์ค์ฑ์ ํจ์ฌ ๋ฎ๋ค๋ ๊ฒ์ ์ ์ ์๋ค.
๐ ๊ด๋ จ ์ฐ๊ตฌ
๋ ผ๋ฌธ์ ๊ธฐ์กด ์ธ์ด ๋ชจ๋ธ์ ๋ถํ์ค์ฑ ์ถ์ ์ฐ๊ตฌ์ ์ฐจ๋ณํ๋ ์ ๊ทผ์ ์๋ํ๋ค. ๋๋ถ๋ถ์ ๊ธฐ์กด ์ฐ๊ตฌ๋ค์ ๋ถ๋ฅ(classification) ๋๋ ํ๊ท(regression) ๋ฌธ์ ์์ ์์ธก์ ์ ๋ขฐ๋๋ฅผ ์ถ์ ํ๋ ๋ฐ ์ง์คํด์์ผ๋ฉฐ, ์ด๋ ์ฌ์ฉ๋๋ ์ฃผ์ ๋ฐฉ๋ฒ์ ํ๋ฅ ๋ณด์ (calibration)์ ์ด์ ์ ๋๋ค. ๋ํ์ ์ธ ์๋ก๋ Brier score, Monte Carlo Dropout, Deep Ensembles ๋ฑ์ด ์์ผ๋ฉฐ, ์ด๋ค์ ๋ชจ๋ธ์ ์์ธก ํ๋ฅ ์ด ์ผ๋ง๋ ์ค์ ์ ๋ต ํ๋ฅ ๊ณผ ์ผ์นํ๋์ง๋ฅผ ์ธก์ ํ๋ค.
์์ฐ์ด ์์ฑ(NLG)์์์ ๋ถํ์ค์ฑ ์ถ์ ์๋ ๋ค์๊ณผ ๊ฐ์ ๊ธฐ์กด ์ ๊ทผ ๋ฐฉ์๋ค์ด ์๋ค. ๋จผ์ , ์์ธก ์ํธ๋กํผ(Predictive Entropy)๋ ์์ฑ๋ ๋ฌธ์ฅ ์์ฒด์ ํ๋ฅ ๋ถํฌ๋ก๋ถํฐ ์ํธ๋กํผ๋ฅผ ๊ณ์ฐํด ๋ถํ์ค์ฑ์ ์ถ์ ํ๋ค. ์ด ๋ฐฉ์์ ์ผ๋ฐ์ ์ผ๋ก ํ๋ฅ ์ด ๋ถ์ฐ๋์ด ์์์๋ก ๋์ ๊ฐ์ ๊ฐ๋๋ค. ๊ทธ๋ฌ๋ ์ด ๋ฐฉ์์ ๊ธด ๋ฌธ์ฅ์ด ๋ถ๋ฆฌํ๋ค๋ ๋ฌธ์ ๋ฅผ ๋ดํฌํ๊ณ ์์ด, ์ด๋ฅผ ๋ณด์ ํ ๋ฐฉ์์ผ๋ก ๊ธธ์ด ์ ๊ทํ๋ ์ํธ๋กํผ(Normalised Entropy)๊ฐ ์ฌ์ฉ๋๋ค. ์ด ๋ฐฉ๋ฒ์ ์ ์ฒด ๋ก๊ทธ ํ๋ฅ ์ ๋ฌธ์ฅ ๊ธธ์ด๋ก ๋๋์ด ์ํธ๋กํผ ๊ฐ์ ๋ณด์ ํ๋ ๋ฐฉ์์ด๋ค. ๋ํ p(True)๋ ๋ชจ๋ธ์ด ์ ๋ต์ ์ง์ ์์ฑํ ํ๋ฅ ์ ๊ธฐ๋ฐ์ผ๋ก ํ ๋จ์ํ ์งํ๋ก, โ๋ชจ๋ธ์ด ์ผ๋ง๋ ์ ๋ต์ ์์ ์๋๊ฐโ๋ฅผ ์์น๋ก ๋ํ๋ธ๋ค. ๊ทธ๋ฌ๋ ์ด ๋ฐฉ์์ ํด๋น ์ ๋ต์ด ๋จ ํ๋๋ก ์ ์๋์ด ์์ด์ผ ํ๋ฉฐ, NLG์ฒ๋ผ ๋ค์ํ ์ ๋ต์ด ์กด์ฌํ๋ ๊ฒฝ์ฐ์๋ ์ ์ ํ์ง ์๋ค. Lexical similarity ๊ธฐ๋ฐ ์ ๊ทผ์ Rouge-L ๋ฑ์ ๋จ์ด ์์ค ์ ์ฌ๋๋ฅผ ํตํด ์์ธก ํ์ง์ ๊ฐ์ ์ถ์ ํ๋ค. ์ด๋ ํนํ ์์ฝ(summarization)์ด๋ QA ๊ฐ์ ํ์คํฌ์์ ๋๋ฆฌ ์ฌ์ฉ๋์ง๋ง, ํํ๋ง ๋ค๋ฅด๊ณ ์๋ฏธ๋ ๊ฐ์ ๋ฌธ์ฅ์ ๋ํด ์๋ชป๋ ๋ถํ์ค์ฑ์ ์ถ์ ํ ์ ์๋ค.
์์ ๋ฐฉ์๋ค์ ๋๋ถ๋ถ ํ ํฐ ๋จ์์ ์ํ์ค๋ฅผ ๋ ๋ฆฝ์ ์ผ๋ก ์ฒ๋ฆฌํ๊ฑฐ๋, ๋จ์ผ ์ ๋ต ๊ธฐ์ค์ ํ๋ฅ ์ ์์กดํ๋ค๋ ํ๊ณ๊ฐ ์๋ค. ํํ์ด ๋ค๋ฅด์ง๋ง ์๋ฏธ๊ฐ ๊ฐ์ ๋ฌธ์ฅ๋ค์ ๊ฐ๊ฐ ๋ ๋ฆฝ์ ์ผ๋ก ์ทจ๊ธํ๋ฉด, ์ค์ ๋ณด๋ค ๋ ๋์ ์ํธ๋กํผ๊ฐ ๊ณ์ฐ๋์ด ๋ชจ๋ธ์ด ๋ง์น ํ์ ์ด ์๋ ๊ฒ์ฒ๋ผ ๋ณด์ด๊ฒ ๋๋ค. ํนํ ์์ฐ์ด ์์ฑ์ ํํ์ ๋ค์์ฑ์ด ์ค์ํ ์์ญ์ด๊ธฐ ๋๋ฌธ์, ์ด๋ฌํ ๋ฐฉ์์ ๋ณธ์ง์ ์ผ๋ก NLG์์์ ๋ถํ์ค์ฑ ์ถ์ ์ ์ ํฉํ์ง ์๋ค. ์ด๋ฌํ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด, ๋ ผ๋ฌธ์ ์๋ฏธ์ ๋์น์ฑ์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ Semantic Entropy๋ฅผ ์ ์ํ๊ฒ ๋์์ผ๋ฉฐ, ์์ ์ค๋ช ํ์๋ฏ์ด unsupervised ๋ฐฉ์์ผ๋ก ์๋ํ๋ฉฐ, ์๋ฏธ์ ์ผ๋ก ๋์ผํ ๋ฌธ์ฅ๋ค์ ํ๋์ ํด๋์ค(semantic equivalence class)๋ก ๋ฌถ์ด ์ํธ๋กํผ๋ฅผ ๊ณ์ฐํจ์ผ๋ก์จ, ๊ธฐ์กด ๋ฐฉ์๋ค์ด ๋์น๊ณ ์๋ โ์๋ฏธ ์ฐจ์์ ๋ถํ์ค์ฑโ์ ์ ๋ฐํ๊ฒ ์ธก์ ํ ์ ์๊ฒ ํ๋ค.
๋ค์ ๊ทธ๋ฆผ์ ์ด๋ฌํ ๋ค์ํ ๊ธฐ์กด ๋ถํ์ค์ฑ ์ถ์ ๋ฐฉ๋ฒ๋ค๊ณผ Semantic Entropy๋ฅผ ๋น๊ตํ ๊ฒฐ๊ณผ๋ฅผ ์๊ฐ์ ์ผ๋ก ๋ณด์ฌ์ค๋ค. Figure 1.(a)๋ 30B ํ๋ผ๋ฏธํฐ OPT ๋ชจ๋ธ์ ์ฌ์ฉํด TriviaQA ๋ฐ์ดํฐ์ ์ ๋ํด ๊ฐ ๋ฐฉ๋ฒ์ AUROC๋ฅผ ์ธก์ ํ ๊ฒฐ๊ณผ๋ก, Semantic Entropy๊ฐ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ค๋ณด๋ค ๋์ ์ ๋ขฐ๋ ์์ธก ์ฑ๋ฅ์ ๋ณด์์ ๋ณด์ฌ์ค๋ค. Figure 1.(b)๋ ๋ชจ๋ธ ํฌ๊ธฐ์ ๋ฐ๋ฅธ AUROC ๋ณํ๋ฅผ ๋น๊ตํ ๊ฒ์ผ๋ก, Semantic Entropy๊ฐ ๋ชจ๋ธ ํฌ๊ธฐ ์ฆ๊ฐ์ ๋ฐ๋ผ ๊ฐ์ฅ ์ผ๊ด๋๊ฒ ์ฑ๋ฅ์ด ํฅ์๋๋ฉฐ, ์์ ๋ชจ๋ธ์์๋ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ค๋ณด๋ค ์์ ์ ์ธ ์ฑ๋ฅ์ ์ ์งํจ์ ํ์ธํ ์ ์๋ค.
Figure 1: (a) Semantic Entropy์ AUROC ์ฐ์์ฑ (b) ๋ชจ๋ธ ํฌ๊ธฐ์ ๋ฐ๋ฅธ AUROC ๋น๊ต
๐ ์คํ ๋ฐ ๊ฒฐ๊ณผ
์ด ๋ ผ๋ฌธ์ ์ ์ํ Semantic Entropy๊ฐ ๊ธฐ์กด์ ๋ถํ์ค์ฑ ์ถ์ ๋ฐฉ๋ฒ๋ค๋ณด๋ค ์ ๋ต๊ณผ ์ค๋ต์ ๋ ์ ํํ๊ฒ ๊ตฌ๋ณํ ์ ์๋์ง๋ฅผ ์คํ์ ํตํด ๊ฒ์ฆํ๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ์ธ์ด ๋ชจ๋ธ์ด ์์ ์๊ฒ ํ ์๋ต์ด ์ค์ ๋ก ์ ๋ต์ผ ๊ฐ๋ฅ์ฑ์ด ๋์์ง, ๋๋ ๋ถํ์คํด ํ๋ ์๋ต์ด ์ค์ ๋ก ์ค๋ต์ธ์ง ์ฌ๋ถ๋ฅผ ์ผ๋ง๋ ์ ํ๋ณํ ์ ์๋์ง๋ฅผ ํ๊ฐํ๋ค.์คํ์ ์ฌ์ฉ๋ ๋ชจ๋ธ์ Meta์ OPT(Open Pre-trained Transformer) ์๋ฆฌ์ฆ๋ก, 4๊ฐ์ง ํฌ๊ธฐ(2.7B, 6.7B, 13B, 30B)์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ๋ชจ๋ธ๋ค์ด ํฌํจ๋์๋ค. ์ด๋ ๋ถํ์ค์ฑ ์ถ์ ์งํ๊ฐ ๋ชจ๋ธ์ ํฌ๊ธฐ์ ๋ฐ๋ผ ์ด๋ป๊ฒ ์ฑ๋ฅ์ด ๋ณํํ๋์ง๋ฅผ ํจ๊ป ๋ณด๊ธฐ ์ํ ์ค์ ์ด๋ค.
๋ฐ์ดํฐ์ ์ ๋ ๊ฐ์ง๊ฐ ์ฌ์ฉ๋์๋ค.
- TriviaQA: ์ ๋ต์ ์ธ์์ผ ํ๋ ์ ํ์ ์ง์์๋ต ํ์คํฌ๋ก, ๋ฌธ์ ์์ด ๋ฐ๋ก ๋ต์ ์์ฑํด์ผ ํ๋ closed-book QA์ด๋ค.
- CoQA: ๋ฌธ์๋ฅผ ์ฐธ๊ณ ํ ์ ์๋ open-book QA๋ก, ๋ชจ๋ธ์ด ๋ฌธ๋งฅ์ ๊ธฐ๋ฐ์ผ๋ก ๋ต์ ์์ฑํ๋ค.
์ ๋ต ์ฌ๋ถ๋ ๋จ์ํ ์ ํ๋๋ง์ผ๋ก ํ๋จํ์ง ์๊ณ , Rouge-L ์ ์๋ฅผ ๊ธฐ์ค์ผ๋ก ํ๋ค. Rouge-L์ ์์ฑ๋ ๋ฌธ์ฅ๊ณผ ์ ๋ต ๋ฌธ์ฅ ๊ฐ์ ๊ธด ๊ณตํต ์์ด(Longest Common Subsequence)์ ๊ธฐ๋ฐ์ผ๋ก ์ธก์ ๋๋ฉฐ, ์ฌ๊ธฐ์๋ 0.3 ์ด์์ด๋ฉด ์ ๋ต์ผ๋ก ๊ฐ์ฃผํ๋ค. ์ด ๊ธฐ์ค์ ์๋ฏธ๋ ๊ฐ์ง๋ง ํํ์ด ๋ค๋ฅธ ๋ฌธ์ฅ๋ค์ ํฌ์ฉํ ์ ์๋๋ก ์ค๊ณ๋ ๊ฒ์ด๋ค. ๋ถํ์ค์ฑ ์ถ์ ์ฑ๋ฅ์ ํ๊ฐํ๊ธฐ ์ํด ์ฌ์ฉ๋ ํต์ฌ ์งํ๋ AUROC (Area Under the Receiver Operating Characteristic curve)์ด๋ค. AUROC๋ ๋ชจ๋ธ์ด โ์ด ์๋ต์ด ์ ๋ขฐํ ๋งํ๊ฐ?โ๋ฅผ ํ๋จํ ๋ ์ ๋ต ์๋ต๊ณผ ์ค๋ต ์๋ต์ ์ผ๋ง๋ ์ ๊ตฌ๋ณํ๋์ง๋ฅผ ์ธก์ ํ๋ค. AUROC ๊ฐ์ด 1์ ๊ฐ๊น์ธ์๋ก ๊ตฌ๋ถ ๋ฅ๋ ฅ์ด ๋ฐ์ด๋๊ณ , 0.5์ ๊ฐ๊น์ฐ๋ฉด ๋ฌด์์ ์ถ์ ๊ณผ ๋ค๋ฅผ ๋ฐ ์๋ ์์ค์ด๋ผ๋ ๋ป์ด๋ค.
์๋ Figure 2๋ ๋ ๋ฐ์ดํฐ์ (CoQA์ TriviaQA)์ ๋ํด, ๋ชจ๋ธ ํฌ๊ธฐ๊ฐ ์ฆ๊ฐํจ์ ๋ฐ๋ผ ๋ค์ํ ๋ถํ์ค์ฑ ์งํ๋ค์ AUROC๊ฐ ์ด๋ป๊ฒ ๋ณํํ๋์ง๋ฅผ ๋ณด์ฌ์ค๋ค.
Figure 2: CoQA (a)์ TriviaQA (b)์ ๋ํ ๋ค์ํ ์งํ์ AUROC ๋น๊ต.
Figure 2(a)๋ CoQA ๊ฒฐ๊ณผ๋ฅผ ๋ํ๋ธ๋ค. ์ด ๊ฒฝ์ฐ, ๋ชจ๋ ๋ชจ๋ธ ํฌ๊ธฐ์์ Semantic Entropy๊ฐ ๊ฐ์ฅ ๋์ AUROC๋ฅผ ๊ธฐ๋กํ์ง๋ง, ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค๊ณผ์ ์ฑ๋ฅ ์ฐจ์ด๋ ๋น๊ต์ ์์๋ค. ์ฆ, CoQA์ฒ๋ผ ๋ฌธ์๋ฅผ ์ฐธ๊ณ ํด๋ ๋๋ QA์์๋ ๊ธฐ์กด ๋ฐฉ์๋ค๋ ์ด๋ ์ ๋ ์ ํจํ๊ฒ ์๋ํ์ง๋ง, ๊ทธ๋ผ์๋ Semantic Entropy๊ฐ ๊ฐ์ฅ ์ผ๊ด๋๊ฒ ๋์ ์ ๋ขฐ๋ ์ถ์ ์ฑ๋ฅ์ ๋ณด์๋ค๋ ์ ์์ ์ฐ์ํ๋ค. ๋ฐ๋ฉด Figure 2(b)๋ TriviaQA ๊ฒฐ๊ณผ๋ก, Semantic Entropy์ ์ฑ๋ฅ์ด ํจ์ฌ ๋๋๋ฌ์ง๊ฒ ๋ํ๋๋ค. ํนํ p(True)์ Predictive Entropy ๊ฐ์ ๊ธฐ์กด ์งํ๋ค์ AUROC๊ฐ ๋ฎ์, ์ ๋ต๊ณผ ์ค๋ต์ ๋ช ํํ ๊ตฌ๋ณํ์ง ๋ชปํ๋ ๋ฌธ์ ๋ฅผ ๋๋ฌ๋ธ๋ค. ๋ฐ๋ฉด Semantic Entropy๋ ๋ชจ๋ธ ํฌ๊ธฐ๊ฐ ์ปค์ง์๋ก ๊พธ์คํ ์ฑ๋ฅ์ด ํฅ์๋๋ฉฐ, ๊ฐ์ฅ ๊ฐ๋ ฅํ ์ ๋ขฐ๋ ์ถ์ ์งํ๋ก ์์ฉํ๋ค. ์ด ์คํ์์๋ Semantic Entropy๊ฐ ๊ธฐ์กด ์งํ๋คโPredictive Entropy, Normalised Entropy, p(True), Lexical Similarityโ๋ณด๋ค consistently ๋ ๋์ AUROC๋ฅผ ๊ธฐ๋กํ๋ค. ์ฆ, ๋ชจ๋ธ์ด ์ค์ ๋ก ํผ๋์ค๋ฌ์ธ ๋ ์๋ฏธ์ ์ผ๋ก ๋ค์ํ ์๋ต์ ๋ง์ด ์์ฑํ๋ ๊ฒฝํฅ์ Semantic Entropy๊ฐ ์ ํํ ํฌ์ฐฉํ๋ค๋ ๊ฒ์ด๋ค.
์ด๋ฅผ ๋ ์ ๋์ ์ผ๋ก ๋ณด์๋ฉด, ์๋ฏธ์ ์ผ๋ก ๊ฐ์ ์๋ต์ ํ๋์ ํด๋ฌ์คํฐ๋ก ๋ฌถ์์ ๋ ๊ทธ ์๋ฏธ ์งํฉ(semantic cluster)์ ์๊ฐ ์ ๋ต๊ณผ ์ค๋ต ๊ฐ์ ์ฐจ์ด๊ฐ ์์๋ค.
- TriviaQA์ ๊ฒฝ์ฐ ์ ๋ต์ผ ๋ ํ๊ท 1.89๊ฐ, ์ค๋ต์ผ ๋ ํ๊ท 3.89๊ฐ์ ์๋ฏธ ์งํฉ์ด ์์ฑ๋์๋ค.
- CoQA์ ๊ฒฝ์ฐ ์ ๋ต์ ํ๊ท 1.27๊ฐ, ์ค๋ต์ ํ๊ท 1.77๊ฐ๋ก, ์ค๋ต์ผ์๋ก ๋ชจ๋ธ์ด ๋ค์ํ ์๋ฏธ๋ฅผ ์์ฑํ๋ฉฐ ๋ ํผ๋์ค๋ฌ์ํ๋ ์์์ ๋ณด์๋ค.
์ด๋ Semantic Entropy๊ฐ ๋จ์ํ ํ๋ฅ ๋ถํฌ๊ฐ ํผ์ ธ ์๋ ์ ๋๋ง ๋ณด๋ ๊ฒ์ด ์๋๋ผ, ์๋ฏธ ์ฐจ์์์์ ๋ค์์ฑ์ ํตํด ๋ชจ๋ธ์ ๋ถํ์ค์ฑ์ ์ ํํ ์ถ์ ํ ์ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค.
์ํ๋ง ํ์ดํผํ๋ผ๋ฏธํฐ ๋ถ์
Figure 3: ์ํ ์ ๋ฐ ์ํ๋ง temperature๊ฐ Semantic Entropy ์ฑ๋ฅ์ ๋ฏธ์น๋ ์ํฅ. (a) AUROC vs. ์ํ ์, (b) AUROC ๋ฐ ์ ํ๋/๋ค์์ฑ vs. temperature
Semantic Entropy๋ ์ํ๋ง ๊ธฐ๋ฐ์ผ๋ก ๋์ํ๊ธฐ ๋๋ฌธ์, ๋ช ๊ฐ์ ์๋ต์ ์ํ๋งํ๋๋, ์ด๋ค temperature ์ค์ ์ผ๋ก ์ํ๋งํ๋๋์ ๋ฐ๋ผ ์ฑ๋ฅ์ด ๋ฌ๋ผ์ง ์ ์๋ค. Figure 3์ ๋ ๊ฐ์ง ์์โ์ํ ์์ temperatureโ๊ฐ Semantic Entropy์ AUROC ๋ฐ ์ถ๋ ฅ ๋ค์์ฑ์ ๋ฏธ์น๋ ์ํฅ์ ์ ๋์ ์ผ๋ก ๋ถ์ํ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋ค.
์ผ์ชฝ์ ๋ ๊ทธ๋ํ๋ ๊ฐ๊ฐ CoQA (top)์ TriviaQA (bottom)์์ ์ํ ์๊ฐ ์ฆ๊ฐํจ์ ๋ฐ๋ผ AUROC๊ฐ ์ด๋ป๊ฒ ๋ณํ๋์ง๋ฅผ ๋ณด์ฌ์ค๋ค. ์ ๋ฐ์ ์ผ๋ก Semantic Entropy๋ ๋จ 3~5๊ฐ์ ์ํ๋ง์ผ๋ก๋ ๊ธฐ์กด ๋ฐฉ์๋ณด๋ค ๋ ๋์ ์ฑ๋ฅ์ ๋ณด์ด๋ฉฐ, ์ํ ์๊ฐ 10๊ฐ๊น์ง ๋์ด๋๋ ์์ ์ ์ผ๋ก AUROC๊ฐ ์ฆ๊ฐํ๋ค. ๋ฐ๋ฉด, ๊ธฐ์กด์ Predictive Entropy๋ Length-normalized Entropy๋ ์ฆ๊ฐ ํญ์ด ์๊ฑฐ๋ ๊ฑฐ์ ์ผ์ ํ๋ค. ์ด ๊ฒฐ๊ณผ๋ Semantic Entropy๊ฐ ์ํ ํจ์จ(sample efficiency)์ด ๋ฐ์ด๋๋ค๋ ์ ์ ์์ฌํ๋ค.
์ค๋ฅธ์ชฝ์ ๋ ๊ทธ๋ํ๋ ์ํ๋ง temperature๋ฅผ ์กฐ์ ํ์ ๋ Semantic Entropy๊ฐ ์ด๋ป๊ฒ ๋ฌ๋ผ์ง๋์ง๋ฅผ ๋ณด์ฌ์ค๋ค. ์ ๊ทธ๋ํ์์๋ temperature๊ฐ 0.5์ผ ๋ AUROC๊ฐ ๊ฐ์ฅ ๋๊ฒ ๋ํ๋ฌ์ผ๋ฉฐ, ์ด๋ ์ ํ๋์ ๋ค์์ฑ ์ฌ์ด์ ๊ท ํ์ด ๊ฐ์ฅ ์ ๋ง๋ ์ง์ ์ด๋ผ๋ ๊ฒ์ ์๋ฏธํ๋ค. ์๋ ๊ทธ๋ํ์์๋ temperature๊ฐ ๋์์ง์๋ก ์์ฑ๋๋ ๋ฌธ์ฅ์ ๋ค์์ฑ์ ์ฆ๊ฐํ์ง๋ง, ํ๊ท ์ ํ๋๋ ๊ฐ์ํ๋ ๊ฒฝํฅ์ ๋ณด์ธ๋ค.
๋ฐ๋ผ์ Semantic Entropy๋ฅผ ์ค์ง์ ์ผ๋ก ์ฌ์ฉํ ๋๋ ์ ์ ํ temperature ์ค์ ๊ณผ ์์์ ๊ณ ํ์ง ์ํ๋ง์ผ๋ก๋ ๋์ ์ ๋ขฐ๋ ์์ธก ์ฑ๋ฅ์ ์ป์ ์ ์๋ค๋ ์ค์ฉ์ ์ธ ์์ฌ์ ์ ์ ๊ณตํ๋ค.