Post

Semantic Uncertainty: Linguistic Invariances for Uncertainty Estimation in Natural Language Generation

Semantic Uncertainty: Linguistic Invariances for Uncertainty Estimation in Natural Language Generation

๐Ÿ“„ ๋…ผ๋ฌธ ์ •๋ณด

โ€œSemantic Uncertainty: Linguistic Invariances for Uncertainty Estimation in Natural Language Generationโ€ (ICLR 2023)

๐Ÿ” ์—ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ๋ฌธ์ œ์˜์‹

AI๋ผ๋Š” ๊ฐœ๋…์ด ์šฐ๋ฆฌ์—๊ฒŒ ๋ณธ๊ฒฉ์ ์œผ๋กœ ๋‹ค๊ฐ€์˜จ ๊ฒƒ์€ ์•„๋งˆ๋„ ์•ŒํŒŒ๊ณ ์˜ ๋“ฑ์žฅ์ด ๊ณ„๊ธฐ์˜€์„ ๊ฒƒ์ด๋‹ค. ๋ถˆ๊ณผ ๋ช‡ ๋…„ ์ „๋งŒ ํ•ด๋„ ๋ฉ€๊ฒŒ๋งŒ ๋А๊ปด์กŒ๋˜ ๊ธฐ์ˆ ์ด ์ด์ œ๋Š” ChatGPT๋‚˜ Gemini์™€ ๊ฐ™์€ ์–ธ์–ด ๋ชจ๋ธ์˜ ํ˜•ํƒœ๋กœ ์šฐ๋ฆฌ์˜ ์ผ์ƒ ์† ๊นŠ์ˆ™์ด ์ž๋ฆฌ ์žก๊ณ  ์žˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ AI์—๊ฒŒ ์งˆ๋ฌธ์„ ๋˜์ง€๊ณ , ๋ณต์žกํ•œ ๊ธ€์“ฐ๊ธฐ๋ฅผ ๋ถ€ํƒํ•˜๋ฉฐ, ๋•Œ๋กœ๋Š” ๋ฒˆ์—ญ์ด๋‚˜ ์š”์•ฝ๊นŒ์ง€๋„ ๋งก๊ธด๋‹ค. ์ด์ฒ˜๋Ÿผ ์ž์—ฐ์–ด ์ƒ์„ฑ(Natural Language Generation, NLG)์ด ๋„๋ฆฌ ํ™œ์šฉ๋˜๋ฉด์„œ, ํ•œ ๊ฐ€์ง€ ์ค‘์š”ํ•œ ์งˆ๋ฌธ์ด ๋– ์˜ค๋ฅธ๋‹ค. โ€œ์–ธ์–ด ๋ชจ๋ธ์ด ๋‚ด๋†“๋Š” ๋Œ€๋‹ต์„ ์šฐ๋ฆฌ๋Š” ์–ผ๋งˆ๋‚˜ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€?โ€ ๋‹จ์ง€ ๋ฌธ์žฅ์„ ์ƒ์„ฑํ–ˆ๋‹ค๋Š” ์ด์œ ๋งŒ์œผ๋กœ ๊ทธ ๋‹ต์ด ์˜ณ๋‹ค๊ณ  ๋ณด์•„๋„ ๋ ๊นŒ? ํ˜น์€ ํ‘œํ˜„์ด ์ต์ˆ™ํ•˜์ง€ ์•Š๋‹ค๋ฉด, ๊ทธ๊ฒƒ์€ ํ‹€๋ฆฐ ๋‹ต๋ณ€์ผ๊นŒ?

๊ธฐ์กด์˜ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ๋“ค์€ ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜๋‚˜ ์ˆซ์ž ์˜ˆ์ธก์ฒ˜๋Ÿผ ๋ช…ํ™•ํ•œ ์ •๋‹ต์ด ์žˆ๋Š” ๋ฌธ์ œ์—์„œ ์˜ˆ์ธก์˜ ์‹ ๋ขฐ๋„๋ฅผ ํ™•๋ฅ  ๋ถ„ํฌ๋‚˜ ์—”ํŠธ๋กœํ”ผ๋ฅผ ํ†ตํ•ด ์ •๋Ÿ‰์ ์œผ๋กœ ์ธก์ •ํ•ด์™”๋‹ค. ํ•˜์ง€๋งŒ ์ž์—ฐ์–ด๋Š” ๋‹ค๋ฅด๋‹ค. ํ•˜๋‚˜์˜ ์งˆ๋ฌธ์— ๋Œ€ํ•ด ๋™์ผํ•œ ์˜๋ฏธ๋ฅผ ๊ฐ€์ง„ ๋‹ค์–‘ํ•œ ํ‘œํ˜„๋“ค์ด ์กด์žฌํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ๊ฐ™์€ ์˜๋ฏธ๋ฅผ ์—ฌ๋Ÿฌ ๋ฐฉ์‹์œผ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ์–ธ์–ด์˜ ํŠน์„ฑ์€, ๊ธฐ์กด์˜ ํ™•๋ฅ  ๊ธฐ๋ฐ˜ ๋ถˆํ™•์‹ค์„ฑ ์ธก์ • ๋ฐฉ์‹์œผ๋กœ๋Š” ํฌ์ฐฉ๋˜๊ธฐ ์–ด๋ ต๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์–ธ์–ด ๋ชจ๋ธ์ด ๊ฐ™์€ ์งˆ๋ฌธ์— ๋Œ€ํ•ด โ€œ์„œ์šธ์ž…๋‹ˆ๋‹คโ€ ๋˜๋Š” โ€œ๋Œ€ํ•œ๋ฏผ๊ตญ์˜ ์ˆ˜๋„๋Š” ์„œ์šธ์ด์˜ˆ์š”โ€๋ผ๊ณ  ๋‹ตํ•  ์ˆ˜ ์žˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์ด ๋‘ ๋ฌธ์žฅ์ด ๋™์ผํ•œ ์˜๋ฏธ๋ฅผ ๊ฐ–๋Š”๋‹ค๋Š” ๊ฒƒ์„ ์‰ฝ๊ฒŒ ์ดํ•ดํ•˜์ง€๋งŒ, ๊ธฐ์กด์˜ ์–ธ์–ด ๋ชจ๋ธ์€ ํ‘œํ˜„์˜ ์ฐจ์ด๋ฅผ ๊ทผ๊ฑฐ๋กœ ์„œ๋กœ ๋‹ค๋ฅธ ๊ฒฐ๊ณผ๋กœ ๊ฐ„์ฃผํ•˜๊ณ , ๋ถˆํ•„์š”ํ•˜๊ฒŒ ๋†’์€ ๋ถˆํ™•์‹ค์„ฑ์„ ๊ณ„์‚ฐํ•ด๋‚ธ๋‹ค. ์ด๋Š” ๊ฒฐ๊ตญ ๋ชจ๋ธ์˜ ์‹ ๋ขฐ๋„๋ฅผ ์™œ๊ณก์‹œํ‚ค๊ณ , ์‹ค์ œ๋ณด๋‹ค ๋ถˆ์•ˆ์ •ํ•ด ๋ณด์ด๊ฒŒ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค.

์ด ๋…ผ๋ฌธ์€ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ์ƒํ™ฉ์—์„œ ์ถœ๋ฐœํ•œ๋‹ค. ์ €์ž๋“ค์€ ์ž์—ฐ์–ด์˜ ๋ณธ์งˆ์ธ โ€œ์˜๋ฏธโ€์— ์ฃผ๋ชฉํ•˜์—ฌ, ๋ฌธ์žฅ ๋‹จ์œ„๊ฐ€ ์•„๋‹Œ ์˜๋ฏธ ๋‹จ์œ„๋กœ ํ™•๋ฅ ์„ ์žฌ๊ตฌ์„ฑํ•˜๋Š” ์ƒˆ๋กœ์šด ๋ถˆํ™•์‹ค์„ฑ ์ง€ํ‘œ์ธ Semantic Entropy๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ํ•ต์‹ฌ ์•„์ด๋””์–ด๋Š” ๋‹จ์ˆœํ•˜๋‹ค. ๊ฐ™์€ ์˜๋ฏธ๋ฅผ ๊ฐ€์ง„ ํ‘œํ˜„์€ ํ•˜๋‚˜๋กœ ๋ฌถ๊ณ , ๊ทธ ์ง‘ํ•ฉ์— ๋Œ€ํ•ด ์—”ํŠธ๋กœํ”ผ๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์ด ์‹ค์ œ๋กœ ์–ผ๋งˆ๋‚˜ ๋‹ค์–‘ํ•œ ์˜๋ฏธ๋ฅผ ๋™์‹œ์— ๊ณ ๋ คํ•˜๊ณ  ์žˆ๋Š”์ง€๋ฅผ ๋ณด๋‹ค ์ •ํ™•ํžˆ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ๋‹ค. ๋ฌด์—‡๋ณด๋‹ค๋„ ์ด ๋ฐฉ๋ฒ•์€ ๋น„์ง€๋„ ๋ฐฉ์‹, Unsupervised learning ๋ฐฉ์‹์œผ๋กœ ๋™์ž‘ํ•˜๋ฉฐ, ๋ณ„๋„์˜ ์ถ”๊ฐ€ ํ•™์Šต์ด๋‚˜ ๋ชจ๋ธ ๊ตฌ์กฐ ๋ณ€๊ฒฝ ์—†์ด๋„ ๊ธฐ์กด์˜ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ์— ๊ทธ๋Œ€๋กœ ์ ์šฉ ๊ฐ€๋Šฅํ•˜๋‹ค๋Š” ์ ์—์„œ ์‹ค์šฉ์„ฑ๊ณผ ํ™•์žฅ์„ฑ์ด ๋†’๋‹ค๋Š” ์žฅ์ ์ด ์žˆ๋‹ค. ๊ทธ๋Ÿผ ์ง€๊ธˆ๋ถ€ํ„ฐ ์–ด๋–ค ๋ฌธ์ œ์ƒํ™ฉ์ด ์žˆ๋Š”์ง€, ๊ทธ๋ฆฌ๊ณ  ๋ฐฉ๋ฒ•๋ก  ๋ฐ ์‹คํ—˜๊ฒฐ๊ณผ๋ฅผ ์ž์„ธํžˆ ์‚ดํŽด๋ณด๋„๋ก ํ•˜๊ฒ ๋‹ค.

๊ธฐ์กด ๋ถˆํ™•์‹ค์„ฑ ์ธก์ •์˜ ํ•œ๊ณ„

๊ทธ๋ ‡๋‹ค๋ฉด ์šฐ์„ , ๊ธฐ์กด์˜ ์–ธ์–ด ๋ชจ๋ธ๋“ค์€ ๋ถˆํ™•์‹ค์„ฑ(uncertainty)์„ ์–ด๋–ค ๋ฐฉ์‹์œผ๋กœ ์ธก์ •ํ•ด์™”์„๊นŒ? ๊ธฐ์กด ๋”ฅ๋Ÿฌ๋‹์—์„œ๋Š” ์ถœ๋ ฅ์— ๋Œ€ํ•œ ํ™•์‹ ์˜ ์ •๋„๋ฅผ ์˜ˆ์ธก ๋ถ„ํฌ์˜ ์—”ํŠธ๋กœํ”ผ(entropy)๋กœ ์ธก์ •ํ•œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ž…๋ ฅ \(x\)์— ๋Œ€ํ•ด ์ถœ๋ ฅ \(y\)๊ฐ€ ๋‚˜์˜ฌ ํ™•๋ฅ  ๋ถ„ํฌ๊ฐ€ \(p(y \mid x)\)๋ผ๊ณ  ํ•  ๋•Œ, ์ด ๋ถ„ํฌ์˜ ์—”ํŠธ๋กœํ”ผ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋œ๋‹ค.

\[H(Y \mid x) = - \int p(y \mid x) \log p(y \mid x) \, dy\]

์ด ๊ฐ’์ด ๋†’์„์ˆ˜๋ก ๋ชจ๋ธ์€ ๋ถˆํ™•์‹คํ•˜๋ฉฐ, ๋‚ฎ์„์ˆ˜๋ก ํ™•์‹ ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๊ฒƒ์œผ๋กœ ํ•ด์„๋œ๋‹ค. ์ž์—ฐ์–ด ์ƒ์„ฑ์˜ ๊ฒฝ์šฐ, ํ•˜๋‚˜์˜ ์ถœ๋ ฅ ๋ฌธ์žฅ \(s = (s_1, s_2, \dots, s_n)\) ๋Š” ํ† ํฐ ๋‹จ์œ„์˜ ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ ๋กœ ๊ณ„์‚ฐ๋œ๋‹ค. ์ฆ‰, ๋ฌธ์žฅ ์ „์ฒด์˜ ํ™•๋ฅ ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

\[p(s \mid x) = \prod_{i=1}^{n} p(s_i \mid s_{<i}, x)\]

๋”ฐ๋ผ์„œ ๋กœ๊ทธ ํ™•๋ฅ ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๊ณ„์‚ฐ๋˜๋ฉฐ,

\[\log p(s \mid x) = \sum_{i=1}^{n} \log p(s_i \mid s_{<i}, x)\]

์ด๋ฅผ ํ†ตํ•ด ์ „์ฒด ๋ฌธ์žฅ์˜ ํ™•๋ฅ  ๋˜๋Š” ๋กœ๊ทธ ํ™•๋ฅ ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ถˆํ™•์‹ค์„ฑ์„ ์ถ”์ •ํ•œ๋‹ค. ๋‹ค๋งŒ, ๋ฌธ์žฅ์ด ๊ธธ์–ด์งˆ์ˆ˜๋ก ๊ณฑ์…ˆ๋œ ํ™•๋ฅ ์ด ์ž‘์•„์ง€๋Š” ๋ฌธ์ œ๊ฐ€ ์žˆ์–ด, ์ด๋ฅผ ๋ณด์™„ํ•˜๊ธฐ ์œ„ํ•ด ๋ฌธ์žฅ ๊ธธ์ด๋กœ ์ •๊ทœํ™”ํ•œ ๋กœ๊ทธ ํ™•๋ฅ ๋„ ์ž์ฃผ ์‚ฌ์šฉ๋œ๋‹ค.

\[\frac{1}{n} \sum_{i=1}^{n} \log p(s_i \mid s_{<i}, x)\]

์ด๋Ÿฌํ•œ ๋ฐฉ์‹์€ ๋‹จ์–ด ์ˆ˜๊ฐ€ ๋งŽ์€ ๋ฌธ์žฅ์— ๋ถˆ๋ฆฌํ•˜๊ฒŒ ์ž‘์šฉํ•˜๋Š” ๊ฒƒ์„ ๋ง‰๊ณ , ๋ฌธ์žฅ ๊ฐ„์˜ ํ™•๋ฅ  ๋น„๊ต๋ฅผ ๋ณด๋‹ค ๊ณต์ •ํ•˜๊ฒŒ ๋งŒ๋“ ๋‹ค. ํ•˜์ง€๋งŒ ์ด๋Ÿฐ ๋ฐฉ์‹๋“ค์€ ๋ชจ๋‘ ๋ฌธ์žฅ ๋‹จ์œ„์˜ ํ† ํฐ ์‹œํ€€์Šค๋ฅผ ๋ณ„๊ฐœ๋กœ ๊ฐ„์ฃผํ•œ๋‹ค๋Š” ์ ์—์„œ ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค. ์˜๋ฏธ์ ์œผ๋กœ ๋™์ผํ•œ ๋ฌธ์žฅ์ด๋ผ ํ•˜๋”๋ผ๋„ ํ‘œํ˜„์ด ๋‹ค๋ฅด๋ฉด ์„œ๋กœ ๋‹ค๋ฅธ ํ™•๋ฅ  ํ•ญ๋ชฉ์œผ๋กœ ์ฒ˜๋ฆฌ๋˜์–ด, ์‹ค์ œ๋ณด๋‹ค ๋” ๋†’์€ ๋ถˆํ™•์‹ค์„ฑ์ด ๊ณ„์‚ฐ๋œ๋‹ค. ์ž์—ฐ์–ด์—์„œ ๊ฐ™์€ ์˜๋ฏธ๋ฅผ ๊ฐ€์ง„ ๋‹ค์–‘ํ•œ ํ‘œํ˜„์ด ๊ฐ€๋Šฅํ•˜๋‹ค๋Š” ์ ์„ ๊ณ ๋ คํ•˜๋ฉด, ์ด๋Š” ๊ทผ๋ณธ์ ์ธ ํ•œ๊ณ„์ด๋ฉฐ ๋ถˆํ™•์‹ค์„ฑ ์ธก์ •์„ ์™œ๊ณก์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค.

๋”๋ถˆ์–ด ์ž์—ฐ์–ด ์ƒ์„ฑ์˜ ์ถœ๋ ฅ ๊ณต๊ฐ„์€ \(O(|T|^N)\) ์— ๋‹ฌํ•  ์ •๋„๋กœ ๊ณ ์ฐจ์›์ ์ด๊ธฐ ๋•Œ๋ฌธ์—, ์ „์ฒด ์—”ํŠธ๋กœํ”ผ๋ฅผ ๊ณ„์‚ฐํ•˜๊ธฐ ์œ„ํ•ด ๋ชฌํ…Œ์นด๋ฅผ๋กœ ์ƒ˜ํ”Œ๋ง์— ์˜์กดํ•  ์ˆ˜๋ฐ–์— ์—†๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด ๊ฒฝ์šฐ ํ™•๋ฅ ์ด ๋‚ฎ์€ ๋ฌธ์žฅ๋“ค(low-probability sequences)์ด ๋กœ๊ทธ ๊ฐ’์— ์˜ํ•ด ์—”ํŠธ๋กœํ”ผ์— ๊ณผ๋„ํ•˜๊ฒŒ ๊ธฐ์—ฌํ•˜๊ฒŒ ๋˜๋ฉฐ, ์ƒ˜ํ”Œ ์ˆ˜๊ฐ€ ๋ถ€์กฑํ•  ๊ฒฝ์šฐ ์—”ํŠธ๋กœํ”ผ ์ถ”์ •์ด ๋ถˆ์•ˆ์ •ํ•ด์ง„๋‹ค๋Š” ๋ฌธ์ œ๊ฐ€ ์žˆ๋‹ค. ๋”๋ถˆ์–ด ์ž์—ฐ์–ด ์‘๋‹ต์€ ๊ธธ์ด๊ฐ€ ์ œ๊ฐ๊ฐ์ด๊ธฐ ๋•Œ๋ฌธ์—, ๊ธธ์ด์— ๋”ฐ๋ฅธ ๋กœ๊ทธ ํ™•๋ฅ ์˜ ๊ฐ์†Œ๋กœ ์ธํ•ด ๊ธด ๋ฌธ์žฅ์ด ๋ฌด์กฐ๊ฑด ๋” ๋ถˆํ™•์‹คํ•˜๋‹ค๊ณ  ํ‰๊ฐ€๋˜๋Š” ๊ธธ์ด ํŽธํ–ฅ(length bias) ๋ฌธ์ œ๋„ ์กด์žฌํ•œ๋‹ค. ์ด๋ฅผ ๋ง‰๊ธฐ ์œ„ํ•ด ๊ธธ์ด ์ •๊ทœํ™”๋œ ์—”ํŠธ๋กœํ”ผ๊ฐ€ ์ œ์•ˆ๋˜๊ธด ํ–ˆ์ง€๋งŒ, ํ•ญ์ƒ ์ด์ƒ์ ์ธ ํ•ด๋ฒ•์€ ์•„๋‹ˆ๋‹ค. ์ •๋‹ต์ด ์งง์€ ๊ฒฝ์šฐ(์˜ˆ: TriviaQA)์—๋Š” ์œ ํšจํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ๋‹ค์–‘ํ•œ ๊ธธ์ด์˜ ์ •๋‹ต์ด ์กด์žฌํ•˜๋Š” ๊ฒฝ์šฐ(CoQA ๋“ฑ)์—๋Š” ์˜คํžˆ๋ ค ์™œ๊ณก์„ ์ดˆ๋ž˜ํ•  ์ˆ˜ ์žˆ๋‹ค.

์ด์ฒ˜๋Ÿผ ๊ธฐ์กด์˜ ๋ถˆํ™•์‹ค์„ฑ ์ธก์ • ๋ฐฉ์‹์€ ํ‘œํ˜„์˜ ๋‹ค์–‘์„ฑ๊ณผ ๋ฌธ์žฅ์˜ ๊ตฌ์กฐ์  ํŠน์„ฑ์„ ์ถฉ๋ถ„ํžˆ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•˜๋ฉฐ, ํŠนํžˆ ๊ฐ™์€ ์˜๋ฏธ๋ฅผ ๊ฐ€์ง„ ๋‹ค์–‘ํ•œ ํ‘œํ˜„๋“ค์— ๋Œ€ํ•ด ์ธ์œ„์ ์œผ๋กœ ๋†’์€ ๋ถˆํ™•์‹ค์„ฑ์„ ๋ถ€์—ฌํ•˜๋Š” ๋ฌธ์ œ๊ฐ€ ์žˆ๋‹ค.

์˜๋ฏธ ๊ธฐ๋ฐ˜ ๋ถˆํ™•์‹ค์„ฑ ์ธก์ • (Semantic Entropy)

๊ธฐ์กด์˜ ๋ถˆํ™•์‹ค์„ฑ ์ธก์ • ๋ฐฉ์‹์€ ์–ธ์–ด ๋ชจ๋ธ์ด ์ƒ์„ฑํ•œ ๋ฌธ์žฅ์„ ๊ฐ๊ธฐ ๋…๋ฆฝ์ ์ธ ์‹œํ€€์Šค๋กœ ๊ฐ„์ฃผํ•˜์—ฌ ํ™•๋ฅ ์„ ๊ณ„์‚ฐํ•œ๋‹ค. ํ•˜์ง€๋งŒ ์ž์—ฐ์–ด์—์„œ๋Š” ํ‘œํ˜„์ด ๋‹ฌ๋ผ๋„ ์˜๋ฏธ๊ฐ€ ๋™์ผํ•œ ๋ฌธ์žฅ๋“ค์ด ๋‹ค์ˆ˜ ์กด์žฌํ•œ๋‹ค. ๋”ฐ๋ผ์„œ ๋ฌธ์žฅ ์ž์ฒด๊ฐ€ ์•„๋‹Œ, ๋ฌธ์žฅ์ด ๋‹ด๊ณ  ์žˆ๋Š” ์˜๋ฏธ(semantic meaning)๋ฅผ ๊ธฐ์ค€์œผ๋กœ ๋ถˆํ™•์‹ค์„ฑ์„ ์ธก์ •ํ•ด์•ผ ํ•œ๋‹ค๋Š” ํ•„์š”์„ฑ์ด ์ œ๊ธฐ๋˜์—ˆ๊ณ , ์ €์ž๋“ค์€ Semantic Entropy๋ผ๋Š” ์ƒˆ๋กœ์šด ์ง€ํ‘œ๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ํ•ต์‹ฌ ์•„์ด๋””์–ด๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. ์–ธ์–ด ๋ชจ๋ธ์ด ์ƒ์„ฑํ•œ ์—ฌ๋Ÿฌ ๋ฌธ์žฅ ์ค‘์—์„œ ๊ฐ™์€ ์˜๋ฏธ๋ฅผ ๊ฐ€์ง„ ๋ฌธ์žฅ๋“ค์„ ํ•˜๋‚˜์˜ โ€˜์˜๋ฏธ ์ง‘ํ•ฉ(semantic class)โ€™์œผ๋กœ ๋ฌถ๊ณ , ์ด ์˜๋ฏธ ๋‹จ์œ„๋กœ ๋ถˆํ™•์‹ค์„ฑ์„ ๊ณ„์‚ฐํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.

๊ตฌ์ฒด์ ์œผ๋กœ, ๋‹ค์Œ๊ณผ ๊ฐ™์€ 3๋‹จ๊ณ„ ์ ˆ์ฐจ๋ฅผ ๋”ฐ๋ฅธ๋‹ค.

  1. ์ƒ˜ํ”Œ๋ง: ์ฃผ์–ด์ง„ ์งˆ๋ฌธ์ด๋‚˜ ๋ฌธ๋งฅ \(๐‘ฅ\) ์— ๋Œ€ํ•ด ์–ธ์–ด ๋ชจ๋ธ๋กœ๋ถ€ํ„ฐ \(๐‘€\) ๊ฐœ์˜ ๋ฌธ์žฅ \(s^{(1)},\ s^{(2)},\ \dots,\ s^{(M)}\)์„ ์ƒ˜ํ”Œ๋งํ•œ๋‹ค.
  2. ์˜๋ฏธ ํด๋Ÿฌ์Šคํ„ฐ๋ง: ์ด๋“ค ๋ฌธ์žฅ์„ ์„œ๋กœ ์˜๋ฏธ๊ฐ€ ๊ฐ™์€ ๊ฒƒ๋“ค๋ผ๋ฆฌ ๋ฌถ๋Š”๋‹ค. ๋‘ ๋ฌธ์žฅ์ด ์„œ๋กœ๋ฅผ ์–‘๋ฐฉํ–ฅ์œผ๋กœ ํ•จ์˜(entailment)ํ•˜๋ฉด ๊ฐ™์€ ์˜๋ฏธ๋ฅผ ๊ฐ€์ง„ ๊ฒƒ์œผ๋กœ ํŒ๋‹จํ•œ๋‹ค.
  3. ์˜๋ฏธ ๊ธฐ๋ฐ˜ ์—”ํŠธ๋กœํ”ผ ๊ณ„์‚ฐ: ๊ฐ™์€ ์˜๋ฏธ ์ง‘ํ•ฉ ๋‚ด์˜ ๋ฌธ์žฅ ํ™•๋ฅ ๋“ค์„ ํ•ฉ์‚ฐํ•˜์—ฌ ์˜๋ฏธ ๋‹จ์œ„์˜ ํ™•๋ฅ  ๋ถ„ํฌ๋ฅผ ๋งŒ๋“ค๊ณ , ์ด์— ๋Œ€ํ•œ ์—”ํŠธ๋กœํ”ผ๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค.

์ด ๊ณผ์ •์„ ์ˆ˜์‹์œผ๋กœ ์ •๋ฆฌํ•˜๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. ๋จผ์ € ์˜๋ฏธ ์ง‘ํ•ฉ \(๐‘ โˆˆ ๐ถ\) ์˜ ํ™•๋ฅ ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋œ๋‹ค.

\[p(c \mid x) = \sum_{s \in c} p(s \mid x)\]

์ด์ œ ์ „์ฒด ์˜๋ฏธ ๊ณต๊ฐ„ \(C\)์— ๋Œ€ํ•ด Semantic Entropy๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๊ณ„์‚ฐ๋œ๋‹ค.

\[H_{\text{semantic}}(x) = - \sum_{c \in C} p(c \mid x) \log p(c \mid x)\]

์ด๋•Œ ์‹ค์ œ ๋ชจ๋ธ์ด ์ƒ์„ฑํ•˜๋Š” ๋ฌธ์žฅ๋“ค์€ ์ „์ฒด ์˜๋ฏธ ๊ณต๊ฐ„์˜ ์ผ๋ถ€๋งŒ ๋ฐ˜์˜ํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ์œ„ ์ˆ˜์‹์€ ์ƒ˜ํ”Œ๋ง ๊ธฐ๋ฐ˜ Monte Carlo ๊ทผ์‚ฌ๋กœ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ํ‘œํ˜„๋œ๋‹ค:

\[H_{\text{semantic}}(x) \approx - \frac{1}{|C|} \sum_{i=1}^{|C|} \log p(C_i \mid x)\]

์ด ๋ฐฉ์‹์€ ํ‘œํ˜„์˜ ๋‹ค์–‘์„ฑ์„ ํ—ˆ์šฉํ•˜๋ฉด์„œ๋„ ์˜๋ฏธ์˜ ๋ถˆํ™•์‹ค์„ฑ๋งŒ์„ ์ธก์ •ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ ์—์„œ, ๊ธฐ์กด ๋ฐฉ์‹๋ณด๋‹ค ํ›จ์”ฌ ๋” ์ง๊ด€์ ์ด๊ณ  ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์ง€ํ‘œ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.

๐ŸŽฏ ์˜ˆ์‹œ: ์˜๋ฏธ ๊ธฐ๋ฐ˜ ์—”ํŠธ๋กœํ”ผ ๊ณ„์‚ฐ

Semantic Entropy๊ฐ€ ๊ธฐ์กด ๋ฐฉ์‹๊ณผ ์–ด๋–ป๊ฒŒ ๋‹ค๋ฅธ์ง€๋ฅผ ์ง๊ด€์ ์œผ๋กœ ๋ณด์—ฌ์ฃผ๊ธฐ ์œ„ํ•ด, ๊ฐ„๋‹จํ•œ ์˜ˆ์‹œ๋ฅผ ํ†ตํ•ด ๋น„๊ตํ•ด๋ณด์ž. ์˜ˆ๋ฅผ ๋“ค์–ด, โ€œํ”„๋ž‘์Šค์˜ ์ˆ˜๋„๋Š” ์–ด๋””์ธ๊ฐ€์š”?โ€๋ผ๋Š” ์งˆ๋ฌธ์— ๋Œ€ํ•ด ์–ธ์–ด ๋ชจ๋ธ์ด ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์„ธ ๋ฌธ์žฅ์„ ์ƒ์„ฑํ–ˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜์ž.

๋ฌธ์žฅํ™•๋ฅ  ( p(s \(\mid\) x) )
A: โ€œํŒŒ๋ฆฌ์ž…๋‹ˆ๋‹ค.โ€0.5
B: โ€œํ”„๋ž‘์Šค์˜ ์ˆ˜๋„๋Š” ํŒŒ๋ฆฌ์˜ˆ์š”.โ€0.4
C: โ€œ๋Ÿฐ๋˜์ž…๋‹ˆ๋‹ค.โ€0.1

๊ธฐ์กด์˜ ์—”ํŠธ๋กœํ”ผ ๊ณ„์‚ฐ ๋ฐฉ์‹์€ ์ด ์„ธ ๋ฌธ์žฅ์„ ๋ชจ๋‘ ๋…๋ฆฝ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•˜์—ฌ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์—”ํŠธ๋กœํ”ผ๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค.

\[H = - (0.5 * log 0.5 + 0.4 * log 0.4 + 0.1 * log 0.1) โ‰ˆ 0.94\]

์ด ๊ฐ’์€ ๋ชจ๋ธ์ด ์ƒ๋‹นํ•œ ๋ถˆํ™•์‹ค์„ฑ์„ ๊ฐ–๋Š” ๊ฒƒ์œผ๋กœ ํ•ด์„๋œ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ A์™€ B๋Š” ์˜๋ฏธ์ ์œผ๋กœ ๋™์ผํ•œ ๋ฌธ์žฅ์ด๋ฉฐ, ์ด๋Š” ์‚ฌ๋žŒ์ด๋ผ๋ฉด ์‰ฝ๊ฒŒ ์ธ์ง€ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋ฅผ ๊ณ ๋ คํ•ด A์™€ B๋ฅผ ํ•˜๋‚˜์˜ ์˜๋ฏธ ์ง‘ํ•ฉ(semantic class)์œผ๋กœ ๋ฌถ์œผ๋ฉด, ์˜๋ฏธ ๊ธฐ๋ฐ˜ ํ™•๋ฅ ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๊ตฌ์„ฑ๋œ๋‹ค.

์˜๋ฏธ ์ง‘ํ•ฉ 1 (โ€œํŒŒ๋ฆฌโ€ ๊ด€๋ จ ๋‹ต๋ณ€๋“ค):

  • ์˜๋ฏธ ์ง‘ํ•ฉ 1 (โ€œํŒŒ๋ฆฌโ€ ๊ด€๋ จ): 0.5 + 0.4 = 0.9
  • ์˜๋ฏธ ์ง‘ํ•ฉ 2 (โ€œ๋Ÿฐ๋˜โ€): 0.1

์ด์ œ ์˜๋ฏธ ๋‹จ์œ„๋กœ ์—”ํŠธ๋กœํ”ผ๋ฅผ ๊ณ„์‚ฐํ•˜๋ฉด:

\[H_semantic = - (0.9 * log 0.9 + 0.1 * log 0.1) โ‰ˆ 0.33\]

โ†’ ์˜๋ฏธ๋ฅผ ๊ธฐ์ค€์œผ๋กœ ๋ฌถ์œผ๋ฉด ์‹ค์ œ ๋ถˆํ™•์‹ค์„ฑ์ด ํ›จ์”ฌ ๋‚ฎ๊ฒŒ ์ธก์ •๋จ.

์ฆ‰, ํ‘œ๋ฉด์ ์œผ๋กœ๋Š” ๋‹ค์–‘ํ•œ ๋‹ต๋ณ€์ด ์กด์žฌํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋ณด์˜€์ง€๋งŒ, ์˜๋ฏธ์  ๊ธฐ์ค€์œผ๋กœ ๋ณด๋ฉด ๋Œ€๋ถ€๋ถ„์˜ ํ™•๋ฅ ์ด ํ•˜๋‚˜์˜ ์ •๋‹ต์— ๋ชฐ๋ ค ์žˆ์œผ๋ฉฐ, ์‹ค์ œ ๋ถˆํ™•์‹ค์„ฑ์€ ํ›จ์”ฌ ๋‚ฎ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.

๐Ÿ“˜ ๊ด€๋ จ ์—ฐ๊ตฌ

๋…ผ๋ฌธ์€ ๊ธฐ์กด ์–ธ์–ด ๋ชจ๋ธ์˜ ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ • ์—ฐ๊ตฌ์™€ ์ฐจ๋ณ„ํ™”๋œ ์ ‘๊ทผ์„ ์‹œ๋„ํ•œ๋‹ค. ๋Œ€๋ถ€๋ถ„์˜ ๊ธฐ์กด ์—ฐ๊ตฌ๋“ค์€ ๋ถ„๋ฅ˜(classification) ๋˜๋Š” ํšŒ๊ท€(regression) ๋ฌธ์ œ์—์„œ ์˜ˆ์ธก์˜ ์‹ ๋ขฐ๋„๋ฅผ ์ถ”์ •ํ•˜๋Š” ๋ฐ ์ง‘์ค‘ํ•ด์™”์œผ๋ฉฐ, ์ด๋•Œ ์‚ฌ์šฉ๋˜๋Š” ์ฃผ์š” ๋ฐฉ๋ฒ•์€ ํ™•๋ฅ  ๋ณด์ •(calibration)์— ์ดˆ์ ์„ ๋‘”๋‹ค. ๋Œ€ํ‘œ์ ์ธ ์˜ˆ๋กœ๋Š” Brier score, Monte Carlo Dropout, Deep Ensembles ๋“ฑ์ด ์žˆ์œผ๋ฉฐ, ์ด๋“ค์€ ๋ชจ๋ธ์˜ ์˜ˆ์ธก ํ™•๋ฅ ์ด ์–ผ๋งˆ๋‚˜ ์‹ค์ œ ์ •๋‹ต ํ™•๋ฅ ๊ณผ ์ผ์น˜ํ•˜๋Š”์ง€๋ฅผ ์ธก์ •ํ•œ๋‹ค.

์ž์—ฐ์–ด ์ƒ์„ฑ(NLG)์—์„œ์˜ ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ •์—๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ธฐ์กด ์ ‘๊ทผ ๋ฐฉ์‹๋“ค์ด ์žˆ๋‹ค. ๋จผ์ €, ์˜ˆ์ธก ์—”ํŠธ๋กœํ”ผ(Predictive Entropy)๋Š” ์ƒ์„ฑ๋œ ๋ฌธ์žฅ ์ž์ฒด์˜ ํ™•๋ฅ  ๋ถ„ํฌ๋กœ๋ถ€ํ„ฐ ์—”ํŠธ๋กœํ”ผ๋ฅผ ๊ณ„์‚ฐํ•ด ๋ถˆํ™•์‹ค์„ฑ์„ ์ถ”์ •ํ•œ๋‹ค. ์ด ๋ฐฉ์‹์€ ์ผ๋ฐ˜์ ์œผ๋กœ ํ™•๋ฅ ์ด ๋ถ„์‚ฐ๋˜์–ด ์žˆ์„์ˆ˜๋ก ๋†’์€ ๊ฐ’์„ ๊ฐ–๋Š”๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด ๋ฐฉ์‹์€ ๊ธด ๋ฌธ์žฅ์ด ๋ถˆ๋ฆฌํ•˜๋‹ค๋Š” ๋ฌธ์ œ๋ฅผ ๋‚ดํฌํ•˜๊ณ  ์žˆ์–ด, ์ด๋ฅผ ๋ณด์ •ํ•œ ๋ฐฉ์‹์œผ๋กœ ๊ธธ์ด ์ •๊ทœํ™”๋œ ์—”ํŠธ๋กœํ”ผ(Normalised Entropy)๊ฐ€ ์‚ฌ์šฉ๋œ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ์ „์ฒด ๋กœ๊ทธ ํ™•๋ฅ ์„ ๋ฌธ์žฅ ๊ธธ์ด๋กœ ๋‚˜๋ˆ„์–ด ์—”ํŠธ๋กœํ”ผ ๊ฐ’์„ ๋ณด์ •ํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค. ๋˜ํ•œ p(True)๋Š” ๋ชจ๋ธ์ด ์ •๋‹ต์„ ์ง์ ‘ ์ƒ์„ฑํ•  ํ™•๋ฅ ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ๋‹จ์ˆœํ•œ ์ง€ํ‘œ๋กœ, โ€œ๋ชจ๋ธ์ด ์–ผ๋งˆ๋‚˜ ์ •๋‹ต์— ์ž์‹  ์žˆ๋Š”๊ฐ€โ€๋ฅผ ์ˆ˜์น˜๋กœ ๋‚˜ํƒ€๋‚ธ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด ๋ฐฉ์‹์€ ํ•ด๋‹น ์ •๋‹ต์ด ๋‹จ ํ•˜๋‚˜๋กœ ์ •์˜๋˜์–ด ์žˆ์–ด์•ผ ํ•˜๋ฉฐ, NLG์ฒ˜๋Ÿผ ๋‹ค์–‘ํ•œ ์ •๋‹ต์ด ์กด์žฌํ•˜๋Š” ๊ฒฝ์šฐ์—๋Š” ์ ์ ˆํ•˜์ง€ ์•Š๋‹ค. Lexical similarity ๊ธฐ๋ฐ˜ ์ ‘๊ทผ์€ Rouge-L ๋“ฑ์˜ ๋‹จ์–ด ์ˆ˜์ค€ ์œ ์‚ฌ๋„๋ฅผ ํ†ตํ•ด ์˜ˆ์ธก ํ’ˆ์งˆ์„ ๊ฐ„์ ‘ ์ถ”์ •ํ•œ๋‹ค. ์ด๋Š” ํŠนํžˆ ์š”์•ฝ(summarization)์ด๋‚˜ QA ๊ฐ™์€ ํƒœ์Šคํฌ์—์„œ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜์ง€๋งŒ, ํ‘œํ˜„๋งŒ ๋‹ค๋ฅด๊ณ  ์˜๋ฏธ๋Š” ๊ฐ™์€ ๋ฌธ์žฅ์— ๋Œ€ํ•ด ์ž˜๋ชป๋œ ๋ถˆํ™•์‹ค์„ฑ์„ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋‹ค.

์œ„์˜ ๋ฐฉ์‹๋“ค์€ ๋Œ€๋ถ€๋ถ„ ํ† ํฐ ๋‹จ์œ„์˜ ์‹œํ€€์Šค๋ฅผ ๋…๋ฆฝ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•˜๊ฑฐ๋‚˜, ๋‹จ์ผ ์ •๋‹ต ๊ธฐ์ค€์˜ ํ™•๋ฅ ์— ์˜์กดํ•œ๋‹ค๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค. ํ‘œํ˜„์ด ๋‹ค๋ฅด์ง€๋งŒ ์˜๋ฏธ๊ฐ€ ๊ฐ™์€ ๋ฌธ์žฅ๋“ค์„ ๊ฐ๊ฐ ๋…๋ฆฝ์ ์œผ๋กœ ์ทจ๊ธ‰ํ•˜๋ฉด, ์‹ค์ œ๋ณด๋‹ค ๋” ๋†’์€ ์—”ํŠธ๋กœํ”ผ๊ฐ€ ๊ณ„์‚ฐ๋˜์–ด ๋ชจ๋ธ์ด ๋งˆ์น˜ ํ™•์‹ ์ด ์—†๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋ณด์ด๊ฒŒ ๋œ๋‹ค. ํŠนํžˆ ์ž์—ฐ์–ด ์ƒ์„ฑ์€ ํ‘œํ˜„์˜ ๋‹ค์–‘์„ฑ์ด ์ค‘์š”ํ•œ ์˜์—ญ์ด๊ธฐ ๋•Œ๋ฌธ์—, ์ด๋Ÿฌํ•œ ๋ฐฉ์‹์€ ๋ณธ์งˆ์ ์œผ๋กœ NLG์—์„œ์˜ ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ •์— ์ ํ•ฉํ•˜์ง€ ์•Š๋‹ค. ์ด๋Ÿฌํ•œ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด, ๋…ผ๋ฌธ์€ ์˜๋ฏธ์  ๋™์น˜์„ฑ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋Š” Semantic Entropy๋ฅผ ์ œ์•ˆํ•˜๊ฒŒ ๋˜์—ˆ์œผ๋ฉฐ, ์•ž์„œ ์„ค๋ช…ํ•˜์˜€๋“ฏ์ด unsupervised ๋ฐฉ์‹์œผ๋กœ ์ž‘๋™ํ•˜๋ฉฐ, ์˜๋ฏธ์ ์œผ๋กœ ๋™์ผํ•œ ๋ฌธ์žฅ๋“ค์„ ํ•˜๋‚˜์˜ ํด๋ž˜์Šค(semantic equivalence class)๋กœ ๋ฌถ์–ด ์—”ํŠธ๋กœํ”ผ๋ฅผ ๊ณ„์‚ฐํ•จ์œผ๋กœ์จ, ๊ธฐ์กด ๋ฐฉ์‹๋“ค์ด ๋†“์น˜๊ณ  ์žˆ๋˜ โ€œ์˜๋ฏธ ์ฐจ์›์˜ ๋ถˆํ™•์‹ค์„ฑโ€์„ ์ •๋ฐ€ํ•˜๊ฒŒ ์ธก์ •ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•œ๋‹ค.

๋‹ค์Œ ๊ทธ๋ฆผ์€ ์ด๋Ÿฌํ•œ ๋‹ค์–‘ํ•œ ๊ธฐ์กด ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ • ๋ฐฉ๋ฒ•๋“ค๊ณผ Semantic Entropy๋ฅผ ๋น„๊ตํ•œ ๊ฒฐ๊ณผ๋ฅผ ์‹œ๊ฐ์ ์œผ๋กœ ๋ณด์—ฌ์ค€๋‹ค. Figure 1.(a)๋Š” 30B ํŒŒ๋ผ๋ฏธํ„ฐ OPT ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ด TriviaQA ๋ฐ์ดํ„ฐ์…‹์— ๋Œ€ํ•ด ๊ฐ ๋ฐฉ๋ฒ•์˜ AUROC๋ฅผ ์ธก์ •ํ•œ ๊ฒฐ๊ณผ๋กœ, Semantic Entropy๊ฐ€ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋“ค๋ณด๋‹ค ๋†’์€ ์‹ ๋ขฐ๋„ ์˜ˆ์ธก ์„ฑ๋Šฅ์„ ๋ณด์ž„์„ ๋ณด์—ฌ์ค€๋‹ค. Figure 1.(b)๋Š” ๋ชจ๋ธ ํฌ๊ธฐ์— ๋”ฐ๋ฅธ AUROC ๋ณ€ํ™”๋ฅผ ๋น„๊ตํ•œ ๊ฒƒ์œผ๋กœ, Semantic Entropy๊ฐ€ ๋ชจ๋ธ ํฌ๊ธฐ ์ฆ๊ฐ€์— ๋”ฐ๋ผ ๊ฐ€์žฅ ์ผ๊ด€๋˜๊ฒŒ ์„ฑ๋Šฅ์ด ํ–ฅ์ƒ๋˜๋ฉฐ, ์ž‘์€ ๋ชจ๋ธ์—์„œ๋„ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋“ค๋ณด๋‹ค ์•ˆ์ •์ ์ธ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•จ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.

Desktop View
Figure 1: (a) Semantic Entropy์˜ AUROC ์šฐ์ˆ˜์„ฑ (b) ๋ชจ๋ธ ํฌ๊ธฐ์— ๋”ฐ๋ฅธ AUROC ๋น„๊ต

๐Ÿ“— ์‹คํ—˜ ๋ฐ ๊ฒฐ๊ณผ

์ด ๋…ผ๋ฌธ์€ ์ œ์•ˆํ•œ Semantic Entropy๊ฐ€ ๊ธฐ์กด์˜ ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ • ๋ฐฉ๋ฒ•๋“ค๋ณด๋‹ค ์ •๋‹ต๊ณผ ์˜ค๋‹ต์„ ๋” ์ •ํ™•ํ•˜๊ฒŒ ๊ตฌ๋ณ„ํ•  ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ์‹คํ—˜์„ ํ†ตํ•ด ๊ฒ€์ฆํ•œ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์–ธ์–ด ๋ชจ๋ธ์ด ์ž์‹  ์žˆ๊ฒŒ ํ•œ ์‘๋‹ต์ด ์‹ค์ œ๋กœ ์ •๋‹ต์ผ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์€์ง€, ๋˜๋Š” ๋ถˆํ™•์‹คํ•ด ํ•˜๋Š” ์‘๋‹ต์ด ์‹ค์ œ๋กœ ์˜ค๋‹ต์ธ์ง€ ์—ฌ๋ถ€๋ฅผ ์–ผ๋งˆ๋‚˜ ์ž˜ ํŒ๋ณ„ํ•  ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ํ‰๊ฐ€ํ–ˆ๋‹ค.์‹คํ—˜์— ์‚ฌ์šฉ๋œ ๋ชจ๋ธ์€ Meta์˜ OPT(Open Pre-trained Transformer) ์‹œ๋ฆฌ์ฆˆ๋กœ, 4๊ฐ€์ง€ ํฌ๊ธฐ(2.7B, 6.7B, 13B, 30B)์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ ๋ชจ๋ธ๋“ค์ด ํฌํ•จ๋˜์—ˆ๋‹ค. ์ด๋Š” ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ • ์ง€ํ‘œ๊ฐ€ ๋ชจ๋ธ์˜ ํฌ๊ธฐ์— ๋”ฐ๋ผ ์–ด๋–ป๊ฒŒ ์„ฑ๋Šฅ์ด ๋ณ€ํ™”ํ•˜๋Š”์ง€๋ฅผ ํ•จ๊ป˜ ๋ณด๊ธฐ ์œ„ํ•œ ์„ค์ •์ด๋‹ค.

๋ฐ์ดํ„ฐ์…‹์€ ๋‘ ๊ฐ€์ง€๊ฐ€ ์‚ฌ์šฉ๋˜์—ˆ๋‹ค.

  • TriviaQA: ์ •๋‹ต์„ ์™ธ์›Œ์•ผ ํ•˜๋Š” ์œ ํ˜•์˜ ์งˆ์˜์‘๋‹ต ํƒœ์Šคํฌ๋กœ, ๋ฌธ์„œ ์—†์ด ๋ฐ”๋กœ ๋‹ต์„ ์ƒ์„ฑํ•ด์•ผ ํ•˜๋Š” closed-book QA์ด๋‹ค.
  • CoQA: ๋ฌธ์„œ๋ฅผ ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ๋Š” open-book QA๋กœ, ๋ชจ๋ธ์ด ๋ฌธ๋งฅ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋‹ต์„ ์ƒ์„ฑํ•œ๋‹ค.

์ •๋‹ต ์—ฌ๋ถ€๋Š” ๋‹จ์ˆœํ•œ ์ •ํ™•๋„๋งŒ์œผ๋กœ ํŒ๋‹จํ•˜์ง€ ์•Š๊ณ , Rouge-L ์ ์ˆ˜๋ฅผ ๊ธฐ์ค€์œผ๋กœ ํ–ˆ๋‹ค. Rouge-L์€ ์ƒ์„ฑ๋œ ๋ฌธ์žฅ๊ณผ ์ •๋‹ต ๋ฌธ์žฅ ๊ฐ„์˜ ๊ธด ๊ณตํ†ต ์„œ์—ด(Longest Common Subsequence)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์ธก์ •๋˜๋ฉฐ, ์—ฌ๊ธฐ์„œ๋Š” 0.3 ์ด์ƒ์ด๋ฉด ์ •๋‹ต์œผ๋กœ ๊ฐ„์ฃผํ•œ๋‹ค. ์ด ๊ธฐ์ค€์€ ์˜๋ฏธ๋Š” ๊ฐ™์ง€๋งŒ ํ‘œํ˜„์ด ๋‹ค๋ฅธ ๋ฌธ์žฅ๋“ค์„ ํฌ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก ์„ค๊ณ„๋œ ๊ฒƒ์ด๋‹ค. ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ • ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋œ ํ•ต์‹ฌ ์ง€ํ‘œ๋Š” AUROC (Area Under the Receiver Operating Characteristic curve)์ด๋‹ค. AUROC๋Š” ๋ชจ๋ธ์ด โ€œ์ด ์‘๋‹ต์ด ์‹ ๋ขฐํ•  ๋งŒํ•œ๊ฐ€?โ€๋ฅผ ํŒ๋‹จํ•  ๋•Œ ์ •๋‹ต ์‘๋‹ต๊ณผ ์˜ค๋‹ต ์‘๋‹ต์„ ์–ผ๋งˆ๋‚˜ ์ž˜ ๊ตฌ๋ณ„ํ•˜๋Š”์ง€๋ฅผ ์ธก์ •ํ•œ๋‹ค. AUROC ๊ฐ’์ด 1์— ๊ฐ€๊นŒ์šธ์ˆ˜๋ก ๊ตฌ๋ถ„ ๋Šฅ๋ ฅ์ด ๋›ฐ์–ด๋‚˜๊ณ , 0.5์— ๊ฐ€๊นŒ์šฐ๋ฉด ๋ฌด์ž‘์œ„ ์ถ”์ •๊ณผ ๋‹ค๋ฅผ ๋ฐ” ์—†๋Š” ์ˆ˜์ค€์ด๋ผ๋Š” ๋œป์ด๋‹ค.

์•„๋ž˜ Figure 2๋Š” ๋‘ ๋ฐ์ดํ„ฐ์…‹(CoQA์™€ TriviaQA)์— ๋Œ€ํ•ด, ๋ชจ๋ธ ํฌ๊ธฐ๊ฐ€ ์ฆ๊ฐ€ํ•จ์— ๋”ฐ๋ผ ๋‹ค์–‘ํ•œ ๋ถˆํ™•์‹ค์„ฑ ์ง€ํ‘œ๋“ค์˜ AUROC๊ฐ€ ์–ด๋–ป๊ฒŒ ๋ณ€ํ™”ํ•˜๋Š”์ง€๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.

Desktop View
Figure 2: CoQA (a)์™€ TriviaQA (b)์— ๋Œ€ํ•œ ๋‹ค์–‘ํ•œ ์ง€ํ‘œ์˜ AUROC ๋น„๊ต.

Figure 2(a)๋Š” CoQA ๊ฒฐ๊ณผ๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. ์ด ๊ฒฝ์šฐ, ๋ชจ๋“  ๋ชจ๋ธ ํฌ๊ธฐ์—์„œ Semantic Entropy๊ฐ€ ๊ฐ€์žฅ ๋†’์€ AUROC๋ฅผ ๊ธฐ๋กํ–ˆ์ง€๋งŒ, ๊ธฐ์กด ๋ฐฉ๋ฒ•๋“ค๊ณผ์˜ ์„ฑ๋Šฅ ์ฐจ์ด๋Š” ๋น„๊ต์  ์ž‘์•˜๋‹ค. ์ฆ‰, CoQA์ฒ˜๋Ÿผ ๋ฌธ์„œ๋ฅผ ์ฐธ๊ณ ํ•ด๋„ ๋˜๋Š” QA์—์„œ๋Š” ๊ธฐ์กด ๋ฐฉ์‹๋“ค๋„ ์–ด๋А ์ •๋„ ์œ ํšจํ•˜๊ฒŒ ์ž‘๋™ํ•˜์ง€๋งŒ, ๊ทธ๋Ÿผ์—๋„ Semantic Entropy๊ฐ€ ๊ฐ€์žฅ ์ผ๊ด€๋˜๊ฒŒ ๋†’์€ ์‹ ๋ขฐ๋„ ์ถ”์ • ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค๋Š” ์ ์—์„œ ์šฐ์ˆ˜ํ•˜๋‹ค. ๋ฐ˜๋ฉด Figure 2(b)๋Š” TriviaQA ๊ฒฐ๊ณผ๋กœ, Semantic Entropy์˜ ์„ฑ๋Šฅ์ด ํ›จ์”ฌ ๋‘๋“œ๋Ÿฌ์ง€๊ฒŒ ๋‚˜ํƒ€๋‚œ๋‹ค. ํŠนํžˆ p(True)์™€ Predictive Entropy ๊ฐ™์€ ๊ธฐ์กด ์ง€ํ‘œ๋“ค์€ AUROC๊ฐ€ ๋‚ฎ์•„, ์ •๋‹ต๊ณผ ์˜ค๋‹ต์„ ๋ช…ํ™•ํžˆ ๊ตฌ๋ณ„ํ•˜์ง€ ๋ชปํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ๋“œ๋Ÿฌ๋‚ธ๋‹ค. ๋ฐ˜๋ฉด Semantic Entropy๋Š” ๋ชจ๋ธ ํฌ๊ธฐ๊ฐ€ ์ปค์งˆ์ˆ˜๋ก ๊พธ์ค€ํžˆ ์„ฑ๋Šฅ์ด ํ–ฅ์ƒ๋˜๋ฉฐ, ๊ฐ€์žฅ ๊ฐ•๋ ฅํ•œ ์‹ ๋ขฐ๋„ ์ถ”์ • ์ง€ํ‘œ๋กœ ์ž‘์šฉํ–ˆ๋‹ค. ์ด ์‹คํ—˜์—์„œ๋Š” Semantic Entropy๊ฐ€ ๊ธฐ์กด ์ง€ํ‘œ๋“คโ€”Predictive Entropy, Normalised Entropy, p(True), Lexical Similarityโ€”๋ณด๋‹ค consistently ๋” ๋†’์€ AUROC๋ฅผ ๊ธฐ๋กํ–ˆ๋‹ค. ์ฆ‰, ๋ชจ๋ธ์ด ์‹ค์ œ๋กœ ํ˜ผ๋ž€์Šค๋Ÿฌ์šธ ๋•Œ ์˜๋ฏธ์ ์œผ๋กœ ๋‹ค์–‘ํ•œ ์‘๋‹ต์„ ๋งŽ์ด ์ƒ์„ฑํ•˜๋Š” ๊ฒฝํ–ฅ์„ Semantic Entropy๊ฐ€ ์ •ํ™•ํžˆ ํฌ์ฐฉํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.

์ด๋ฅผ ๋” ์ •๋Ÿ‰์ ์œผ๋กœ ๋ณด์ž๋ฉด, ์˜๋ฏธ์ ์œผ๋กœ ๊ฐ™์€ ์‘๋‹ต์„ ํ•˜๋‚˜์˜ ํด๋Ÿฌ์Šคํ„ฐ๋กœ ๋ฌถ์—ˆ์„ ๋•Œ ๊ทธ ์˜๋ฏธ ์ง‘ํ•ฉ(semantic cluster)์˜ ์ˆ˜๊ฐ€ ์ •๋‹ต๊ณผ ์˜ค๋‹ต ๊ฐ„์— ์ฐจ์ด๊ฐ€ ์žˆ์—ˆ๋‹ค.

  • TriviaQA์˜ ๊ฒฝ์šฐ ์ •๋‹ต์ผ ๋•Œ ํ‰๊ท  1.89๊ฐœ, ์˜ค๋‹ต์ผ ๋•Œ ํ‰๊ท  3.89๊ฐœ์˜ ์˜๋ฏธ ์ง‘ํ•ฉ์ด ์ƒ์„ฑ๋˜์—ˆ๋‹ค.
  • CoQA์˜ ๊ฒฝ์šฐ ์ •๋‹ต์€ ํ‰๊ท  1.27๊ฐœ, ์˜ค๋‹ต์€ ํ‰๊ท  1.77๊ฐœ๋กœ, ์˜ค๋‹ต์ผ์ˆ˜๋ก ๋ชจ๋ธ์ด ๋‹ค์–‘ํ•œ ์˜๋ฏธ๋ฅผ ์ƒ์„ฑํ•˜๋ฉฐ ๋” ํ˜ผ๋ž€์Šค๋Ÿฌ์›Œํ•˜๋Š” ์–‘์ƒ์„ ๋ณด์˜€๋‹ค.

์ด๋Š” Semantic Entropy๊ฐ€ ๋‹จ์ˆœํžˆ ํ™•๋ฅ  ๋ถ„ํฌ๊ฐ€ ํผ์ ธ ์žˆ๋Š” ์ •๋„๋งŒ ๋ณด๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์˜๋ฏธ ์ฐจ์›์—์„œ์˜ ๋‹ค์–‘์„ฑ์„ ํ†ตํ•ด ๋ชจ๋ธ์˜ ๋ถˆํ™•์‹ค์„ฑ์„ ์ •ํ™•ํžˆ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ค€๋‹ค.

์ƒ˜ํ”Œ๋ง ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ๋ถ„์„

Desktop View
Figure 3: ์ƒ˜ํ”Œ ์ˆ˜ ๋ฐ ์ƒ˜ํ”Œ๋ง temperature๊ฐ€ Semantic Entropy ์„ฑ๋Šฅ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ. (a) AUROC vs. ์ƒ˜ํ”Œ ์ˆ˜, (b) AUROC ๋ฐ ์ •ํ™•๋„/๋‹ค์–‘์„ฑ vs. temperature

Semantic Entropy๋Š” ์ƒ˜ํ”Œ๋ง ๊ธฐ๋ฐ˜์œผ๋กœ ๋™์ž‘ํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ๋ช‡ ๊ฐœ์˜ ์‘๋‹ต์„ ์ƒ˜ํ”Œ๋งํ•˜๋А๋ƒ, ์–ด๋–ค temperature ์„ค์ •์œผ๋กœ ์ƒ˜ํ”Œ๋งํ•˜๋А๋ƒ์— ๋”ฐ๋ผ ์„ฑ๋Šฅ์ด ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ๋‹ค. Figure 3์€ ๋‘ ๊ฐ€์ง€ ์š”์†Œโ€”์ƒ˜ํ”Œ ์ˆ˜์™€ temperatureโ€”๊ฐ€ Semantic Entropy์˜ AUROC ๋ฐ ์ถœ๋ ฅ ๋‹ค์–‘์„ฑ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์ •๋Ÿ‰์ ์œผ๋กœ ๋ถ„์„ํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.

์™ผ์ชฝ์˜ ๋‘ ๊ทธ๋ž˜ํ”„๋Š” ๊ฐ๊ฐ CoQA (top)์™€ TriviaQA (bottom)์—์„œ ์ƒ˜ํ”Œ ์ˆ˜๊ฐ€ ์ฆ๊ฐ€ํ•จ์— ๋”ฐ๋ผ AUROC๊ฐ€ ์–ด๋–ป๊ฒŒ ๋ณ€ํ•˜๋Š”์ง€๋ฅผ ๋ณด์—ฌ์ค€๋‹ค. ์ „๋ฐ˜์ ์œผ๋กœ Semantic Entropy๋Š” ๋‹จ 3~5๊ฐœ์˜ ์ƒ˜ํ”Œ๋งŒ์œผ๋กœ๋„ ๊ธฐ์กด ๋ฐฉ์‹๋ณด๋‹ค ๋” ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ, ์ƒ˜ํ”Œ ์ˆ˜๊ฐ€ 10๊ฐœ๊นŒ์ง€ ๋Š˜์–ด๋‚˜๋„ ์•ˆ์ •์ ์œผ๋กœ AUROC๊ฐ€ ์ฆ๊ฐ€ํ•œ๋‹ค. ๋ฐ˜๋ฉด, ๊ธฐ์กด์˜ Predictive Entropy๋‚˜ Length-normalized Entropy๋Š” ์ฆ๊ฐ€ ํญ์ด ์ž‘๊ฑฐ๋‚˜ ๊ฑฐ์˜ ์ผ์ •ํ•˜๋‹ค. ์ด ๊ฒฐ๊ณผ๋Š” Semantic Entropy๊ฐ€ ์ƒ˜ํ”Œ ํšจ์œจ(sample efficiency)์ด ๋›ฐ์–ด๋‚˜๋‹ค๋Š” ์ ์„ ์‹œ์‚ฌํ•œ๋‹ค.

์˜ค๋ฅธ์ชฝ์˜ ๋‘ ๊ทธ๋ž˜ํ”„๋Š” ์ƒ˜ํ”Œ๋ง temperature๋ฅผ ์กฐ์ ˆํ–ˆ์„ ๋•Œ Semantic Entropy๊ฐ€ ์–ด๋–ป๊ฒŒ ๋‹ฌ๋ผ์ง€๋Š”์ง€๋ฅผ ๋ณด์—ฌ์ค€๋‹ค. ์œ„ ๊ทธ๋ž˜ํ”„์—์„œ๋Š” temperature๊ฐ€ 0.5์ผ ๋•Œ AUROC๊ฐ€ ๊ฐ€์žฅ ๋†’๊ฒŒ ๋‚˜ํƒ€๋‚ฌ์œผ๋ฉฐ, ์ด๋Š” ์ •ํ™•๋„์™€ ๋‹ค์–‘์„ฑ ์‚ฌ์ด์˜ ๊ท ํ˜•์ด ๊ฐ€์žฅ ์ž˜ ๋งž๋Š” ์ง€์ ์ด๋ผ๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค. ์•„๋ž˜ ๊ทธ๋ž˜ํ”„์—์„œ๋Š” temperature๊ฐ€ ๋†’์•„์งˆ์ˆ˜๋ก ์ƒ์„ฑ๋˜๋Š” ๋ฌธ์žฅ์˜ ๋‹ค์–‘์„ฑ์€ ์ฆ๊ฐ€ํ•˜์ง€๋งŒ, ํ‰๊ท  ์ •ํ™•๋„๋Š” ๊ฐ์†Œํ•˜๋Š” ๊ฒฝํ–ฅ์„ ๋ณด์ธ๋‹ค.

๋”ฐ๋ผ์„œ Semantic Entropy๋ฅผ ์‹ค์งˆ์ ์œผ๋กœ ์‚ฌ์šฉํ•  ๋•Œ๋Š” ์ ์ ˆํ•œ temperature ์„ค์ •๊ณผ ์†Œ์ˆ˜์˜ ๊ณ ํ’ˆ์งˆ ์ƒ˜ํ”Œ๋งŒ์œผ๋กœ๋„ ๋†’์€ ์‹ ๋ขฐ๋„ ์˜ˆ์ธก ์„ฑ๋Šฅ์„ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค๋Š” ์‹ค์šฉ์ ์ธ ์‹œ์‚ฌ์ ์„ ์ œ๊ณตํ•œ๋‹ค.

This post is licensed under CC BY 4.0 by the author.