๐ ๋ ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/2205.06058
Gong, S., & Zhu, K. Q. (2022, July). Positive, negative and neutral: Modeling implicit feedback in session-based news recommendation. In Proceedings of the 45th International ACM SIGIR Conference on Research and Development in Information Retrieval (pp. 1185-1195).
์ ์ ๊ฐ ํด๋ฆญํ์ง ์์ ๋ฐ์ดํฐ๋ ์ ์ ๊ฐ ์ข์ํ์ง ์๋(negative) ๋ฐ์ดํฐ์ผ๊น์?
์ ์ ๊ฐ ํด๋ฆญํ ๋ฐ์ดํฐ๋ ๊ณผ์ฐ ์ ์ ๊ฐ ์ข์ํ๋(positive) ๋ฐ์ดํฐ์ผ๊น์?
๋ณธ ๋ ผ๋ฌธ์ SIGIR2022์ ๋ฐํ๋ ์ฐ๊ตฌ๋ก, ์ฌ์ฉ์์ ๊ตฌ๋งค ์๊ฐ, ํจํด์ ๊ณ ๋ คํ๋ session-based recommendation๊ณผ implicit feedback์ ๋ํ ์ข์ ์ธ์ฌ์ดํธ๋ฅผ ์ป์ ์ ์๋ ๋ ผ๋ฌธ์ ๋๋ค. ๋จผ์ ๋ ผ๋ฌธ์ ์ดํดํ๊ธฐ ์ํด ํ์ํ ์ฉ์ด๋ฅผ ๋จผ์ ์์๋ณด๊ฒ ์ต๋๋ค.
- Implicit feedback: ์ ์ ์ ์๋ฌต์ ์ธ ํผ๋๋ฐฑ์ ์๋ฏธํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ์ ์ ๊ฐ ์น ํ์ด์ง๋ฅผ ๋ฐฉ๋ฌธํ๊ฑฐ๋ ์ํ์ ๊ฒ์ํ๋ ๋ฑ์ ํ๋์ ํตํด ์ฌ์ฉ์์ ๊ด์ฌ์ฌ๋ ์ ํธ๋๋ฅผ ํ์ ํ๋ ๊ฒ์ ๋๋ค.
- Explicit feedback์ ์ ์ ๊ฐ ๋ช ์์ ์ผ๋ก ํํํ ํผ๋๋ฐฑ์ ์๋ฏธํฉ๋๋ค. ์ ์ ๊ฐ ๋ณ์ ์ ๋งค๊ธฐ๊ฑฐ๋ ๋ฆฌ๋ทฐ๋ฅผ ์์ฑํ๋ ๋ฑ์ ๋ช ์์ ์ธ ๋ฐฉ์์ผ๋ก ์์ ์ ์ ํธ๋๋ฅผ ๋ํ๋ด๋ ๊ฒ์ ๋๋ค.
- Session-based recommendation: ์ ์ ์ ์ธ์ ์ ๊ธฐ๋ฐ์ผ๋ก ์ถ์ฒ์ ์ํํ๋ ์ถ์ฒ ์์คํ ๋ฐฉ๋ฒ๋ก ์ ๋๋ค. ์ผ๋ฐ์ ์ผ๋ก ์ธํฐ๋ท ์ฌ์ฉ์๋ค์ ์ธ์ ๋์ ์ฌ๋ฌ ๊ฐ์ ์ํธ์์ฉ์ ์ํํ๋ฉฐ, ์ด๋ฅผ ํตํด ์ฌ์ฉ์์ ๊ด์ฌ์ฌ์ ์ ํธ๋๋ฅผ ํ์ ํ ์ ์์ต๋๋ค. ์ธ์ ์ ์ฌ์ฉ์๊ฐ ์น ์ฌ์ดํธ๋ฅผ ๋ฐฉ๋ฌธํ๊ณ ํด๋ฆญ, ๊ฒ์, ๊ตฌ๋งค ๋ฑ์ ํ๋์ ์ํํ๋ ์ผ๋ จ์ ์ฐ์๋ ์ํธ์์ฉ์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค. ์ด๋ฌํ ์ํธ์์ฉ์ ๊ธฐ๋ฐ์ผ๋ก ์ฌ์ฉ์์๊ฒ ๊ฐ์ธํ๋ ์ถ์ฒ์ ์ ๊ณตํฉ๋๋ค.
๋ณธ ๋ ผ๋ฌธ์ ๋ด์ค ๊ธฐ์ฌ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ๋ ผ๋ฌธ์ ๋ฐ๋ฅด๋ฉด, ์ด์ ์ฐ๊ตฌ๋ค์ ์ธ์ ๊ธฐ๋ฐ ์ถ์ฒ์ ๋ค์ ์์ดํ ์์ธก์ผ๋ก ์ ์ํ์ฌ, ์ฌ์ฉ์์ ํ๋์์ implicit ํผ๋๋ฐฑ(์ฆ, ๋ ๋ง์ ์๊ฐ์ ์๋นํ ์ํฐํด)๊ณผ negative ํผ๋๋ฐฑ(์ฆ, ํด๋ฆญํ์ง ์๊ณ ๊ฑด๋๋ด ์ํฐํด)์ ๊ฐ๊ณผํ์ต๋๋ค. ์ ์๋ค์ ์ฌ์ฉ์์ ์ธ์ ์์ ์๊ฐ๊ณผ ๋ฐ์ดํฐ์ ๊ฒ์ ์๊ฐ(pubilshing time)์ ์ฌ์ฉํ์ฌ ์ฌ์ฉ์ ํ๋์ ์๋ฌต์ ์ผ๋ก ๋ชจ๋ธ๋งํ๋ ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค.
1. Introduction
BBC/CNN/Bing News์ ๊ฐ์ ํ๋ซํผ์๋ ๋ง์ ์ฌ๋๋ค์ด ์ต๋ช ์ด๋ ๋ฐฉ๋ฌธ์๋ก ๋ก๊ทธ์ธํ๋ ๋ฐฉ์์ผ๋ก ์ ์ํฉ๋๋ค. ์ผ๋ฐ์ ์ผ๋ก ๊ทธ๋ค์ ์งง์ ์๊ฐ ๋ด์ ๋ง์ ๊ธฐ์ฌ๋ฅผ ์ฝ์ง ์๊ธฐ ๋๋ฌธ์ ์ ํ๋ ์ํธ์์ฉ(limited interactions)์ด ํ์ฑ๋ฉ๋๋ค. ์์คํ ์ ์ด๋ฌํ ์ฌ์ฉ์์ ํ๋์ ์์ ํ ์ดํดํ๊ธฐ ์ด๋ ต์ต๋๋ค. ์ฆ, ๊ณผ์ฐ ์ฌ์ฉ์๊ฐ ํด๋ฆญํ๋ค๊ณ ํด์ positive feedback์ผ๋ก ๋ณผ ์ ์๋๊ฐ์ ๋ํ ์๋ฌธ์ด ์๊ธธ ์ ์์ต๋๋ค.
์ถ์ฒ ์์คํ ์์ ์ ํต์ ์ธ ๋ฐฉ๋ฒ์ ๋ด์ค ์ถ์ฒ์ CTR(ํด๋ฆญ๋ฅ ) ์์ธก์ผ๋ก ์ ์ํ๊ณ CF(ํ์ ํํฐ๋ง) ๋๋ FM(Factorization Machine)์ ์ฌ์ฉํ์ฌ ์ฌ์ฉ์์ ํ๋ ํจํด์ ์์ธกํฉ๋๋ค. ์ต๊ทผ์๋ ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ์ฌ์ฉํ์ฌ ์์ดํ ๊ณผ ๊ณผ ์ ์ ์ ๊ณ ์ ํ representaion์ ์ธ์ฝ๋ฉํ๋ ๋ฐ ์ค์ ์ ๋๊ณ ์์ผ๋ฉฐ, ๋ด์ค ์ถ์ฒ์ sequential ์์ ์ผ๋ก ๊ฐ์ฃผํฉ๋๋ค. ๋ ผ๋ฌธ์ ์ ์๋ค์ ๋ด์ค ์ถ์ฒ์ ์ธ์ ๊ธฐ๋ฐ ์ถ์ฒ์ผ๋ก ์ฒ๋ฆฌํฉ๋๋ค. ์ต์ข ๋ชฉํ๋ ์ด์ ์ธ์ ๋ด์ ํ๋ ์ํ์ค๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ค์ ๋ด์ค๋ฅผ ์์ธกํ๋ ๊ฒ์ ๋ค. ๋ด์ค ๊ธฐ์ฌ ํด๋ฆญ ์ฌ๋ถ๋ฅผ ๋ค๋ฃจ๊ธฐ ๋๋ฌธ์, ์์์ ์๊ฐํ implicit feedback์ ๋ํ ์ถ์ฒ์ ์ ์ํ๋ ๊ฒ์ ๋๋ค.
Implicit feedback์ ๋ฉ์ธ ํ์ด์ง๋ฅผ ๋๋ฌ๋ณด๊ฑฐ๋ ์ํฐํด์ ์ฝ๊ณ , ์ํฐํด ๋ซ๊ฑฐ๋ ๋๋์๊ฐ๋ ๋ฑ์ ๋ฐฉ์์ผ๋ก ์ถ์ถํ ์ ์์ต๋๋ค. ์ ์๋ค์ ์ด๋ฌํ Implicit feedback์ ํตํด explicit feedback์ ์๋กญ๊ฒ ๋ชจ๋ธ๋งํ๋ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํฉ๋๋ค.
์ ์ ๊ฐ ๊ธฐ์ฌ๋ฅผ ํด๋ฆญํ๋ค๋ฉด, ์ค์ ๋ก ์ข์ํ๋ค๋ ์๋ฏธ์ผ๊น์? ๊ทธ๋ ๋ค๋ฉด ๊ณผ์ฐ ์ ์ ๊ฐ ๊ธฐ์ฌ๋ฅผ ํด๋ฆญํ์ง ์์๋ค๋ฉด, negative sample๋ก ๊ฐ์ฃผํด๋ ๋ ๊น์?
์ ํต์ ์ธ ์ถ์ฒ ์์คํ ์์๋ ํด๋ฆญ์ ์ฌ์ฉ์์ ์ข์์/ํฌํ๋ฅผ ๋ํ๋ ๋๋ค. ๊ทธ๋ฌ๋ ๋ด์ค ์ถ์ฒ์์๋ ์ํฉ์ด ์ฝ๊ฐ ๋ค๋ฆ ๋๋ค. ์ฌ์ฉ์๋ ๊ด์ฌ์ด ์๋ ์ํฐํด์ ํด๋ฆญํ ์๋ ์์ผ๋ฉฐ, ํ ๋ฒ ํด๋ฆญํ ํ ์ฌ์ฉ์๊ฐ ์ธ์ํ๋ฉด ๋ฐ๋ก ๋ค๋ก ๊ฐ๊ธฐ๋ฅผ ํด๋ฆญํ๊ณ , ๋ค๋ฅธ ์ํฐํด๋ก ์ ํํ ์ ์์ต๋๋ค. ๋ฐ๋ผ์ ์ฌ์ฉ์๊ฐ ๊ธฐ์ฌ๋ฅผ ์ฝ๋ ๋ฐ ์์ํ ์๊ฐ์ ์ฌ์ฉ์์ ๊ธฐ์ฌ์ ๋ํ ์ ํธ๋๋ฅผ ๋ ์ธ๋ฐํ๊ฒ ๋ํ๋ผ ์ ์๋ ์ ๋ณด์ ๋๋ค. ๋ํ, ๊ธฐ์ฌ์ ์์๋ ์๊ฐ์ ์ฐ์์ ์ธ ๊ฐ์ด๋ฉฐ, ํด๋ฆญ ์ฌ๋ถ๋ ์ด์ง ๊ฐ์ ๋๋ค.
์ฌ์ฉ์๊ฐ ํด๋ฆญํ์ง ์์ ๋ด์ค ๊ธฐ์ฌ๋ ๊ทธ ๊ธฐ์ฌ๋ฅผ ์ซ์ดํ๋ค๋ ์๋ฏธ๋ ์๋๋๋ค. ์ฌ์ฉ์๊ฐ ๊ทธ ๋ฐ์ดํฐ์ ๋ ธ์ถ๋์ง ์์ ๊ฒ์ผ ๋ฟ์ ๋๋ค. ๋ด์ค ๋ฉ์ธ ํ์ด์ง์์, ์ํฐํด๋ค์ด publishing ์์๋๋ก ์ฌ์ฉ์์๊ฒ ์ ์๋๋ค๊ณ ๊ฐ์ ํ๋ฉด, ์ฐ๋ฆฌ๋ ์ด๋ค ๊ธฐ์ฌ๊ฐ ํน์ ์ธ์ ์์ ์ฌ์ฉ์์๊ฒ ์ธ์์ ์ฃผ์๋์ง๋ฅผ ์ถ๋ก ํ ์ ์์ต๋๋ค. ์ฆ, ๋ฉ์ธ ํค๋์ ์กด์ฌํ๋ ๊ธฐ์ฌ๋ฅผ ๋ฌด์ฌ์ฝ ํด๋ฆญํ ๊ฒ์ผ๋ก ๋ณผ ์ ์์ต๋๋ค. ์ต์ข ์ ์ผ๋ก, ์ ์ ๊ฐ ํ๋ํ ์๊ฐ์ ๊ธฐ์ฌ ํํ์ด์ง ๋ชฉ๋ก์ ๋ํ๋์ง๋ง ํด๋ฆญ๋์ง ์์ ๊ธฐ์ฌ๋ง์ด ์ฌ์ฉ์์๊ฒ ๊ด์ฌ์ด ์๋ค๊ณ ๊ฐ์ฃผํ๋ ๊ฒ์ด ๋ ์ข์ ํด์์ผ ๊ฒ ๊ฐ์ต๋๋ค. ๋ฐ๋ผ์ ๋ ผ๋ฌธ ์ ์๋ค์ ์ด๋ฌํ ์ ๋ณด๋ฅผ negative implicit feedback์ผ๋ก ๊ฐ์ฃผํฉ๋๋ค. ๋ํ ์ ์๋ค์ ์ธ์ ์์ ์๊ฐ๊ณผ ๊ธฐ์ฌ ์ถํ ์๊ฐ์ ์๋ฌต์ ์ธ ์ค๋ฆฝ์ ํผ๋๋ฐฑ์ผ๋ก ๊ฐ์ฃผํฉ๋๋ค.
Neutral feedback
- Session start time
- Publishing time
Session-based Recmmendation
์ธ์ ์ํ์ค์ธ \( Su = (n_1, n_2, n_3, ..., n_T) \)๊ฐ ์ฃผ์ด์ง๋ฉด ์ ์ ๊ฐ ๋ค์ ์๊ฐ T+1์์ ๊ฐ์ฅ ๊ฐ๋ฅ์ฑ ์๋ ์์ดํ \(n_{T+1}\)์ ํด๋ฆญํ ๊ฒ์ผ๋ก ์์ธกํฉ๋๋ค. ์์ดํ ์ ์๋ฒ ๋ฉ์ \( (N , dn) \) ํฌ๊ธฐ์ ์์ดํ ์๋ฒ ๋ฉ ํ๋ ฌ์ ํตํด ์ป์ ์ ์์ผ๋ฉฐ, \(dn\)์ ์์ดํ ์๋ฒ ๋ฉ์ ์ฐจ์์ด๊ณ , \( x_i \)๋ ์์ดํ \( n_i\)์ ์๋ฒ ๋ฉ ๋ฒกํฐ์ ๋๋ค.
\(S\)๋ ์ ์ฒด ์ธ์ ์ ์๋ฏธํฉ๋๋ค. \(S_u\)๋ \(S\) ๋ด์ ํน์ ํ ์ ์ ์ ์ธ์ ์ ๋ํ๋ ๋๋ค. N์ ํ๋ณด ์์ดํ ์ ๊ฐ์๋ฅผ ์๋ฏธํฉ๋๋ค. \(y_j^u = 1\) ์ ์ํฐํด์ด \( j \)๊ฐ \(S_u\)์ \( n_{T+1} \)์ธ ๊ฒฝ์ฐ๋ฅผ ๋ํ๋ด๊ณ , 0์ ๊ทธ๋ ์ง ์์ ๊ฒฝ์ฐ๋ฅผ ๋ํ๋ ๋๋ค.
2. Approach
๋ค์์ผ๋ก ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ํํธ ๋ณ๋ก ๋๋์ด ์ดํด๋ณด๊ฒ ์ต๋๋ค.
2.1 Our Base Model: Content-aware Recommendation (CAR)
๋ ผ๋ฌธ์ ๊ธฐ๋ณธ ๋ชจ๋ธ์ธ CAR(Content-aware Recommendation)์ ๋๋ค. ๋ด์ค ๊ธฐ์ฌ์ ์ฝํ ์ธ ์ ๋ณด ๋ถ๋ถ์์๋ ๋ด์ค์ ์ ๋ชฉ๊ณผ ๋ฉํ๋ฐ์ดํฐ๋ฅผ ์ถ์ถํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ Word2Vec์ ์ฌ์ฉํ์ฌ ์ด๋ฌํ ํ ์คํธ ์ ๋ณด๋ฅผ \(dc\) ์ฐจ์์ ๋ฒกํฐ๋ก ๋ณํํฉ๋๋ค. ์ดํ, ์ํฐํด \(n_i\)์ ์ฝํ ์ธ ๋ฒกํฐ \(c_i\)์ ์์ดํ ์๋ฒ ๋ฉ ๋ฒกํฐ \(x_i\)๊ฐ ์์ ๋, [xi; ci]๋ฅผ concat ํ์ฌ \(n_i\)์ ์๋ฒ ๋ฉ ๋ฒกํฐ \(xc_i\)๋ฅผ ์ป์ต๋๋ค. ํด๋ฆญ ์ํ์ค๋ฅผ [xc1, xc2, ..., xcT]๋ก ๋ณํํ ํ, attention pooling์ ์ฌ์ฉํ์ฌ ์ฌ์ฉ์์ ๊ธฐ๋ก์ ์ธ ์ ํธ๋ \(XC_s\)๋ฅผ ์ธ์ฝ๋ฉํฉ๋๋ค.
$$ a_i = W_0 \times \sigma(W_1\times xc_i + b_0) $$
$$ {a_i}' = \frac{exp(a_i)}{\sum_{i=1}^T} exp(a_i) $$
$$ xc_s = sum_{i=1}^T {a_i}' xc_i $$
์ฃผ๋ชฉํด์ผ ํ ๋ถ๋ถ์, Transformers ๋ฐฉ์๊ณผ ์ ์ฌํ๊ฒ ์ ๋ ฅ ์ํ์ค์ ์ฐ์์ ์ธ ์ ๋ณด๋ฅผ ์ป๊ธฐ ์ํด ์์น ์ธ์ฝ๋ฉ(Positional Encoding)์ \(S_u\)์ ์ถ๊ฐํ๋ ๊ฒ์ ๋๋ค. ๊ทธ ํ, ์ดํ ์ ์ ํตํด \(XC_s\)๋ฅผ ์ป์ต๋๋ค.
2.2 Modeling Time as Neutral Feedback
์ ์๋ค์ ์ฐ์์ ์ธ ํ๋ ์๊ฐ \(ti\)๋ฅผ ์ด์ฐ์ ์ธ \(ti'\)๋ก ๋ณํํ๊ธฐ ์ํด Floor ํจ์๋ฅผ ์ฌ์ฉํ๊ณ , m๊ฐ์ ๋ฒ์ฃผ / ๊ณ ์ ํ ์๊ฐ ๊ฐ์ ๋งคํํฉ๋๋ค. ๊ฐ ๋ฒ์ฃผ๋ ๋์ผํ ํ๋ ์๊ฐ ์๋ฒ ๋ฉ ๋ฒกํฐ \(tai\) (dt x 1)๋ฅผ ๊ณต์ ํฉ๋๋ค.
$$\left \lfloor{t_i} = log_2 t_i \right \rfloor$$
์ ์ฌํ ์๊ฐ์ ๋ด์ค ๊ธฐ์ฌ๋ฅผ ์ฝ๋ ์ ์ ๋ค์ ์ ์ฌํ ํ๋ ํจํด์ ๊ฐ์ง ๊ฐ๋ฅ์ฑ์ด ๋์ผ๋ฉฐ, ์ด๋ ์ ์ ์ ๊ด์ฌ์ฌ๊ฐ ์์ ์๊ฐ์ ์ํฅ์ ๋ฐ๋๋ค๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ์ผ๋ถ ์ฌ๋๋ค์ ์์นจ์๋ ๊ธ์ต ๋ด์ค๋ฅผ ์ฝ์ง๋ง ์ ๋ ์๋ ์ํฐํ ์ธ๋จผํธ๋ฅผ ์ฝ๋ ๊ฒฝํฅ์ด ์กด์ฌํ๋ค๋ ๊ฒ์ ์ ์ ์์ต๋๋ค.
์ธ์ ์ ๊ฐ ํด๋ฆญ ๋์์์ ํด๋ฆญ ์๊ฐ์ \(tsi\), ์ฃผ์ ์๊ฐ ๋ฐ์ดํฐ๋ฅผ (w, h) temporal data๋ก ์ฌ์ฉํฉ๋๋ค.
ํด๋ฆญ ์์ ์๊ฐ์ ์๋ฒ ๋ฉ, i๋ 1๋ถํฐ |Su| = T๊น์ง Su ๋ด์ ๊ฐ tsi์ ์ค์์ฑ์ ๋ชจ๋ธ๋งํ๊ธฐ ์ํด ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ์ฌ์ฉํ์ฌ ์ฐ์ ์ ์ธ ์ฟผ๋ฆฌ(Transformer ์ฟผ๋ฆฌ์ ๋์ผ)๋ฅผ ์ป์ ๋ค์, ์ฐ์ ์ ์ธ ์ฟผ๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌ ์ํฐํด๊ณผ์ ์ํธ์์ฉ์ ์ค์์ฑ์ ์ป์ต๋๋ค.
์ฌ์ฉ์์ reading habits๋ ๋ฐํ ์๊ฐ ๐ก๐1, …, ๐ก๐๐์ ์์๋ก ๋ฐ์๋ฉ๋๋ค. ์ด๋ฅผ ํตํด ์ฌ์ฉ์๊ฐ ์๋ก์ด ๊ธฐ์ฌ๋ฅผ ๋ ๋ง์ด ํ์ํ๋์ง ๋๋ ์ค๋๋ ๊ธฐ์ฌ๋ฅผ ๋ ๋ง์ด ํ์ํ๋์ง๋ฅผ ์ถ๋ก ํ ์ ์์ต๋๋ค. ๊ฒ์ ์๊ฐ์ ์๋ฒ ๋ฉ ๋ฒกํฐ๋ฅผ \(tpi\)๋ก ๊ธฐ๋กํ๊ณ , (s, d, w, h, m) ๊ณ์ , ์ผ, ์ฃผ, ์๊ฐ, ๋ถ์ ์๊ฐ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์์ธํ ์์์ ์๋ตํ๊ฒ ์ต๋๋ค.
2.3 Modeling Positive Feedback
Positive ํ impilcit feedback์ ์ฌ์ฉ์๊ฐ ํด๋ฆญํ ํ ๊ฐ ๊ธฐ์ฌ์ ์์ํ ํ์ฑ ์๊ฐ์ ํํ๋ก ๋ํ๋ฉ๋๋ค. ์ฌ์ฉ์๊ฐ ๊ธฐ์ฌ์ ์งง์ ์๊ฐ์ ์๋นํ๋ค๋ฉด, ์ค์ ๋ก ๊ทธ ๊ธฐ์ฌ๋ฅผ ์ข์ํ์ง ์์์ ๊ฐ๋ฅ์ฑ์ด ๋์ต๋๋ค. ๊ทธ๋ฌ๋ ๋ช ํํ ํ์ฑ ์๊ฐ์ด ์๋ ๊ฒฝ์ฐ ์ฌ์ฉ์์ ์ฐ์๋ ๋ ๋ฒ์ ํด๋ฆญ ๊ฐ๊ฒฉ์ ํตํด ์ถ์ ํ ์ ์์ต๋๋ค.
2.4 Modeling Negative Feedback
Negative feedback์ ์ป๋ ๊ฐ์ฅ ์ง๊ด์ ์ธ ๋ฐฉ๋ฒ์ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ๋๋ negative sampling์ ๋๋ค. ๊ทธ๋ฌ๋ ๋ฌด์์๋ก ์์ดํ ์ ์ํ๋งํ๋ ๊ฒ์ ๋ชจ๋ธ์ด ์ฌ์ฉ์์ ์ ํ ๊ด๋ จ์ด ์๋ ์์ดํ ์ ๋ค๋ฃฌ๋ค๋ ๋ฌธ์ ๊ฐ ์์ต๋๋ค. ๋ฌด์์๊ฐ ์๋๋ผ, ํน์ ์ ๋ณด์ฑ ์๋ ์์ดํ ์ ์ฌ์ฉ์ ์ํธ์์ฉ์ ๋ ๋ณต์กํ ์จ๊ฒจ์ง ์๋ฏธ๋ฅผ ๋ฐ๊ฒฌํ๋ ๋ฐ ๋์์ด ๋ ์ ์์ต๋๋ค.
์ด๋ฅผ ์ํด ์ ์๋ Impression List \(Imp_u\)๋ฅผ ์ฌ์ฉํ์ฌ negative data๋ฅผ ์์ฑํฉ๋๋ค. \(Imp_u\)์ ํด๋ฆญ๋์ง ์์ ๋ด์ค๋ฅผ negative sample๋ก ๊ฐ์ฃผํ๊ณ , ๋ค๋ฅธ ์์ค์ ์ ์ฉํ์ฌ ๋ค๋ฅธ candidate ์์ดํ ์ ๊ตฌ๋ณํ ์ ์๋๋กํฉ๋๋ค.\( XC_s\)์ ๊ฐ๋ ฅํ ๋ถ์ ์ ์ธ ์ํ ๊ฐ์ ์ ์ฌ์ฑ์ ๊ฐํ๊ฒ ํ๋ํฐ๋ฅผ ์ฃผ๋ ๊ฒ์ด ๋ชฉํ์ ๋๋ค.
๊ทธ๋ฌ๋ Impression List์ ์ป์ ์ ์๋ ๊ฒฝ์ฐ๊ฐ ์กด์ฌํฉ๋๋ค. ์ ์๋ ๋ง์ฝ ํ ๊ธฐ์ฌ๊ฐ ์ฌ์ฉ์ u๊ฐ ํด๋ฆญํ ๊ธฐ์ฌ ๊ทผ์ฒ์ ๊ฒ์๋๋ฉด, ๊ทธ ๊ธฐ์ฌ๊ฐ \(Imp_u\)์ ๋ํ๋ ๊ฐ๋ฅ์ฑ์ด ๋ ๋๋ค๊ณ ๊ฐ์ ํฉ๋๋ค. ๊ตฌ์ฒด์ ์ธ ์ ์ฐจ๋ candidate ๋ด์ค์ ๋ฐํ ์๊ฐ์ ๊ธฐ์ค์ผ๋ก ํ๋ณด๋ฅผ ์ ๋ ฌํ๊ณ , ์ฃผ๋ณ ๊ธฐ์ฌ์ ์๋์ฐ ํฌ๊ธฐ 300์ ์ ์งํ๊ณ ๊ฑฐ๊ธฐ์์ ์ํ๋งํ๋ ๊ฒ์ ๋๋ค. ๋ชฉํ๋ \(XC_s\)์ negative sample \(j (๐ ∈ ๐๐๐ข)\)์ ๋ฒกํฐ \(XC_j\) ๊ฐ์ ์ฝ์ฌ์ธ ์ ์ฌ๋ ์ ์๋ฅผ ์ต์ํํ๋ ๊ฒ์ ๋๋ค.
์ด๋ ์์ค ํจ์๋ ์์ด ์ฐธ์ธ ๊ฒฝ์ฐ 1์ ๋ฐํํ๊ณ , ๐๋ ๋ถ์ ์ ์ธ ์ํฐํด๋ก๋ถํฐ์ ์์ค์ ๊ฐ์ค์น ๋งค๊ฐ๋ณ์์ ๋๋ค. Adam ์ตํฐ๋ง์ด์ ๋ฅผ ์ฌ์ฉํ์ฌ ์ด ๋ ๊ฐ์ง ์์ค์ ๊ณต๋์ผ๋ก ์ต์ ํํฉ๋๋ค.
3. Experiments
Datasets
์ ์์ ๊นํ๋ธ์ ๋ฐ์ดํฐ์ ์ ๋ํ ๋งํฌ๊ฐ ๊ณต๊ฐ๋์ด ์์ต๋๋ค. ์ฐธ๊ณ ํ์๋ฉด ์ข์ ๊ฒ ๊ฐ์ต๋๋ค.
https://github.com/summmeer/session-based-news-recommendation
- Globo
- Adressa
- MIND
Metric
- HR
- NDCG
- ILD
- unEXP
ILD@K (Intra List Diversity)๋ ๐ (์ถ์ฒ ๋ชฉ๋ก) ๋ด์์ ์ฃผ์ ๋ฐ ์๋ฏธ์ ๋ค์์ฑ์ ํ๊ฐํ๋ฉฐ, ๋์ผํ ์ฌ์ฉ์์๊ฒ ๋ค๋ฅธ ํญ๋ชฉ์ ์ถ์ฒํ๋ ๋ชจ๋ธ์ ๋ฅ๋ ฅ์ ๋ฐ์ํฉ๋๋ค.
unEXPu@K๋ ์ฌ์ฉ์ u์ ๋ํด ์ถ์ฒ ๋ชฉ๋ก R ๋ด์์ ์์์น ๋ชปํ ํญ๋ชฉ์ ์ ๋๋ฅผ ์ธก์ ํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.
๋ชจ๋ ํ์์ ๊ธฐ๋ณธ์ ์ผ๋ก ๐ = 20 ๋ํด ํ๊ท ๊ฐ์ ์ ์ํฉ๋๋ค. ๊ฐ ๋ฉํธ๋ฆญ์ ์ต์์ ๊ธฐ์ค์ ๊ฒฐ๊ณผ๋ ∗๋ก ํ์๋์ด ์์ผ๋ฉฐ, ์ ์ฒด์ ์ผ๋ก ์ต์์ ๊ฒฐ๊ณผ๋ ๊ตต๊ฒ ํ์๋์์ต๋๋ค. "Ours"๋ ์ ์ฒด ๋ชจ๋ธ์ ๋ํ๋ด๋ฉฐ (-)๋ ํด๋น ๋ชจ๋์ ์ ์ธํ๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ์ฌ๊ธฐ์ "neut", "pos", "neg"๋ ๊ฐ๊ฐ ์ค๋ฆฝ์ , ๊ธ์ ์ , ๋ถ์ ์ ํผ๋๋ฐฑ ๋ชจ๋์ ๋ํ๋ ๋๋ค. ๋ง์ง๋ง ์ด์ ๋ถ์ ์ ์ํ๋ง ์ ๋ต์ ๋ฌด์์ ์ํ๋ง์ผ๋ก ๋์ฒดํ ๊ฒ์ ๋๋ค. ↓๋ ์ ์ฒด ๋ชจ๋ธ ๋๋น ์ฑ๋ฅ ํ๋ฝ์ ๋ํ๋ ๋๋ค.
์ ์ฒด ๋ชจ๋ธ๊ณผ ๋น๊ตํ์ ๋, ์ค๋ฆฝ์ ์ธ ์ ๋ณด๋ฅผ ์ ๊ฑฐํ ํ์๋ ๋ชจ๋ ๋ฉํธ๋ฆญ์์ ํฐ ํ๋ฝ์ด ์์ผ๋ฉฐ, ์ด๋ ์ค๋ฆฝ์ ์ธ ์ ๋ณด (์๊ฐ ์ ๋ณด)์ ์ค์์ฑ์ ๋ณด์ฌ์ค๋๋ค.
๊ฐ ๋ฐ์ดํฐ์ ์ด ์ ๊ณตํ๋ ์ ๋ณด๊ฐ ๋ค๋ฅด๊ธฐ ๋๋ฌธ์, ๋ฐ์ดํฐ์ ๋ณ๋ก๋ ์ฐจ์ด๊ฐ ์กด์ฌํ์ต๋๋ค. Adressa ๋ฐ์ดํฐ์ ์ด ๊ฐ์ฅ ๋ง์ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ฉฐ, Globo์์ ์ถ์ถ๋ ๋ฒกํฐ ๋์ ๊ธฐ์ฌ์ ์๋ณธ ํ ์คํธ๋ฅผ ๊ณต๊ฐํ๋ค๊ณ ๋งํฉ๋๋ค. ๋ํ ์ฌ์ฉ์์ ๊ฐ ๊ธฐ์ฌ์์ ์ ํํ ํ๋ ์๊ฐ์ ์ ๊ณตํ๋ค๊ณ ํฉ๋๋ค. ๋ฐ๋ฉด Globo์์๋ ๋ ๋ฒ์ ์ฐ์ ํด๋ฆญ ์ฌ์ด์ ๊ฐ๊ฒฉ์ผ๋ก ํ๋ ์๊ฐ์ ์ถ์ ํ ์๋ฐ์ ์์ผ๋ฉฐ, ์ด๋ ์ ํํ์ง ์์ ์ ์์ต๋๋ค.
Postive implicit feedback๋ชจ๋์ ์ ๊ฑฐํ ํ, Adressa ๋ฐ์ดํฐ ์ธํธ์์ HR๊ณผ NDCG๊ฐ ๊ฐ๊ฐ 2.4%์ 5.5% ๊ฐ์ํ์์ผ๋ฉฐ, Globo ๋ฐ์ดํฐ ์ธํธ์์๋ ๊ฐ๊ฐ 1.9%์ 3.1% ๊ฐ์ํ์์ต๋๋ค. ๊ธ์ ์ ์ธ ์ ๋ณด๋ Adressa์ Globo ๋ฐ์ดํฐ ์ธํธ ๋ชจ๋์์ ์ ์ฌํ๊ฒ ์๋๋๋ค๊ณ ๋งํฉ๋๋ค. ๋ณด๋ค ์ ํํ ์ ๋ณด ๋๋ฌธ์ Postive implicit feedback์ Adressa ๋ฐ์ดํฐ ์ธํธ์์ ๋ ์ ํธ๋ฉ๋๋ค. Negative information์ ๋ค์์ฑ/์ฐธ์ ํจ ์งํ์ ๋นํด ๊ธ์ ์ ์ธ ์ ๋ณด๋ณด๋ค ํจ๊ณผ๊ฐ ์ ์ต๋๋ค. Negative sampling ๋ชจ๋์ ๋ค์์ฑ์ ๋ฎ์ถฅ๋๋ค. ์ด๋ ๋๋ค ํ๊ฒ ๊ฐ์ ธ์จ negative sample์ด positive article๊ณผ ์ผ๋ฐ์ ์ผ๋ก ๋ค๋ฅธ ๋ฒ์ฃผ์ ์ํ๋ ๊ฒฝ์ฐ์ด๊ธฐ ๋๋ฌธ์ ๋๋ค. ๋ฐ๋ผ์ ์ด ๋ชจ๋์ ์ถ๊ฐํ๋ฉด ๋ชจ๋ธ์ด ๊ธ์ ์ ์ธ ๊ธฐ์ฌ์ ์ ์ฌํ ๊ธฐ์ฌ๋ฅผ ์ถ์ฒํ๋๋ก ๊ฐ์ ํ ์ ์์ต๋๋ค.
๊ทธ๋ฆผ (a)์ ๊ฒฝ์ฐ, ์ ์๋ค์ ๋ถ์ ์ ์ธ ์ฌ์ฉ์ ํผ๋๋ฐฑ์ ๋ํ ๊ฐ์ ์ ๊ฒ์ฆํ๊ณ ์ ํฉ๋๋ค. ์ฆ, ๊ฒ์ ์๊ฐ์ด ํด๋ฆญํ ๊ธฐ์ฌ์ ๊ฐ๊น์ด ๊ธฐ์ฌ๋ ์ฌ์ฉ์์๊ฒ ์ ์๋๊ฑฐ๋ ์ฌ์ฉ์์ ์ธ์ ๋ด์ ์์ ๊ฐ๋ฅ์ฑ์ด ๋๋ค๋ ๊ฒ์ ๋๋ค. ๊ฐ ์ธ์ ๋ง๋ค, ์ ์๋ค์ ์์ ๋ค์ ์ ๋ต์ ์ฌ์ฉํ์ฌ ๋ถ์ ์ ์ธ ํญ๋ชฉ ๐๐๐ข๋ฅผ ์ํ๋งํ๊ณ , ๐๐๐ข์ ์ค์ ์ธ์ ๐ผ๐๐๐ข ๊ฐ์ ์์นด๋ ์ ์ฌ๋๋ฅผ ๊ณ์ฐํฉ๋๋ค. |๐๐๐ข = 100|์ผ ๋ ์ ์ฒด ์ ์๋ 0.0062์ด๋ฉฐ, ๋ฌด์์ ์ํ๋ง์ผ ๋๋ 0.0044์ ๋๋ค. ์ด๋ ๊ทธ๋ค์ ๊ฐ์ ์ด ํฉ๋ฆฌ์ ์์ ์๋ฏธํฉ๋๋ค.
๊ทธ๋ฆผ (b)์ ๊ฒฝ์ฐ, ๋ถ์ ์ ์ธ ์์ค์ ์ ์ฉํ์ง๋ง, ๋๋ฌด ๋ง์ ๊ฐ์ค์น๋ฅผ ๋๋ฉด ์ฌ์ฉ์์ ๊ธ์ ์ ์ธ ํผ๋๋ฐฑ์ ํ์ต์ ํด๋ฅผ ๋ผ์น ์ ์์์ ๋ณด์ฌ์ค๋๋ค.
4. Conclusion
๋ณธ ๋ ผ๋ฌธ์ ๊ฒฐ๋ก ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
- ๋ณธ ์ฐ๊ตฌ์์ ์ ์๋ค์ ์ต๋ช ์ธ์ ๊ธฐ๋ฐ์ ๋ด์ค ์ถ์ฒ์์ ๊ธ์ ์ /๋ถ์ ์ /์ค๋ฆฝ์ ์ธ inplicit ํผ๋๋ฐฑ์ ํ์ฉํ์์ต๋๋ค.
- ์ ์๋ค์ ์๊ฐ ์ ๋ณด์ ๋ํ ์๋ก์ด ํํ ๋ฐฉ๋ฒ์ ์ค๊ณํ๊ณ ์ด๋ฅผ ๊ธ์ ์ ๋ฐ ๋ถ์ ์ ํผ๋๋ฐฑ๊ณผ ๊ฒฐํฉํ์ต๋๋ค.
- ์ค์ ๋ฐ์ดํฐ์ ์ ๋์์ผ๋ก ๊ฒ์ฆํ ๊ฒฐ๊ณผ๋ ์ ์ ๋ฐ ์ฝ๋ ์คํํธ ์๋๋ฆฌ์ค์์์ ๋ค์์ฑ, ์ ํ์ฑ ๋ฐ ์ฐธ์ ์ฑ ์ธก๋ฉด์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค.
์ด์์ผ๋ก Implicit feedback์ ๊ธ์ , ๋ถ์ , ์ค๋ฆฝ ๊ด์ ์์ ์ฌ์ ๋ฆฝํ "Positive, Negative and Neutral: Modeling Implicit Feedback in Session-based News Recommendation" ๋ ผ๋ฌธ์ ๋ํ ๋ฆฌ๋ทฐ๋ฅผ ๋ง์น๊ฒ ์ต๋๋ค. ๊ฐ์ฌํฉ๋๋ค.