๐ ๋ ผ๋ฌธ ๋งํฌ: https://www.sciencedirect.com/science/article/pii/S0950705121009059
Liang, B., Su, H., Gui, L., Cambria, E., & Xu, R. (2022). Aspect-based sentiment analysis via affective knowledge enhanced graph convolutional networks. Knowledge-Based Systems, 235, 107643.
Aspect-based-sentiment anlaysis (ABSA)๋ ๊ธฐ์กด์ ๊ฐ์ฑ ๋ถ์ ๊ธฐ๋ฒ๊ณผ ๋ฌ๋ฆฌ, ํ ์คํธ ๋ด ๋ฑ์ฅํ๋ ์ฌ๋ฌ ์์ฑ๋ค์ ๋ํ ๊ฐ์ฑ์ ์ง์ ์ ์ผ๋ก ํ์ตํ๊ณ ์์ธกํ๋ ๊ธฐ๋ฒ์ด๋ค. ์ต๊ทผ์๋ ๊ทธ๋ํ ๊ธฐ๋ฐ ๋ฅ๋ฌ๋ ๊ธฐ๋ฒ์ด ๋ฐ์ ํ๋ฉด์, ์ด๋ฌํ ABSA ์์ ์ ๊ทธ๋ํ ๋ชจ๋ธ์ด ๋๋ฆฌ ํ์ฉ๋๊ณ ์๋ค. ๊ทธ๋ฌ๋ ๊ธฐ์กด์ dependency tree ๊ธฐ๋ฐ ABSA ๋ชจ๋ธ์, ๋ฌธ๋งฅ ๋จ์ด (ํ ์คํธ ๋ด ๋จ์ด)์ ์ธก๋ฉด ๋จ์ด (์ฃผ๋ชฉํ๊ณ ์ ํ๋ aspect ํค์๋ ๋จ์ด) ์ฌ์ด์ ๊ด๊ณ(dependency information)๋ง์ ํ์ตํ๋ ๊ฒ์ ์ค์ ์ ๋๊ณ ์์ผ๋ฉฐ, aspect์ ๋ํ ๊ตฌ์ฒด์ ์ธ ๋ฌธ๋งฅ์ ๊ฐ์ ์ ๋ณด๋ฅผ ํ์ฉํ์ง ๋ชปํ๊ณ ์๋ค.
์ฆ ABSA ํ์ต์ ์ํด ์ฌ์ฉ๋๋ SemEval ๋ฐ์ดํฐ ์ธํธ์ ๋ํด ์์ธก ์ ํ๋์๋ง ์ง์คํ๊ฒ ๋์ด, ์ค์ ๋ฌธ๋งฅ์ ๋ํ ๊ฐ์ฑ ์ ๋ณด๋ ์ฃผ๋ชฉ ๋ฐ์ง ๋ชปํ๋ค๋ ๊ฒ์ด๋ค. ๋ณธ ๋ ผ๋ฌธ์์๋ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ, ๋ฌธ์ฅ์ common sense๋ฅผ ๊ณ ๋ คํ์ง ๋ชปํ๋ค๊ณ ํํํ๋ค. ๋ฐ๋ผ์ ๋ณธ ์ฐ๊ตฌ์์ ์ ์ํ๋ ๋ชจ๋ธ์, ๊ธฐ์กด ๊ทธ๋ํ ๊ธฐ๋ฐ ๋ชจ๋ธ๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก aspect ๋จ์ด์ ๋ฌธ๋งฅ ๋จ์ด์ ์ฐ๊ฒฐ์ฑ์ ๊ณ ๋ คํ๋ฉด์๋, Senticnet์ด๋ผ๋ ์คํ ์์ค ์ ๋ณด๋ฅผ ์ฌ์ฉํ์ฌ ์ผ๋ฐ์ ์ธ ๊ฐ์ฑ ์ ๋ณด๋ฅผ ๋ฐ์ํ๋ ๊ฒ์ด ํต์ฌ์ด๋ค.
Introduction
๋ฌธ์๋ ๋ฌธ์ฅ ๋ด์์ ๋จ์ผํ ๊ฐ์ฑ ์ ๋ณด๋ฅผ ๋ถ์ํ๋ ์ ํต์ ์ธ ๊ฐ์ฑ ๋ถ์๊ณผ๋ ๋ฌ๋ฆฌ, ์์ฑ ๊ธฐ๋ฐ ๊ฐ์ฑ ๋ถ์(ABSA)์ ๋์ผํ ๋ฌธ์ฅ์์ ๋ค์ํ ์ธก๋ฉด์ ๊ฐ์ฑ ๊ทน์ฑ(eg., positive, neutral or negative)์ ๊ฐ์งํ๋ ๊ฒ์ ๋ชฉํ๋ก ํ๋ค. ์๋ฅผ ๋ค์ด, 'The food is good, but the service is terrible'์ด๋ ๋ฌธ์ฅ์์ food'์ 'service'๋ผ๋ ๋ ๊ฐ์ง ์ธก๋ฉด์ด ์ธ๊ธ๋๋ค. ์ฌ๊ธฐ์ '์์'์ ๋ํ ๊ฐ์ฑ ๊ทน์ฑ์ ๊ธ์ ์ ์ด์ง๋ง '์๋น์ค'์ ๋ํ ๊ฐ์ฑ ๊ทน์ฑ์ ๋ถ์ ์ ์ด๋ค. ABSA์ ๋ํ ์์ธํ ์์๋ ์๋ ๊ทธ๋ฆผ๊ณผ ๊ฐ๋ค.
ABSA์ ๋ํ ์ด๊ธฐ ์์ ๋ค ๋๋ถ๋ถ์ ์ฃผ์ด์ง ์ธก๋ฉด์ ๋ํ ๋ฌธ๋งฅ์ผ๋ก๋ถํฐ ๊ฐ์ฑ ์ ๋ณด๋ฅผ ๋ชจ๋ธ๋งํ๊ธฐ ์ํด ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ์ฉํ์๋ค. ๋ ๋์๊ฐ, ์ดํ ์ ๊ธฐ๋ฐ ์ ๊ฒฝ๋ง ๋ชจ๋ธ์ ํตํด ๋ฌธ์ฅ์ ๋ฌธ๋งฅ๊ณผ ํน์ aspect์ ๊ด๋ จ๋ ๋ถ๋ถ์ ์ด์ ์ ๋ง์ถ๋ ๋ชจ๋ธ์ด ์ฃผ๋ชฉ์ ๋ฐ์๋ค. ๊ทธ๋ฌ๋ ์ดํ ์ ๊ธฐ๋ฐ ๋ชจ๋ธ์ ๋ฌธ๋งฅ ๋จ์ด์ aspect ๋จ์ด ๊ฐ์ ๊ฐ์ฑ ์์กด์ฑ (sentiment dependencies)๋ฅผ ์ถ์ถํ๊ธฐ ๋ถ์กฑํ๊ธฐ ๋๋ฌธ์, ๋จ์ด ๊ฐ์ ๊ด๊ณ ์ ๋ณด๋ฅผ ํํํ๋ ๊ทธ๋ํ ๊ธฐ๋ฐ ๋ชจ๋ธ๋ค์ด ์ ์๋์๋ค. ๋ ผ๋ฌธ์ ์ด๋ฌํ ๊ทธ๋ํ ๋ชจ๋ธ์ ํตํด ๋ฌธ๋ฒ์ ์ผ๋ก ๊ด๋ จ๋ ๋ฌธ๋งฅ ๋จ์ด๋ค์ aspect ๋จ์ด์ ์ฐ๊ฒฐํ์ฌ ์ฅ๊ธฐ์ ์ธ ๋ฌธ๋ฒ ์์กด์ฑ์ ํฌ์ฐฉํ ์ ์๋ค๊ณ ๋งํ๋ค.
๊ทธ๋ฌ๋ ๊ธฐ์กด์ ๊ทธ๋ํ ๋คํธ์ํฌ ๊ธฐ๋ฐ ๋ชจ๋ธ๋ค์ ๋๋ถ๋ถ ๋ฌธ์ฅ์ ๋ฌธ๋ฒ์ ์์กด์ฑ๋ง ๊ณ ๋ คํ๊ธฐ ๋๋ฌธ์, ๋ฌธ์ฅ์ ๊ตฌ์ฑํ๋ ์์์ ๊ฐ์ฑ ์ ๋ณด(commeonsense knowledge)๋ฅผ ๋ฌด์ํ๋ค๋ ๊ฒ์ด ๋ณธ ๋ ผ๋ฌธ์ main research gap์ด ๋๋ค. ๋ฐ๋ผ์ ๋ณธ ์ฐ๊ตฌ๋ ๊ฐ ๋ฌธ์ฅ์ ๋ํด ์์กด์ฑ ํธ๋ฆฌ(dependency tree)์ ๊ฐ์ฑ ์์ ์ง์(affenctive commonsense knowledge)์ ๋ชจ๋ ํ์ฉํ์ฌ ๊ทธ๋ํ๋ฅผ ๊ตฌ์ฑํ๋ ์๋ก์ด ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ค. ๋ ผ๋ฌธ์ด ๋ฐํ๋ main contribution์ ๋ค์๊ณผ ๊ฐ๋ค.
- ๋ณธ ์ฐ๊ตฌ๋ ๋ฌธ์ฅ์ ๊ตฌ์กฐ์ ์์กด์ฑ๊ณผ ํน์ ์ธก๋ฉด์ ๊ด๋ จ๋ ๊ฐ์ฑ ์ ๋ณด๋ฅผ ๋ชจ๋ ํ์ฉํ๋ค.
- ๋ณธ ์ฐ๊ตฌ๋ ๊ธฐ์กด ๊ทธ๋ํ ๊ธฐ๋ฐ ๋ชจ๋ธ๊ณผ ๊ฐ์ฑ ์์ ์ง์์ ํตํด, ๊ทธ๋ํ ํฉ์ฑ ์ ๊ฒฝ๋ง์ ์ํ ์๋ก์ด ๋ฐฉ๋ฒ๋ฒ๋ก ์ ์ ์ํ์ฌ ํน์ ์ธก๋ฉด์ ๋๋นํ๋ ๊ฐ์ฑ ์์กด์ฑ์ ํฌ์ฐฉํ๋ค.
- ๋ค ๊ฐ์ง ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์ธํธ์ ์คํํ ๊ฒฐ๊ณผ, ์ ์ ๋ชจ๋ธ์ด ABSA ์์ ์์ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋ค.
๋ ผ๋ฌธ์ ๊ฐ๋จํ๋ฉด์๋ ๊ตฌ์ฒด์ ์ธ research gap์ ์ ์ํ๋ค. ๋ํ ์๋ ๋ฐฉ๋ฒ๋ก ์์ ๋ณด๊ฒ ์ง๋ง, ์ ์ ๋ชจ๋ธ ๊ตฌ์กฐ์๋ ๋ฌธ์ ์์์ ๋ํ ํด๊ฒฐ์ฑ ์ด ๋ช ํ์ด ์ ์๋์ด ์๋ค.
Proposed Model
์ ์ ํ๋ ๋ชจ๋ธ์ GCN (graph convolutional network)๊ณผ SenticNet ๊ฐ์ฑ ์ ๋ณด๋ฅผ ๊ฒฐํฉํ ๊ทธ๋ํ ๊ตฌ์กฐ์ด๋ค. ์ ์ฒด์ ์ธ ๋ชจ๋ธ ์ํคํ ์ฒ๋ ์๋ ๊ทธ๋ฆผ๊ณผ ๊ฐ๋ค.
SenticGCN์ ๋ ๊ฐ์ง ํํธ๋ก ๊ตฌ์ฑ๋๋ค. ์ฆ $w_1 ... w_n$์ผ๋ก ํํ๋ ํ ์คํธ๊ฐ ๋ ๊ฐ์ง ํํ์ ์ป๋ ๊ฒ์ด๋ค.
๋จผ์ (1) LSTM ๋ ์ด์ด๋ฅผ ์ฌ์ฉํ์ฌ ๋ฌธ๋งฅ์ ํํ์ ํ์ตํ๋ค. ์ด๋ ๊ฐ ๋ฌธ์ฅ์ ์๋ฒ ๋ฉ ํ๋ ฌ์ ์ ๋ ฅ ๋ฐ์ ์ ๋ ฅ ๋ฌธ์ฅ์ ์ ์ฌ ๋ฌธ๋งฅ์ ํํ์ ๋์ถํ๋ ๊ฒ์ด๋ค.
(2) ๊ธฐ์กด ๊ทธ๋ํ ๊ธฐ๋ฐ ABSA ๋ชจ๋ธ๊ณผ ๊ฐ์ด, 'Dependency tree'๋ผ๊ณ ํํ๋ ๋ถ๋ถ์์ GCN ๋ ์ด์ด๋ฅผ ํตํด ๋จ์ด์ ๊ด๊ณ์ฑ์ ํ์ตํ๋ค. ๋ํ 'Affective'๋ผ๊ณ ํํ๋ ๊ทธ๋ํ๋ ๊ฐ์ฑ ๊ฐํ ๊ทธ๋ํ(affective enhanced graph)๋ผ๊ณ ํํํ๊ณ SentiNect ๊ฐ์ฑ ์ ๋ณด๋ฅผ ํํํ ๊ทธ๋ํ ์ ๋ณด์ด๋ค. ์ดํ ์ฐ๊ฒฐ์ฑ ๊ทธ๋ํ์, ๊ฐ์ฑ ๊ทธ๋ํ๊ฐ ๊ฒฐํฉ๋์ด 'Aspect'๋ก ํํ๋ ์ธก๋ฉด ๊ธฐ๋ฐ ๊ฐ์ฑ ์ ๋ณด๋ฅผ ํตํด, ๋ฌธ์ฅ์ ๊ตฌ๋ฌธ ์ ๋ณด์๋ง ์ด์ ์ ๋ง์ถ๋ ๊ธฐ์กด ๊ทธ๋ํ ๊ธฐ๋ฐ ๋ชจ๋ธ๊ณผ ๋ฌ๋ฆฌ, ํน์ ์ธก๋ฉด๊ณผ ๊ด๋ จ๋ ๋ฌธ๋งฅ์ ๊ฐ์ฑ ์์กด์ฑ์ ํ์ฉํ์ฌ ๊ฐ์ฑ ํน์ง์ ๊ฐ์กฐํ๊ฒ ๋๋ค.
Constructing graph over dependency tree
์์์ ์ค๋ช ํ (2)๋ถ๋ถ์ ์์ธํ ์ดํด๋ณด๊ฒ ๋ค. ๋จผ์ GCN์์์ ๋ง์ฐฌ๊ฐ์ง๋ก ๋จ์ด ๊ฐ์ ์ฐ๊ฒฐ์ฑ์ ๋ฐํ์ผ๋ก ๋จ์ด ๊ด๊ณ ๊ทธ๋ํ๋ฅผ ํ์ตํ๋ค. ์ด ๊ทธ๋ํ๋ ์๋ ์์์ $w_i$์ $w_j$ ๋ ๋จ์ด๊ฐ ์ฐ๊ฒฐ๋์๋ค๋ฉด 1, ์๋๋ฉด 0์ผ๋ก ํํ๋ ๋งคํธ๋ฆญ์ค๋ก ๋ํ๋๋ค. ์ดํ GCN model์ ํตํด ๊ฐ ๋จ์ด ๋ ธ๋์ ์๋ฒ ๋ฉ ์ ๋ณด๊ฐ ํ์ต๋๋ค.
์ฌ๊ธฐ์ ๊ทธ๋ํ๋ ๋จ์ด ๊ฐ์ ์ฐ๊ฒฐ์ฑ์ ๋ํ๋ด๊ธฐ ๋๋ฌธ์, ์๋ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ๋ฐฉํฅ์ฑ์ด ์๋ undirected edge๋ก ํํ๋๋ค.
Enhancing graph based on SenticNet
GCN ๋ ์ด์ด๋ฅผ ๊ฑฐ์น ๋จ์ด๋ค์ ๊ฐ๊ฐ dependency ์ ๋ณด๋ฅผ ํํํ๊ณ ์๋ค. ์ดํ ๋ณธ ๋ ผ๋ฌธ์ main idea์ ๊ฐ์ด, ๋ฌธ๋งฅ ๋จ์ด์ aspect ๋จ์ด์ ๊ฐ์ฑ์ ๊ฐํํ๊ธฐ ์ํด SenticNet์์ ๊ฐ์ฑ ์ ์๋ฅผ ๋ํ์ฌ ์ธ์ ํ๋ ฌ์ ํํ๋ ฅ์ ํ๋ถํ๊ฒ ํํํ๋ค. ์์ ๋ค์๊ณผ ๊ฐ๋ค.
$$S_{i,j} = SenticNet_{(wi)} + SenticNet_{(wj)}$$
์ฌ๊ธฐ์ $SenticNet_{(wi)}$์ SenticNet์ ์กด์ฌํ๋ ๊ฐ์ฑ ์ค์ฝ์ด๋ก [-1, 1] ์ฌ์ด์ ๊ฐ์ ๊ฐ๋๋ค. ๋ง์ฝ $SenticNet_{(wi)} = 0$์ด๋ฉด ํด๋น ๋จ์ด๋ ์ค๋ฆฝ์ ์ธ ๊ฐ์ฑ ์ ๋ณด๋ฅผ ๊ฐ๋ ๊ฒ์ ์๋ฏธํ๋ค.
๋ง์ง๋ง์ผ๋ก ๋ณธ ๋ ผ๋ฌธ์์๋ ABSA๋ฅผ ์ํ GCN ๊ธฐ๋ฐ ๋ชจ๋ธ๋ค์ด ์ผ๋ฐ์ ์ผ๋ก ๊ทธ๋ํ๋ฅผ ๊ตฌ์ฑํ ๋, aspect์ ๋ํ ์ถฉ๋ถํ ๊ณ ๋ ค๊ฐ ์ด๋ฃจ์ง์ง ์๋๋ค๊ณ ๋งํ๋ค. ์ ์ ๋ชจ๋ธ์ ์๋ ์์ ์ฌ์ฉํ์ฌ ๋ฌธ๋งฅ ๋จ์ด์ ์ธก๋ฉด ๋จ์ด ๊ฐ์ ๊ฐ์ฑ ์์กด์ฑ์ ๋์ฑ ๊ฐํํ๋ค.
๋ฐ๋ผ์ ์ต์ข ์ ์ผ๋ก ์ฌ์ฉ๋๋ ๊ฐํ๋ ์ธ์ ํ๋ ฌ์ ๋ค์๊ณผ ๊ฐ์ด ํํ๋๋ค.
$$A_{i,j} = D_{i,j} × (S_{i,j} + T_{i,j} + 1)$$
์ด๋ ๊ฒ ๋ณธ ๋ ผ๋ฌธ์ ์ ์ํ๋ research gap์ ๋ช ํํ๊ฒ ํด๊ฒฐํ๊ธฐ ์ํ ๊ฐ๋จํ๋ฉด์๋ ํ์คํ ๋ชจ๋ธ๋ง์ ์ ์ํ๋ค. ์ดํ SenticGCN์ GCN ๋ฐฉ์์ ํตํด ํ์ต๋์ด ๋ชจ๋ธ ์ํคํ ์ฒ ๊ทธ๋ผ๊ณผ ๊ฐ์ด positive, negative, neutral์ ๋ํ ์ต์ข ๊ฐ์ ๋์ถํ๋ค. ํ์ต์ ์ํ ๋ชฉ์ ํจ์๋ก๋ cross-entropy loss with $L_2$ regularization ์์ ์ฌ์ฉํ๋ค.
Experiments
์ฌ์ฉํ๋ ๋ฐ์ดํฐ์ธํธ๋ SemEval 2014 task4 (Rest14, Laptop14), SemEval 2015 task 12 (Rest15), SemEval 2016 task 5 (Rest16)์ด๋ค. ์ฑ๋ฅ ๋น๊ต๋ฅผ ์ํ ๋ฒค์น๋งํฌ๋ ๋๋ฌด ๋ง๊ธฐ ๋๋ฌธ์, ๋ ผ๋ฌธ์ ์บก์ฒ ์ฌ์ง์ผ๋ก ์ ์ํ๋ค.
์คํ ๊ฒฐ๊ณผ ๊ทธ๋ํ ๊ธฐ๋ฐ ๋ชจ๋ธ์์, ์ ์ํ๋ ๋ชจ๋ธ์ด ๋์ ์ฑ๋ฅ์ ๋ณด์์ผ๋ฉฐ, SenticGCN๊ณผ BERT๋ฅผ ๊ฒฐํฉํ ๋ชจ๋ธ๋ ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ์๋ค.
์์ธํ ๊ฒฐ๊ณผ ํด์์ ๋ ผ๋ฌธ ์ฐธ๊ณ .