๐ ๋ ผ๋ฌธ ๋งํฌ: https://aclanthology.org/W19-6120.pdf
Hoang, M., Bihorac, O. A., & Rouces, J. (2019). Aspect-based sentiment analysis using bert. In Proceedings of the 22nd nordic conference on computational linguistics (pp. 187-196).
๊ธฐ์กด ๊ฐ์ฑ๋ถ์ ๊ธฐ๋ฒ์ ๋ฆฌ๋ทฐ ํ ์คํธ์ ์ ๋ฐ์ ์ธ ๊ฐ์ฑ (overall sentiment)๋ง์ ์์ธกํ๋ค. ๋ฐ๋ผ์ ์๋น์๊ฐ ๊ฐ ์์ฑ, entity์ ๋ํด ๋ค์ํ๊ฒ ํํํ ๊ฐ์ฑ์ ํ๋ถํ๊ฒ ๋ฐ์ํ์ง ๋ชปํ๋ค. Aspect-based-sentiment anlaysis (ABSA)๋ ํ ์คํธ ๋ด ๋ฑ์ฅํ๋ ์ฌ๋ฌ ์์ฑ๋ค์ ๋ํ ๊ฐ์ฑ์ ์ง์ ์ ์ผ๋ก ํ์ตํ๊ณ ์์ธกํ๋ ๊ธฐ๋ฒ์ด๋ค. ๋ ผ๋ฌธ์ ๋ฐ๋ฅด๋ฉด ABSA task๋ ํฌ๊ฒ ๋ฆฌ๋ทฐ์ ๋ํ๋ aspect๋ฅผ ์ฐพ๋ ๊ฒ๊ณผ ๊ฐ aspect์ ๋ํ sentiment๋ฅผ ์์ธกํ๋ ๋ ๊ฐ์ง๋ก ๋๋๋ค. ๋ณธ ๋ ผ๋ฌธ์ BERT๋ฅผ ABSA ๊ธฐ๋ฒ์ ์ ์ฉํ๊ณ , ์ฌ๋ฌ ์คํ์ ํตํด SemEval-2016 (task 6) ๋ฑ์์ SOTA๋ฅผ ๋ฌ์ฑํ๋ค. ๋ํ ์ฌ๋ฌ ๋๋ฉ์ธ (out-of-domain)์ ์ ์ฉํ ์ ์๋ ๋ชจ๋ธ์ ์ ์ํ๋ค.
์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด Location aspect์ ๋ํด์๋ ๊ธ์ ์ ์ผ๋ก ํ๊ฐํ์ง๋ง, Food aspect์ ๋ํด์๋ ๋ถ์ ์ ์ผ๋ก ํ๊ฐํ ๋ฆฌ๋ทฐ๋ overall sentiment๋ง์ผ๋ก ํํ๋๊ธฐ ์ ํ๋๋ค. ๋ฐ๋ผ์ ABSA๋ฅผ ํตํด ๋ณด๋ค ํ๋ถํ ๊ฐ์ฑ์ ํ์ ํ ์ ์๋ค.
1. Introduction
๊ฐ์ฑ๋ถ์์ opinion mining์ด๋ผ๊ณ ๋ ๋ถ๋ฆฌ๋ฉฐ, ํ ์คํธ๋ฅผ ๊ธ์ , ๋ถ์ , ์ค๋ฆฝ์ผ๋ก ๋ถ๋ฅํ๋ NLP์ ์ฃผ์ ๋ถ์ผ์ด๋ค. ์ ํต์ ์ธ ๊ฐ์ฑ๋ถ์์ ํ ์คํธ์ ๋ํ overall sentiment๋ฅผ ์์ธกํ๋ ๊ฒ์ ํฌ์ปค์ค๋ฅผ ๋ง์ถ์๋ค. ๊ทธ๋ฌ๋ ๊ทธ ๊ฐ์ฑ์ด '์ด๋ค ๊ฒ'์ ๋ํ ๊ฐ์ฑ์ธ์ง๋ ๊ณ ๋ ค๋์ง ์์๋ค. (Traditional sentiment analysis focuses on classifying the overall sentiment expressed in a text without specifying what the sentiment is about.) ์ ํต์ ์ธ ๊ฐ์ฑ๋ถ์์ ์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ๋ค์ํ topics ๋๋ entities (๋๋ aspects)์ ๋ํ๋ ๊ฐ๊ฐ์ ๊ฐ์ฑ๋ค์ ๋ถ๋ฅํด๋ด์ง ๋ชปํ๋ค. ABSA๋ SemEval-2014 workshop์์๋ถํฐ ๋ฐ์ ๋์ด ์๊ณ , ๋จธ์ ๋ฌ๋, ๋ฅ๋ฌ๋ ๋ฑ ์ฌ๋ฌ ๊ธฐ๋ฒ์ผ๋ก ์์ฑ๊ธฐ๋ฐ ๊ฐ์ฑ๋ถ์์ ๊ดํ ์ฐ๊ตฌ๊ฐ ์งํ๋์๋ค. ๋ณธ ๋ ผ๋ฌธ์์๋ BERT๋ฅผ ๋ฒ ์ด์ค ๋ชจ๋ธ๋ก ์ฌ์ฉํ ABSA ๋ชจ๋ธ์ ์ ์ํ์๋ค. ์ด๋ ์ถ๊ฐ์ ์ธ ๋ฐ์ดํฐ ๋ฆฌ์์ค๋ฅผ ๋ง๋๋ ์์ ๋ ์งํํ์๋ค. ๋ ผ๋ฌธ์ contributions๋ ์๋์ ๊ฐ๋ค.
- ๋ฌธ์ฅ, ํ ์คํธ ๋ ๋ฒจ๋ก ์ฌ๋ฌ ๋๋ฉ์ธ์ ์ ์ฉํ ์ ์๋ ์๋ก์ด ABSA ๋ชจ๋ธ์ ์ ์ํ๋ค.
- Contextual word representaions ๊ธฐ๋ฒ์ธ BERT๋ฅผ ๊ธฐ๋ฐ์ผ๋ก sentence pair classification task๋ฅผ ํตํด ์ฑ๋ฅ์ ํฅ์ ์ํจ๋ค.
- Aspect classification๊ณผ sentiment classification์ ๋์์ ์ ์ฉํ ์ ์๋ ๋จ์ผ combined ๋ชจ๋ธ์ ์ ์ํ๋ค.
2. State-of-the-art
2.1 BERT
Pre-trained language ๋ชจ๋ธ์ธ BERT๋ ๋ฌธ์ฅ์์ ๊ฐ ๋จ์ด๋ค์ ๋ฌธ๋งฅ์ ์๋ฐฉํฅ์ผ๋ก ๋์์ ๊ณ ๋ คํ๋ ์ธ์ด ๋ชจ๋ธ์ด๋ค. ๋ณธ ๋ ผ๋ฌธ์์ ๋ฒ ์ด์ค ๋ชจ๋ธ๋ก BERT๋ฅผ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ์์ธํ๊ฒ ์ค๋ช ๋์ด ์๋ค. Previous work ์น์ ์๋ RNN, LSTM, ELMo ๋ฑ NLP ์ธ์ด ๋ชจ๋ธ๋ค์ ๊ธฐ์กดใ ์ฐ๊ตฌ๋ค์ด ์ธ๊ธ๋์๋ค. Input Representation / Transformers / Sentence Pair Classifier Task / Masked Language Model BERT / Next Sentence Predition ์น์ ๋ค์์๋ ๋ฒํธ์ ๋ํ ๊ธฐ๋ณธ์ ์ธ ์ค๋ช ์ ํ๋ค.
2.2 Aspect-Based Sentiment Analysis
ABSA๋ ํ ์คํธ์ ์ธ๊ธ๋ attributes or entity์ aspects๋ฅผ ๋ถ๋ฅํ๋ task์ด๋ค. SemEval-2016 ABSA task์ ๋ชฉํ๋ ์๋น์ ๋ฆฌ๋ทฐ์์ ํ ํ ํฝ์ aspcet์ ํํ๋ sentiment๋ฅผ ์์ธกํ๋ ๊ฒ์ด๋ค. ๊ตฌ์ฒด์ ์ผ๋ก ํน์ ํ ์ฃผ์ (laptop, restaurant)๊ฐ ์ฃผ์ด์ก์ ๋ SemEval-2016์ ๋ชฉํ๋ ์๋์ ๊ฐ๋ค.
- Aspect categoty classification
(topic - aspect) pair๋ฅผ ์ฐพ๋ ๊ฒ์ด๋ค. ์ด๋ ํ์ด๋ฅผ (E#A)๋ก ํํํ๊ณ , ํ ํฝ, ์์ฑ๋ค์ ๋ฏธ๋ฆฌ ์ ์๋์ด ์๋ค.
์์๋ ๋ค์๊ณผ ๊ฐ๋ค. topic-> (e.g. LAPTOP, RESTAURANT, FOOD), aspects → (e.g. PRICE, QUALITY)
- Opinion target expression(OTE)
๋ฏธ๋ฆฌ ์ ์๋ (E#A)์ ๋ํด์ ์๋ฏธ๋ก ์ ํํ์ ์ถ์ถํ๋ ์์ ์ด๋ค. OTE๋ ์ํ์ค์์ ํ๋์ starting๊ณผ ending ์คํ์ ์ผ๋ก ์ ์๋๋ค. ๋ง์ฝ ๋ช ์์ ์ผ๋ก ์ธ๊ธ๋ entity๊ฐ ํ๋๋ ์๋ค๋ฉด "NULL" ๊ฐ์ ๋ฆฌํดํ๋ค.
- Sentiment polarity classification
(E#A)์ OTE๊ฐ ์์ ๋ ๊ฐ์ฑ์ ์์ธกํ๋ค. ์ด๋ ๋ฆฌํด ๊ฐ์ ๋ค์๊ณผ ๊ฐ๋ค. sentiment polarity set = {positive, negative, neutral, conflict}
- Examples
"The So called laptop runs to slow and I hate it!"
→ {LAPTOP#OPERATION_PERFORMANCE, negative}, {LAPTOP#GENERAL, negative}
"Chow fun was dry; pork shu mai was more than usually greasy and had to share a table with loud and rude family."
→ {FOOD#QUALITY, "Chow fun", negative, from=0, to=8}, {FOOD#QUALITY, "pork shu mai", negative, from=18, to=30}
- Subtasks
Subtask 1, 2๋ ๊ฐ๊ฐ ๋ฌธ์ฅ ๋จ์์์์ ํ ์คํฌ, ํ ์คํธ ๋จ์์์์ ํ์คํฌ๋ก ๊ตฌ๋ถ๋๋ค.
2.3 ABSA without BERT
์๋ต
2.4 ABSA with BERT
Post-Training์ด๋ผ๊ณ ๋ถ๋ฆฌ๋ ์ถ๊ฐ์ ์ธ ํ์ต์ ํตํด ํผํฌ๋จผ์ค๋ฅผ ํฅ์์์ผฐ๋ค(Xu et al., 2019). Post-Training์ ์ ์ฉํ๊ธฐ ์ํด ABSA๋ฅผ ์ง๋ฌธ-๋ต๋ณ ๋ฌธ์ ๋ก ์ ์ํ๋ค. ๋ํ sentenco-pair classification์ผ๋ก auxiliary sentence๋ฅผ ๊ตฌ์ถํ์ฌ ๋ฒํธ๋ฅผ ์ฌ์ฉํ ์ฐ๊ตฌ๋ ์๋ค (Sun et al., 2019).
3. Experiments
3.1 Pre-processing entity and aspect pairs for BERT
SemEval-2016 ๋ฐ์ดํฐ์ ์ ํ์์ ๋ค์๊ณผ ๊ฐ๋ค, ”ENTITY#ASPECT” ์ด๋ฅผ BERT์ ์ธํ์ผ๋ก ํ์ฉํ๊ธฐ ์ํด ์ ์ฒ๋ฆฌ ํ๋ค. ์๋ฅผ ๋ค์ด
”FOOD#STYLE OPTIONS” ํ์ด๋ฅผ ”food, style options”์ ๊ฐ์ด ๊ฐ๋จํ๊ฒ ์ ์ฒ๋ฆฌํ๋ค.
3.2 Data generation
SemEval-2016 ๋ฐ์ดํฐ์ ์์ ๊ฐ ํ ์คํธ๋ ๊ณ ์ ๋ ํฌ๊ธฐ์ aspect์ sentiment polarity ๋ฆฌ์คํธ๋ฅผ ๊ฐ์ง๊ณ ์๋ค. ์๋ฅผ ๋ค์ด ๋ ์คํ ๋ ๋ฐ์ดํฐ์ ์ 12๊ฐ์ ์ ๋ํฌ aspect๊ฐ ๊ณ ์ ๋์ด ์๋ค. ํ ์คํธ์ ์ธ๊ธ๋์ง ์์ aspect๋ 'unrelated'๋ก ๋ผ๋ฒจ๋ง ๋๋ค. ๋ฐ์ดํฐ์ ์ ๋ ์ด๋ธ ๋ถํฌ๋ ์๋ ํ์ ๊ฐ๋ค. ๋ํ ๋ฐ์ดํฐ๊ฐ ์ธ๋ฐธ๋ฐ์คํ๊ธฐ ๋๋ฌธ์ ๋ ์ด๋ธ ์นด์ดํธ์ ๋ฐ๋ผ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ค
3.3 Sentiment Classifier
ํ ์คํธ์์ ํน์ ํ aspect๊ฐ ์ฃผ์ฌ ์ก์ ๋ ๊ฐ์ฑ์ ์์ธกํ๋ ๋ชจ๋ธ์ด๋ค. ์๋์ ๊ฐ์ด ๋ ๊ฐ์ ๋ฌธ์ฅ์ ์ ๋ ฅ์ผ๋ก ๋ฐ๋, BERT sentence pair classification ๋ชจ๋ธ์ ์ฌ์ฉํ๋ค.
๋ชจ๋ธ์ Sentence 1์ ๋ฆฌ๋ทฐ ํ ์คํธ์ด๊ณ Sentence 2๋ ์ฃผ์ด์ง aspect์ด๋ค. Class Label์ 'positive', 'negative, 'neutral', 'conflict' 4๊ฐ์ง์ด๋ค. ์ด๋ conflict๋ aspect๊ฐ ์ด๋ค ๋ถ๋ถ์์๋ positive ๋ค๋ฅธ ๋ถ๋ถ์์๋ negative๋ก ๊ตฌ๋ถ๋๋ ๊ฒ์ ๋ปํ๋ค.
3.4 Aspect Category Classifier
์ ๋ชจ๋ธ๊ณผ ๋๊ฐ์ด BERT sentence pair classification ๋ชจ๋ธ์ ์ฌ์ฉํ๊ณ Sentence 1์ ๋ฆฌ๋ทฐ ํ ์คํธ, Sentence 2๋ aspect ๋ฆฌ์คํธ์ด๋ค. ๊ฐ aspect๊ฐ ๋ฆฌ๋ทฐ ํ ์คํธ์ ์ฐ๊ด์ด ์๋์ง ์๋ ์ง๋ฅผ ํ์ตํ๋ ๊ฒ์ด ๋ชฉํ์ด๊ณ , Class Label์ 'Related', 'Unelated'์ด๋ค.
3.5 Combined Model
์ ๋ ๋ชจ๋ธ์ ๊ฒฐํฉํ multi-class classifier ๋ชจ๋ธ์ด๋ค. ์ญ์ BERT sentence pair classification ๋ชจ๋ธ์ ๋ฒ ์ด์ค๋ก Sentence 1์ ๋ฆฌ๋ทฐ ํ ์คํธ, Sentence 2๋ aspect ๋ฆฌ์คํธ์ด๋ค. ์ด๋ Class Label์ text์ aspect๊ฐ ์ฐ๊ด์ด ์๋ค๋ฉด, sentiment label์ ๋ฐํํ๊ณ , ์ฐ๊ด์ด ์๋ค๋ฉด unrelated label์ ๋ฐํํ๋ค.
4. Evaluation
5. Discussion
๋ ผ๋ฌธ ์ฐธ์กฐ