NLI (Natural Language Inference, 자연어 추론)
자연어 추론(NLI)는 자연어 처리(NLP, Natural language Processing)의 task의 일종이다.
주어진 문장(가설, hypohesis)이 다른 문장(전제, premise)에 대해 논리적으로 들어 맞는지 판단하는 것을 목표로 한다.
NLI는 NLP의 대표적인 task로 AI 모델이 문장들 간의 의미와 관계를 잘 이해하는지 평가하는 데 사용 되기도 한다.
1.Premise, 전제 : 문맥이나 배경 정보를 제공 하는 단일 문장 또는 문장의 집합이다. Hypothesis를 비교하는 기준이 된다.
2.Hypothesis, 가설 : Premise와의 관계를 비교해야 하는 문장이다. NLI는 이 hypothesis가 premise에서 나타나는 정보들을 논리적으로 따르는 지(entailment, 함의), 반대되는 지(contradiction, 모순), 관계가 없는지(neutral, 중립)를 결정한다.
3.세 가지 클래스(Classes) : NLI에서 분류 task는 premise와 hypothesis 간의 관계에 대해 세 가지 레이블 중 하나를 부여한다.
- Entailment, 함의 : Hypothesis가 논리적으로 premise를 따르는 경우
- Contradiction, 모순 : Hypothesis가 premise의 정보에 반대되는 경우
- Neutral, 중립 : Hypothesis가 premise와 논리적인 관계가 분명하지 않을 때
4.SOTA Model : BERT, RoBERTA, GPT 같은 transformer 기반의 아키텍쳐들이 좋은 성능을 보인다. 이 아키텍쳐들은 NLI task에서 문장 간의 미묘한 관계를 잘 포착할 수 있다.
NLI는 주요 NLP task로 주어진 문장(hypothesis)과 배경 문장(premise) 사이의 논리적인 관계를 판단한다. NLI는 NLP 모델이 textual 정보를 이해하고 추론할 수 있도록 하는 데 기본적인 역할을 하고, NLP 영역의 다양한 응용 분야에서 가치를 부여한다.