질의 응답 기술

- Bert같은 Self-Supervised Learning을 사용한 Pretrained Model을 사용해서 성능 향상에 큰 혜택을 본 태스크 중 하나임
- Context = 문맥이라는 뜻임
- 대표적으로 구글 검색이 있음, 이전에는 검색 후 문서를 찾아가야 했지만, 이제는 질문을 이해하고 바로 답변을 줌
- Answer의 형태는 5지 선다중 가장 정답인 것 처럼 고르거나, 범위 내 선택, 긍정 혹은 부정이 있다.

- Open Domain의 뜻 : 방대한 데이터에서 Retriever(중요한 데이터)를 1차 추출한 후 Reader에 넣게 되는 ㅎ여태
- Extenral Knowldege(Knowledge based) 는 제공하는 구조화된 데이터를 뜻함
[문서, Knowledge Graph, etc..]

- 구조화된 정보와, 자연어로 된 정보를 어떻게 딥러닝에 넣을 것인가가 중요함



- I go home을 한국어로 번역하고, 다시 이를 영어로 번역
- 만약 두번의 번역이 모두 잘됬다면, 원래 영어 문장과 다시 영어로 번역한 문장이 비슷해야함
- Parallel Corpus (정답이 존재하는 학습)보다는 성능이 떨어지지만, 일정 수준의 성능을 보여줌

- NLG(자연어 생성 모델)에서 많이 다루는 이슈
- 자연어 생성의 경우에는 다양성이 존재 할 수 있음