논문명 : Fine-grained Post-training for Improving Retrieval-based Dialogue Systems, NAACL 2021

PLM을 이용해서 멀티턴 응답선택을 fine-tuning 하는 연구 (fine-grained)

어떤 PLM을 쓸까? → BERT or RoBERTa

기존 PLM을 바로 쓰지 않고, post-training을 통해 테스크에 맞는 PLM을 만들어서 사용하자.

즉 pre-training → post-training → fine-tuning

기존 학습 상황

context → response후보 중 선택

[context; response] → 0 or 1

논문

short context-response pairs 활용

Untitled

논문에서의 Post-training

  1. 전체 대화를 여러 개의 short context-response pairs로 나누어 모델을 학습한다.