논문명 : Fine-grained Post-training for Improving Retrieval-based Dialogue Systems, NAACL 2021
PLM을 이용해서 멀티턴 응답선택을 fine-tuning 하는 연구 (fine-grained)
어떤 PLM을 쓸까? → BERT or RoBERTa
기존 PLM을 바로 쓰지 않고, post-training을 통해 테스크에 맞는 PLM을 만들어서 사용하자.
즉 pre-training → post-training → fine-tuning
기존 학습 상황
context → response후보 중 선택
[context; response] → 0 or 1
논문
short context-response pairs 활용
