Exploiting Deep Representations for Neural Machine Translation
MotivationCV 和 NLP 领域的一些工作发现对各层做 aggregation 能够获得比较好的效果,因此尝试将该思想加入 NMT 中,通过 聚合各层信息 来提升翻译质量。尽管残差已经是利用了多层信息,但这种简单的单步融合的方式太“浅”。
Author: Zi-Yi Dou, Zhaop
...