Encoder-Decoder结构学习[含代码]

本文对Encoder-Decoder的结构以及相关网络结构进行了一些学习,包括了论文解读和自己的一些诠释

Encoder-Decoder结构是目前非常常见的模型结构,在NLP等诸多领域中均有应用。

1.提出和核心思想

Kyunghyun Cho等人首先在论文中1提出了Encoder-Decoder的架构,该架构的组成如图1、图2所示。
图1 Encoder-Decoder 模型架构图
图2 Encoder-Decoder 模型架构图
也就是说,Encoder-Decoder将模型学习阶段分成了两个步骤,首先进行Decoder网络的构建,然后利用Decoder的输出,来训练Encoder。
简述以下 就是 输入向量->模型->特征向量->模型->输出向量
这样做有一些优点:

参考文献

[1] Cho K, Van Merriënboer B, Gulcehre C, et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation[J]. arXiv preprint arXiv:1406.1078, 2014.


Encoder-Decoder结构学习[含代码]
https://tech.jasonczc.cn/2022/machine-learning/learn-encoder-decoder/
作者
CZY
发布于
2022年4月19日
许可协议