Transformer 编码器-解码器架构

"Attention Is All You Need" (Vaswani et al., 2017) 完整架构交互可视化

速度
编码器数据流
解码器数据流
交叉注意力
残差连接