”李沐动手学深度学习“ 的搜索结果

     自注意力同时具有并行计算和最短的最大路径长度这两个优势。...尽管transformer最初是应用于在文本数据上的序列到序列学习,但现在已经推广到各种现代的深度学习中,例如语言、视觉、语音和强化学习领域。......

      为了解决这类问题,我们将使用两个循环神经网络的编码器和解码器Auto-Encoder架构, 并将其应用于序列到序列(sequence to sequence,seq2seq)类的学习任务 . 遵循编码器-解码器架构的设计原则, 循环神经网络...

10  
9  
8  
7  
6  
5  
4  
3  
2  
1