1. 首页
  2. 数据库
  3. 其它
  4. 论文翻译:Attention is all you need

论文翻译:Attention is all you need

上传者: 2021-01-29 23:54:58上传 PDF文件 1.36MB 热度 161次
Attention is all you need 摘要 主要的序列转换模型基于复杂的递归或卷积神经网络,包括编码器和解码器。性能最好的模型还通过注意力机制连接编码器和解码器。我们提出了一种新的简单的网络体系结构Transformer,它完全基于注意力机制,完全不需要重复和卷积。在两个机器翻译任务上的实验表明,这些模型在质量上更优越,同时更具并行性,需要的训练时间明显减少。我们的模型在2014年WMT英德翻译任务中达到28.4 BLEU,比现有的最佳结果(包括集成部分)提高了2个BLEU以上。在WMT 2014英法翻译任务中,我们的模型在8个GPU上训练3.5天后,建立了一个新的单模型最新的B
下载地址
用户评论