Tag: Transformer - Chen Yulin's Blog

Attention Is All You Need

Posted 2024-09-27Updated 2026-04-07Reviewa minute read (About 203 words)

Attention Is All You Need

Transformer是一种基于注意力机制，完全不需要递归或卷积网络的序列预测模型，且更易于训练

#Research-paper Transformer NN ML NLP