以下是一个基于 PyTorch 的简单 Transformer 模型实现,包括词嵌入和位置嵌入的详细代码示例。这个示例将展示如何构建 Transformer 的一个基本层(包括多头自注意力机制和前馈网络),并加入位置嵌入。