如果没有特别标记,NPU 上的结果与使用 FP32 的 GPU 上的结果结果相同。 (*) 这些模型在 NPU 上的结果与 GPU 上的混合精度训练结果一致,但低于 FP32 的结果。这种情况主要与模型本身在混合精度训练中的特点有关, 用户可以自行调整超参数来获得更高精度。 (**) GPU ...