NEC SX-Aurora TSUBASA数据手册
NEC 的矢量引擎卡,算是超算界里比较有意思的一张卡了。Vector Engine的玩法跟你平时接触的 GPU 加速不太一样,它是走矢量这条路的。
硬件上集成得挺紧凑,一个 VE 器加 6 个HBM2高带宽内存,用了 2.5D 封装,性能拉满。整个卡也就 60mm 见方,散热还支持直接液冷,你要是玩 HPC 或者做一些重计算的任务,这卡性能真的不虚。
软件这块也比较友好,支持C/C++、Fortran,用起来跟普通 x86 差不多,编译器还挺聪明,自动向量化、并行优化都有。你不用大改代码就能吃上性能红利,挺适合做科研或者工业仿真的。
部署也灵活,有 PCIe 接口,功耗控制在 300W 以内,还分被动和主动散热版本。你想装在塔式工作站还是服务器机架都能搞定,蛮省心的。
顺便附几个还不错的资料,想深入研究的可以看看:超级计算机、x86 架构代码优化、超级计算机的使用手册。
如果你在搞高性能计算、AI 模型训练,或者科研仿真之类的,用它来跑个DGEMM、STREAM之类的测试,你会发现它表现还挺猛的。
下载地址
用户评论