1. 首页
  2. 数据库
  3. 其它
  4. cutlass:线性代数子例程的CUDA模板 源码

cutlass:线性代数子例程的CUDA模板 源码

上传者: 2021-02-07 06:17:25上传 ZIP文件 15.05MB 热度 35次
刀尖2.4 CUTLASS 2.4-2020年11月 CUTLASS是CUDA C ++模板抽象的集合,用于在CUDA中的所有级别和规模上实现高性能矩阵乘法(GEMM)。 它包含类似于用于实现cuBLAS的分层分解和数据移动策略。 CUTLASS将这些“活动部件”分解为C ++模板类抽象的可重用的模块化软件组件。 可以通过自定义切片大小,数据类型和其他算法策略来对这些线程范围,warp范围,block范围和设备范围的原语进行专门化和调整。 所产生的灵活性简化了它们在自定义内核和应用程序中作为构建块的使用。 为了支持各种应用,CUTLASS为混合精度计算提供了广泛的支持,为半精度浮点(FP1
下载地址
用户评论