去年11月,AMD发布了CDNA2新架构的新一代加速计算卡Instinct MI250X、MI250,升级6nm工艺、2.5D MCM双芯整合封装、第三代Infinity Fabric总线互连技术,集成最多14080个流处理器核心、880个矩阵核心、218GB HBM2e显存/内存。
两款卡均采用OAM模块形态,现在终于增加了PCIe标准形态,型号“Instinct MI200”,支持PCIe 4.0。
MI200回归单芯封装,规格、性能几乎完全就是MI250砍去一半:291亿个晶体管,104组计算单元,6656个流处理器核心,416个矩阵核心,4096-bit 64GB HBM2e显存,三条Infinity Link互连总线(最多四块并行)。
核心频率还是1.7GHz,性能也正好减半,FP64/FP32矢量算力22.6TFlops,FP64/FP32矩阵算力45.3TFlops,FP16矩阵算力181TFlops,INT8矩阵算力181Tops。
显存频率也维持在3.2GHz,所以带宽减半1.6TB/s。
整卡功耗从560W降到了300W,采用单个EPS12V 8针辅助供电接口,被动散热。
软件API支持OpenMP、OpenCL、HIP,计算框架支持TensorFlow、PyTorch、Kokkos、RAJA。(作者:上方文Q)
关键词: AMD发布6nmMI210计算卡 处理器核心 加速计算卡 总线互连技术