# 墨芯 S40 计算卡产品简介
## 概述
墨芯人工智能 S40 计算卡(以下简称 S40 计算卡)为数据中心的 AI 推理应用而打造,支持高达 32 倍的高稀疏率。作为通用深度学习推理计算卡,外形规格采用双槽全高全长 PCle Gen3x16 金手指物理形式。S40 计算卡支持 80GB LPDDR4x 内存,峰值内存写带宽 210 GB/s,峰值内存读带宽 210 GB/s,最大功耗 300 W。被动冷却设计通过系统气流实现散热,确保在热限制范围内高效运行。
S40 计算卡基于墨芯人工智能 Antoum®架构构建。通过软硬件紧密结合的架构设计,强调平衡的结构化稀疏性,支持高达 32 倍的高稀疏率。基于 Antoum®架构,S40 计算卡支持 FP16/BF16 和 INT8 计算。同时,S40 计算卡支持包括集成模型稀疏器的软件工具链、编译器和运行时在内的端到端软件解决方案,确保主流 AI 推理作业可以快速实现。
硬件与软件紧密结合的设计使得 Antoum®成为一个高效的人工智能片上系统处理器。此外,S40 计算卡还支持硬件视频编解码器和 JPEG 解码器,使其能够处理各种视频和图像应用场景。同时,S40 计算卡随设备发货时,为系统 DDR 开启 ECC 功能,防止内存出现可检测的错误。
```{image} ../images/S40/S40-1.png
:align: center
:width: 40%
```
## 系统参数
| 参数 | 描述 |
| -------------------------- | ---------------------------------------------------- |
| FP16/BF16 稀疏处理单元峰值 | 58.9 TFLOPS \| 1887.4 TFLOPS* |
| INT8 稀疏处理单元峰值 | 117.9 TOPS \| 3774.8 TOPS* |
| 理论峰值内存带宽 | 峰值内存写带宽 210 GB/s
峰值内存读带宽 210 GB/s |
| 散热解决方案 | 被动式 |
注:*表示 32 倍稀疏
## 规格
### 产品规格
| **规格** | **描述** |
| -------------------- | ------------------------------------------------------------ |
| 产品名称 | SparseOne®疏云®AI 计算卡系列 \| 墨芯人工智能 S40 计算卡 |
| TDP | 300 W |
| Antoum®芯片名称 | 墨芯人工智能 Antoum®英腾®芯片 |
| 机械外形规格 | 双槽,全高全长 |
| PCI IDs | Device lD:0x7040
Vendor lD:0x1F36
Sub-vendorl D: 0x1F36
Sub-system lD:0x7000 |
| VBIOS NOR-Flash 大小 | 16 MB |
| 热冷却解决方案 | 被动式 |
| 系统接口 | PCIe Gen 3 x 16 |
| 板卡重量 | 1.44 kg |
| P2P 带宽 | P2P 单边带宽:13.94 GB/s
P2P 双边带宽:27.95 GB/s |
| Idle Power | 30 W |
### 内存规格
| **规格** | **描述** |
| ------------ | --------- |
| 内存速率 | 4200 Mbps |
| 内存大小 | 80 GB |
| 内存总线宽度 | 640-bit |
### 环境和可靠性规格
| **规格** | **描述** |
| ------------ | ---------------- |
| 操作环境温度 | 0℃ - 50℃ |
| 存储温度 | -40℃ - 70℃ |
| 操作环境湿度 | 5%~95% 相对湿度 |
| 存储湿度 | 5%~95% 相对湿度 |
| 降频温度 | 90℃ |
| 停止工作温度 | 100℃ |
| 下电温度 | 110℃ |
### 电源示意图和管脚定义
**接口名称**
PCIe 8-Pin Power Connector
**电源位置示意图**
```{image} ../images/S40/S40-2.png
:width: 30%
```
**电源管脚定义**
```{image} ../images/S40/S40-3.png
:width: 45%
```
## 气流方向支持
S40 计算卡采用双向散热的设计,实现灵活散热。它可以接受从左到右或者从右到左的气流,如下图所示。
```{image} ../images/S40/S40-4.png
:width: 35%
```
## 产品功能
### PCIe 接口规格
介绍 S40 计算卡支持的 PCIe 接口规格。
### PCIe 速率支持
S40 计算卡支持 PCIe Gen3 x16。
```{admonition} 须知
:class: note
PCIe 接口为非标准的 x 16 接口,硬件形态是 x 16 金手指,信号定义是由 4 个 x 4 端口合并。服务器端需要做端口分配,将标准 x 16 端口分为 4 个独立的 x 4 端口。
```
### PN 翻转和 Lane 翻转支持
S40 计算卡支持 PCIe 规范中定义的 PN 翻转和 Lane 翻转。当翻转 PCIe 通道时,Rx 通道和 Tx 通道的顺序都必须颠倒。
### 硬件信任根
S40 计算卡通过片上硬件安全引擎和 ARM CPU 信任区域技术支持硬件根信任。信任根的基本功能包括安全引导和安全固件升级。S40 计算卡可以通过加密和认证进一步保护用户的 AI 模型,由强大的密钥管理系统和硬件信任根支持。
### 多实例 SPU 支持
S40 计算卡支持最多 16 个多实例 SPU(Multi-Instance SPU,MIS)。墨芯人工智能 MIS 技术可以将 S40 计算卡划分为多个单个实例,每个实例与自己的 DDR、片上存储器、AI 计算核心、视频编解码器和 JPEG 解码器完全隔离,从而实现计算资源供应和服务质量的优化。
### 外形规格
S40 计算卡采取全高全长双槽的设计,标称尺寸如下图所示。
```{image} ../images/S40/S40-5.png
:width: 65%
```