MACS 发布日志
概述
墨芯高级计算系统(MOFFETT Advanced Computing System,简称MACS) 以 SOLA Tookit 的形式交付,它提供了驱动、运行时库以及一系列的工具,便于用户开发和调试在墨芯 AI 加速卡上的应用程序。MACS 发布日志记录了 SOLA 各组件的版本、功能变更、问题修复等信息。
主要组件版本
组件 | 名称 | 版本 | 支持架构 | 支持平台 |
---|---|---|---|---|
SOLA Runtime Library | libsola.so | 3.5.2 | x86_64 | Linux |
SOLA Driver | N/A | 3.5.5 | x86_64 | Linux |
MOFFETT Management Library | libmfml.so | 1.0.5 | x86_64 | Linux |
MOFFETT SMI | mx-smi | 2.3.0 | x86_64 | Linux |
MOFFETT Qualification | mx-qual | 1.3.0 | x86_64 | Linux |
MOFFETT Firmware Tools | mx-mft | 1.09 | x86_64 | Linux |
MOFFETT Firmware | N/A | 1.0.14 | x86_64 | Linux |
MOFFETT MCU | N/A | 4x011 | x86_64 | Linux |
MOFFETT Kubernetes Device Plugin | k8s-device-plugin | 0.1.0 | x86_64 | Linux |
MACS 1.1.5 更新说明
SOLA Runtime
自动管理 Create 相关接口的内存,析构自动释放
SOLA Driver
增加 ioctl 接口的参数检查
MACS 1.1.4 更新说明
其它
Deb、RPM安装包结构规范
预编译二进制增加 Full RELRO、PIE、Canary 等安全编译选项
MACS 1.1.3 更新说明
SOLA Driver
增加开机时 PCIe 速率检测,发现降速后自动恢复
MOFFETT Qualification
将
p2p
可选参数改为-d
和-c
,分别表示以 device 为单位或以 card 为单位进行测试修复
p2p
测试双向带宽计算错误的 bug修复
p2p
测试 latency 波动不合理的 bug优化
compute
测试,展示在不同稀疏倍率下的算力compute
测试增加可选参数-i
,用于指定测试的设备stress
测试删除可选参数--loop
,调整可选参数--time
的数值范围stress
测试增加可选参数--load
,表示负载程度,支持0%、50%、100%负载stress
改为同时进行计算和内存测试
MOFFETT SMI
以 board id 作为卡展示模式下的 id
修复某些情况下,展示的 device 和实际可用的数量不一致的问题
优化
reboot
在 device 无法访问时的错误信息
MACS 1.1.2 更新说明
SOLA Driver
修复reboot时电压偶现为0的问题
裁减固件大小,将开机加载固件优化到20秒
MOFFETT Qualification
修复执行路径无写入权限导致的crash
其它
moffett-bug-report.sh 需要root权限,以收集PCIe的详细信息
MACS 1.1 更新说明
SOLA Runtime
新增特性
所有 C++ 接口重构为 C 接口
修复问题
修复打开 Profiler 某些情况下写文件会 crash 的问题
SOLA Driver
修复问题
整机功耗调整为 250W
Idle 整机功耗调整到 30W 以内
修复通过 BMC 监控 GPU 温度值跳变问题
修复启动过程中,BMC 监控到 GPU 温度值为 0 的问题
修复 mx-smi 概率性读到的功耗为 0 的问题
修复个别卡偶现 subsys 加载固件失败的问题
修复个别服务器 bloom 程序执行失败的问题
修复个别服务器 p2p 程序执行失败的问题
修复个别服务器超温降频后无法恢复成原始频率的问题
MOFFETT Management Library
新增特性
增加获取 XID Error 的 API
MOFFETT SMI
新增特性
--help
,--version
参数在驱动未加载时也可以运行
修复问题
--help
中device_id
范围变为 0 ~ 31修复
list
/query
命令参数重复时的显示问题
MOFFETT Qualification
修复问题
修复
stress
命令没有权限创建文件引起的 crash 问题compute
命令conv2d
必须指定--sparsity
和--iochannel
参数compute
命令multiply
不允许指定--sparsity
和--iochannel
参数
MOFFETT Kubernetes Device Plugin
第一次发布墨芯 k8s-device-plugin, 支持在 Kubernetes 集群中使用墨芯 AI 加速卡设备。
MACS 1.0 更新说明
SOLA Runtime
第一次发布 SOLA Runtime API。
SOLA Driver
第一次发布 SOLA Driver。
MOFFETT Management Library
第一次发布
MXML
库。
MOFFETT SMI
第一次发布
mx-smi
工具。
MOFFETT Qualification
第一次发布
mx-qual
工具。
MOFFETT Firmware Tools
第一次发布
mx-mft
工具。