大模型训练仿真工具升级,支持多卡并行与通信优化(图1)