资讯

基于全互联(FC8)拓扑的高效通信算法,可大幅降低通信延迟。全互联拓扑中GPU两两互连,在All Reduce场景中可以把其他GPU的数据一次性拿过来,理论上FC8算法相比Ring算法,7步通信可变成1步完成。在单机8卡All ...
快科技10月31日消息,摩尔线程宣布,针对PyTorch深度学习框架的MUSA插件“Torch-MUSA”,迎来重大更新新版本v1.3.0,全面兼容PyTorch 2.2.0。 新版进一步 ...
摩尔线程基于新一代MUSA Compute Capability 3.1计算架构的全功能GPU原生支持FP8计算,为Torch-MUSA v2.0.0实现FP8矩阵乘法和分布式通信优化提供了基础。
芯东西7月26日报道,在世界人工智能大会开幕前夕,国内GPU企业摩尔线程重磅披露其完整AI技术布局。 面对生成式AI爆发下的大模型训练效率瓶颈,摩尔线程正通过系统级工程创新,构建新一代AI训练基础设施,为AGI时代打造生产先进模型的“超级工厂”。 这座“AI工厂”的产能,由五大核心要素的公式: AI工厂生产效率 = 加速计算通用性 × 单芯片有效算力 × 单节点效率 × 集群效率 × 集群稳定性 ...
北京总部会议室的墙上,仍悬挂着张建中与英伟达CEO黄仁勋的合影。2020年中美科技博弈加剧之际,这位曾推动英伟达中国业务增长370%的行业领袖,率领20名核心工程师回国创立摩尔线程。据知情人士透露,研发团队为规避技术封锁,曾耗时三个月每日工作16小时 ...
据介绍,MUSA是摩尔线程自主研发、拥有全部知识产权、软硬一体的全功能GPU先进计算统一系统架构,与CUDA无任何依赖关系。
WAIC前线|摩尔线程张建中:为AGI时代造生产模型的“超级工厂”,摩尔,张建中,超级工厂,agi,算子 ...
借助MUSA SDK,开发者能够轻松地利用摩尔线程GPU,加速各种应用,涵盖企业数据中心、桌面、工作站、云平台、超级计算机等多个领域。 现在,MUSA SDK重磅升级到了4.0.1版本,支持Intel处理器+Ubuntu操作系统、海光处理器+Kylin麒麟操作系统组成的平台。 【主要更新】 ...
在发布重量级的MUSA SDK 4.0.1开发包之后,摩尔线程又同步带来了配套性能分析工具Moore Perf System的最新版本v1.3.0。 Moore Perf System是摩尔线程SDK中的基础组件,用于辅助开发者进行开发调试,可以方便、快速、准确地定位到系统 ...
现在,MUSA SDK 4.0.1已经支持Intel处理器与Ubuntu操作系统的组合,同时也支持海光处理器与Kylin麒麟操作系统的组合,为不同需求的用户提供了更多选择。
自Torch-MUSA首次发布以来,已经历了多个版本的迭代升级,不断优化兼容性与性能。 从v1.0.0版本开始,该插件就率先支持了PyTorch 2.0,为用户带来了 ...