阿里云推出全栈智能计算解决方案“飞天智算平台” 并启动两座超大规模智算中心

小熊在线 有毒的西瓜 | 2022年08月31日
阿里云推出全栈智能计算解决方案“飞天智算平台” 并启动两座超大规模智算中心 ......

阿里云宣布正式推出全栈智能计算解决方案“飞天智算平台”,并启动两座超大规模智算中心,为科研、公共服务和企业机构提供强大的智能计算服务。可将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。

支撑建设超级智算中心

飞天智算平台源于阿里巴巴内部广泛实践,也源于广泛的产业智能实践。目前,该平台正在支撑建设两座超大规模智算中心。张北智算中心建设规模为12 EFLOPS(每秒1200亿亿次浮点运算)AI算力。在云端,张北智算中心支撑AI预训练大模型、AI Earth、数字人等前沿AI应用,将成为全球最大的智算中心。乌兰察布智算中心建设规模为3 EFLOPS(每秒300亿亿次浮点运算)AI算力,位于“东数西算”内蒙古枢纽节点,采用自然风冷、AI调温等绿色技术,实现绿色低碳。

全面开放飞天智算平台

飞天智算平台是阿里云最新发布的全栈智能计算解决方案,提供公共云和专有云两种模式,为各类科研和智能企业机构提供强大的智能计算服务。通过先进的技术架构,飞天智算平台实现了90%的千卡并行计算效率,可将算力资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。

突破计算效率极限:飞天智算平台采用先进的技术架构,将衡量算力效率的核心指标“千卡并行计算效率”,从传统架构的40%提升至90%,可将算力资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。

支持“一云多芯”:飞天智算平台提供基于阿里云磐久基础设施的融合算力和大数据AI一体化平台整体解决方案,可以运行在X86、GPU、ARM等多种芯片类型的服务器上,实现“一云多芯”,支持多种处理器混合部署、统一调度,并可进行应用优化,部分性能提升100%以上。

高效智能服务:开发人员可以在飞天智算平台上进行数据存储、数据治理、数据分析、模型开发、模型训练与推理的工作。并提供了预训练模型,以及语音,图像、自然语言处理、决策等领域的模型能力,以方便开发者更好的加速AI应用的开发。

绿色低碳:飞天智算在技术减排、能源结构优化、区域布局优化、供应链减碳以及资源利用优化五个方面来降低单位算力的碳排放。在技术减排方面,通过液冷、电源技术以及智能运维等方式降低能耗,PUE最低可达1.09。

体系化的技术创新

阿里云通过体系化的技术创新,改变了智能计算的损耗难题,将千卡并行计算效率提升至90%以上。

在网络技术上:阿里云采用高性能RDMA网络,实现端对端最低2微妙延迟。

在通信技术上:阿里云自研的无阻塞通信技术,让计算过程中的数据交换速度提升了5倍以上。

在存储技术上:自研的IO加速器让数据存取实现最高10倍性能提升。

在大数据AI开发层:阿里云提供分布式训练框架,并通过API对分布式策略进行自动组合和调优,将训练效率提升了11倍以上。

一站式AI计算开发服务:阿里云为用户提供了一站式的通用推理优化工具,对算法模型进行量化、剪枝、稀疏化、蒸馏等操作,将推理效率提升6倍以上。

标签:阿里云

用户名:  密码:  没有注册?
网友评论:(请各位网友遵纪守法并注意语言文明,评论仅供参考不代表本站立场)