首页 数码科技 正文内容

腾讯Angel获世界互联网大会领先科技奖:让通信成本降低70%!

水库浪子 数码科技 2024-11-20 18:23:22 27

2024年世界互联网大会今日在浙江乌镇开幕,腾讯获得全新设立的世界互联网大会杰出贡献奖—创新突破类。

据“腾讯”公众号介绍,腾讯Angel机器学习平台也获得了本年度世界互联网大会领先科技奖。

腾讯称,该奖项被视为科技行业的最高荣誉之一,在270个申报项目中,共有20个项目获奖。

评选委员会点评腾讯Angel机器学习平台:突破万亿级模型分布式训练和推理以及大规模应用部署等难题。

据了解,突破主要在通信、效率、规模三方面实现。

通信:

从网卡到交换机,再到路由协议,腾讯自研的RDMA网络实现了集群高速互联,单节点带宽达到3.2T,相比于同类领先产品,性能提升30%,成本降低70%。

效率:

自研了训练/推理框架,提出显存加主存的一体化机制,实现多维并行和算子优化,相比开源框架,训练性能提升2.6倍,推理速度提升2.3倍。

规模:

实现了单任务万卡的线性扩展,GPU集群加速比从50%提升到99%。

腾讯Angel机器学习平台是干嘛的,如果你手握一堆数据,想从零开始训练一个大模型,整个过程可以分成三层,Angel会在中间层发挥作用。

其中,底层GPU、云服务器等计算硬件提供算力支持,中层是机器学习平台,负责处理数据、开发算法和执行训练任务,上层是训练好的大模型。

简单来说,Angel机器学习平台可以把一堆杂乱的数据经过清洗、训练、加工等工序,变成一个强大的大模型。

文章目录
    搜索