如何利用稀疏性提高AI推理速度

NVIDIA Ampere架构使数学运算速度加倍，为各种神经网络处理提速。

如果你玩过叠叠乐，那么就可以把AI稀疏性（sparsity）想象成是叠叠乐。

游戏参与者首先将积木块交错堆叠成一座积木塔。然后，每名玩家轮流取出一块积木，过程中玩家必须小心翼翼的，不能让积木塔倒塌。

游戏开始的时候，抽取积木很容易，但越往后进行就会变得越惊险，最后必定会有一名玩家在取出积木时碰倒整个积木塔。

多年来，研究人员们一直在研究如何通过稀疏性加速AI，其过程就像是在玩儿数字版的“叠叠乐”。他们尝试着尽可能多地从神经网络中抽出多余参数，同时又不破坏AI的超高精度。

这样做是为了减少深度学习所需的矩阵乘法堆，从而缩短取得准确结果的时间。但到目前为止，还没有出现“大赢家”。

过去，研究人员尝试了多种技术，抽出部分的权重甚至达到了神经网络的95％。但是，在整个过程中，他们所花的时间要远多于他们所节省的时间，而且他们还需要付出巨大的努力来弥补精简后的模型精度。此外，适用于一种模型的精简方法往往并不适用于其他模型。

但如今，这一问题得到了解决。

数字稀疏

NVIDIA Ampere架构为NVIDIA A100 GPU带来了第三代Tensor Core核心，其可以充分利用网络权值下的细粒度稀疏优势。相较于稠密数学计算（dense math），最大吞吐量提高了2倍，而且不会牺牲深度学习的矩阵乘法累加任务的精度。

测试表明，这种稀疏方法在许多AI任务（包括图像分类、对象检测和语言翻译）中使用，都能保持与使用稠密数学计算相同的精度。该方法还已在卷积神经网络和递归神经网络以及基于attention的transformer上进行了测试。

A100使用稀疏矩阵加速AI推理任务

内部数学加速能够对应用层面产生重大影响。A100 GPU可以利用稀疏性运行BERT（BERT是最新的自然语言处理模型），其运行速度比稠密数学计算快50％。

NVIDIA Ampere架构利用了神经网络中小值的普遍性，让尽可能多的AI应用受益。具体而言，该架构定义了一种可以减少一半权值（50％稀疏）来训练神经网络的方法。

少即是多，但前提是正确

一些研究人员使用粗粒度的剪枝方法从神经网络层中切断整个通道，这往往会降低网络精度。而NVIDIA Ampere架构中的方法采用了结构化稀疏和细粒度修剪技术，因此不会明显降低精度，用户可以在重训练模型时进行验证。

在将网络修剪到合适状态后，A100 GPU将自动完成其余工作。

A100 GPU中的Tensor Core核心能够有效地压缩稀疏矩阵以实现合适的稠密数学计算。跳过矩阵中的实际值为零的位置能够减少计算量，从而节省功耗和时间。压缩稀疏矩阵还可以减少占用宝贵的内存和带宽。

我们对稀疏性的支持是NVIDIA Ampere架构中的众多新功能之一，它将AI和HPC性能推向新的高度。

科技资讯

incaseformat病毒大面积爆发，请早做防范

观威海 2021-01-14 531浏览 0评论

近期，部分单位政务网、互联网电脑感染“incaseformat病毒”，病毒可通过U盘、光盘等移动介质传播，导致删除大量文件且无法恢复，请各单位及时更新杀毒软件病毒库，专杀工具互联网下载地址：http://59.224.26.143。下班后关闭不使用的电脑，不要长期使电脑处于待机状态。...

科技资讯

2021年需要关注的10个IT趋势

Danny 2021-01-13 637浏览 0评论

当行业分析师和技术专家在2020年年初做出年度预测时，他们专注于云计算、人工智能、机器人等技术将如何改变市场。他们预测，对IT人才的需求将会供不应求，数据科学将继续发挥重要作用，数字化转型将决定组织业务的成败。但他们却没有预料到在全球爆发的新冠病毒疫情会从根本上改变人们工作和个人生活的各个方面。...

科技资讯

阿里百度等互联网平台上线“绿网计划”

郑合惠子 2020-11-28 898浏览 0评论

每一年，涌入互联网平台的非正常搜索高达数百亿次。这些搜索背后，可能暗藏着试图自杀的人的挣扎与呼救。让每一次搜索背后的求助都能得到回应，而不是冰冷的报错与拦截，阿里百度等互联网平台上线“绿网计划” ，用暖心的宣导呼吁来取代“抱歉，这个页面找不到”。...

科技资讯

云麦科技出席CNBC全球科技大会，探讨智能健康未来

Jacky 2020-11-20 512浏览 0评论

以东西方科技对话为主题的2020CNBC全球科技大会,于2020年11月17日在广州召开。作为智能运动健康领域的头部企业,云麦科技受邀参加本次大会,云麦科技创始人CEO Wyatt出席,并与古德菲力CEO许捷一同参与《结构后疫情时代健康产业趋势》主题圆桌会谈。疫情期间,大众对健康的关注度大幅提升,希望通过运动增强免疫,根据CBNDATA调...

科技资讯

奥克斯率先携手中国标准化研究院,联合共建首个符合GB/T33658热舒适实验室!

Jacky 2020-11-20 476浏览 0评论

11月17日上午，奥克斯与中国标准化研究院在人类工效学领域达成共识，进行了合作签约，并在奥克斯创研中心举行了热舒适联合共建实验室揭牌仪式。中国标准化研究院作为国家级科研机构，拥有国内唯一经CNAS认可的人类工效学实验室。这是家电企业首次联合中国标准化研究院共建热舒适实验室，对奥克斯乃至整个家电行业来说意义非...

科技资讯

2020电子政务与智慧城市解决方案提供商100强

Danny 2020-11-18 1328浏览 0评论

智慧城市是电子政务的延伸与拓展，赋予了电子政务新的内涵。某种意义而言，电子政务与智慧城市就是同气连枝的共生关系，电子政务与智慧城市解决方案提供商正是将二者的发展做到“曲尽其妙”之境的重要推手。...

科技资讯

K歌人的狂欢，电商赛拉开2020全民K歌年度盛典大幕

Jacky 2020-11-16 923浏览 0评论

日前，2020全民K歌年度盛典线上大赛电商赛场正式开赛，比赛将从主播、商家和品牌三个维度进行比拼，最终决出年度电商带货主播和商家的优胜者，跨界音乐人们将在这里实现自我价值的又一次飞跃。除电商赛场之外，今年的年度盛典还设置了其余6大赛道公会、个人、粉丝团、歌房、家族和星计划，平台上的每位主播都将开足火力全...

科技资讯

新技术驱动新商业网易创新企业大会看点前瞻

Jacky 2020-11-16 912浏览 0评论

突如其来的疫情对传统商业模式的冲击，让各大企业看到了数字化技术和能力对于商业模式创新和商业生态系统重构的助力。AI、5G、云计算、超高清、VR/AR新技术层见迭出，线上零售、在线会议、互联网医疗、AI 营销新商业模式不断显现，正在重塑全行业。那么企业该如何利用新技术驱动新商业，获得创新发展呢？ 11月28日，网易旗...

科技资讯

奢护四季吾衣例外，COLMO洗衣机 X 例外打造奢品护理季，掀全国奢护美学风暴

Jacky 2020-11-16 183浏览 0评论

高端衣物的背后，究竟有何奢护美学?自10月17日开始，从北京到重庆、上海、成都等全国十几座城市，高端AI科技家电品牌COLMO携手国内一线时装品牌例外，打造奢品护理季，让1%菁英群体零距离尊享空气洗体验，与数千位对品质生活有着无限追求的消费者一道，共同完成了一场奢护四季吾衣例外高端衣物奢护美学之旅。尊享奢洗五步...

科技资讯

网易数帆入选2020年电子信息行业自主创新成果

Jacky 2020-11-16 515浏览 0评论

11月12日，2020第二十四届中国国际软件博览会（以下简称软博会），在杭州白马湖国际会展中心开幕。大会以软件铸魂，数智转型为主题，展现软件产业发展新特点、新模式、新业态。会上，中国电子信息行业联合会正式发布《2020年电子信息行业自主创新成果推广目录》。网易数帆基础软件平台成功入编该目录，荣膺自主创新应用称号...

如何利用稀疏性提高AI推理速度

如何利用稀疏性提高AI推理速度

大家都在看

incaseformat病毒大面积爆发，请早做防范

2021年需要关注的10个IT趋势

阿里百度等互联网平台上线“绿网计划”

云麦科技出席CNBC全球科技大会，探讨智能健康未来

奥克斯率先携手中国标准化研究院,联合共建首个符合GB/T33658热舒适实验室!

2020电子政务与智慧城市解决方案提供商100强

K歌人的狂欢，电商赛拉开2020全民K歌年度盛典大幕

新技术驱动新商业网易创新企业大会看点前瞻

奢护四季吾衣例外，COLMO洗衣机 X 例外打造奢品护理季，掀全国奢护美学风暴

网易数帆入选2020年电子信息行业自主创新成果

网友最新评论【查看所有评论】