您现在的位置: 香港最快报码室 > 香港最快报码室 >
清华大学团队研制高能效通用神经网络处理器芯
发布时间:2019-03-06

2 月 20 日,来自清华大学线路所的刘勇攀副教养团队在美国旧金山举办的第 66 届国际固态电路会议(简称 ISSCC 2019)发表了基于循环矩阵紧缩措施的通用神经网络加速器芯片 STICKER-T。该芯片在算法,架构和电路三方面进行了联合优化,在变换域进行神经网络加速,并利用可转置存储器复用数据,使得芯片的能效和面积相较于之前的研讨都有显明的提升。

循环矩阵压缩方法(CirCNN)原理图

随着 AI 技能的始终发展,单一的网络结构已经很难满足不同范围的任务需要。常见的应用诸如图像识别或机器翻译分辨须要卷积神经网络或轮回神经网络的支持。而不同网络象征不同的盘算模式,在带宽跟打算资源上也会有各自的限度。因此,通用加速器的核心挑战是如何结合优化各种网络下的芯片能效。

在以 STICKER 跟 Thinker 为代表的先前设计中,研究者通常采用的解决打算是为卷积和全连接操作分别设计专用的加速核,或者将卷积重构为矩阵乘法。其中异构多核的设计诚然可能辨别将卷积和全衔接优化至最佳的能效,然而芯片整体却需要承担额外的面积开销,并且多核的运用率受工作量比例的限度很难达到 100%,带来不可避免的浪费。而重构卷积的思路则象征着能效的下降和编译器与操纵逻辑的复杂性。另一方面以 TPU 为代表的工业届芯片固然有着更强的通用性和灵活性,却在芯片能效上受到制约。

不同架构的通用加速器比较


友情链接:
Copyright 2018-2021 香港最快报码室 版权所有,未经授权,禁止转载。