国际固态半导体电路会议落幕,人工智能芯片受到广泛关注

分享到:

上周,半导体芯片领域的顶级会议——国际固态半导体电路会议(ISSCC)——在旧金山落下了帷幕。每年一次的ISSCC不仅是工业界和学术界展示最新研究成果的舞台,更是半导体芯片行业发展的风向标。今年ISSCC的主题是“看见未来”(Envision Future),本文将分析今年ISSCC会议的热点,供关注行业的朋友们参考。

特邀演讲:人工智能相关应用成为半导体发展的下一代引擎
每年ISSCC的惯例是特邀演讲环节(Plenary Session),该环节会邀请一批学术界和工业界的权威人士在ISSCC的第一天给所有听众做四个特邀演讲,而这四个演讲的主题通常是整个半导体行业最关注的主题。今年的特邀演讲几乎都是围绕着人工智能以及相关技术展开,可见人工智能已经成为了半导体行业公认的下一代行业发展引擎。

第一个特邀演讲来自于人工智能三巨头之一并牵头Facebook AI研究的Yann LeCun,他的本职工作是数学家,但是因为在人工智能,尤其是深度学习领域在数十年间做出了卓越的贡献而被公认为领袖人物。有趣的是,LeCun对于硬件也很感兴趣,事实上在深度学习还没有正式成为主流的2011年,LeCun就带领研究团队开发了一款深度学习加速芯片NeuFlow,因此邀请LeCun来ISSCC可谓是合情合理。在主题演讲中,LeCun一方面回顾了深度学习的历史,另一方面肯定了深度学习这一路走来和芯片的关系重大,尤其是没有GPU提供高通量训练的能力可以说就不会有今天深度学习的辉煌。

展望未来,LeCun认为深度学习将继续和芯片关系密切,随着AI加速芯片的普及,人工智能将能部署到更多场合;另一方面,随着人工智能算法的演进,也会需要新一代的AI芯片,例如能高效处理动态网络、图网络、稀疏网络等新架构的芯片,这一方面给芯片领域带来的挑战,但是更多的则是带来了更多机遇。

在LeCun之后的第二位特邀演讲嘉宾是来自于韩国高等科学技术学院(KAIST)的Hoi-Jun Yoo教授。Yoo教授是机器学习和人工智能芯片领域的权威学者。早在21世纪第一个十年,当机器学习和人工智能还未成为主流的时候,Yoo教授的研究组就已经在深耕机器学习和人工智能芯片了,而在人工智能获得认可之后,Yoo教授的研究组凭借早年的积累成为了ISSCC的常客,每年在ISSCC上都能发表数篇相关论文,而在今年更是被邀请成为特邀演讲嘉宾。

Yoo教授的演讲主要是关于AI芯片的,在回顾了之前自己研究组在可配置AI芯片、在线学习加速芯片、增强学习加速芯片领域的先驱性工作后,Yoo认为下一步的AI芯片研究热点可能会走向类脑计算的方向,因为在传统冯诺伊曼架构遇到明显瓶颈之后,类脑计算带来的高效率可能是下一步AI芯片效率进一步提升的关键。目前Yoo教授正在北京清华大学做访问学者,让我们期待他与清华大学的顶尖中国学者之间的合作能擦出更多火花。

在Yoo之后,来自埃因霍温科技大学(TU/e)的Meint Smit为听众带来了关于光器件与硅芯片集成的演讲。众所周知,数据中心是人工智能时代的重要基础设施,而数据中心中的高速光互连则是数据中心的主心骨。在过去,光器件往往使用分立元件,这就大大增加了光互连的成本,增加了部署难度,同时也部分降低了性能,最关键的是使用分立器件无法享受到半导体行业的摩尔定律高速发展。我们最期待的是能将光器件和基于硅材料的半导体芯片直接集成在一起,从而一举解决分立器件的几大问题。

硅光子虽然获得了不少成功,但是相比InP工艺,其性能较为有限,因此这次Smit的演讲中主要介绍的是使用wafer级别的集成工艺将InP光器件和CMOS芯片集成到一起,并实现光-电协同设计,从而实现最优性能,并且为光电行业的发展带来新的活力。

最后,Intel为我们带来了关于5G技术的展望。Intel在处理器之外,亟需找到下一个突破点,而在错失上一波移动设备浪潮之后,Intel把赌注下在了智能化社会上面,而智能化社会则包括了人工智能、IoT等关键概念,其中5G将是智能化社会的重要组成部分,也是Intel的发力方向之一。

随着5G的到来,海量设备将通过mMTC接入5G网络,对于可靠性和延迟要求很高的行业应用(工业机器人,自动驾驶等)预计将使用URLLC接入5G,而消费类应用则可望通过eMBB来获得更高的带宽以提升使用体验。在这里,我们发现5G和之前1G-4G的关键不同在于,1G-4G的核心用户是移动电话、短信、移动上网等消费类应用,而5G规划中则是行业应用占了主要地位。针对这三类5G的应用,Intel相应介绍了其研发动向,包括针对mMTC的超低功耗唤醒接收机,功耗可低至95uW;针对URLLC的高可靠性低延迟射频SoC,针对sub-6GHz频带,其物理层延迟可低至1ms;针对eMBB则有使用毫米波频段的MIMO阵列芯片,可以提供超高速无线通信。

当然,Intel最终的梦想还是希望能打通通信和处理器两大市场,最终实现5G+AI的新范式。

AI芯片:进一步提升能效比

今年AI芯片相关的论文占据ISSCC总论文数接近10%,其热度可见一斑。在今年ISSCC相关的AI芯片论文中,主要还是面向终端计算,以提升计算效率为主,主流计算效率已经从2016年的0.1TOPS/W,2017年的1TOPS/W进化到了今年的10TOPS/W(清华刘勇攀教授甚至发表了140.3TOPS/W的AI芯片),而计算效率的提升则主要是靠稀疏化处理、混合信号计算以及内存内计算等方法来实现。
有趣的是,由于ISSCC的主要关注点是电路,因此发表的论文往往是电路优化关系较大的终端计算AI芯片;而使用在云端的强算力AI芯片往往和处理器架构关系较大,因此往往发表在ISCA、MICRO、HPCA等计算机架构领域的会议上。

在今年的AI芯片中,三星发表的使用在移动设备中的NPU值得关注。该NPU在架构上相比之前传统NPU的最大区别在于对于稀疏网络的支持,可以实现数倍的性能提升。此外,该NPU使用了8nm工艺,核心电压可以低至0.5V,支持根据计算负载动态调整电源电压以实现最优能效比。在75%稀疏度的情况下峰值性能可达6.9TOPS,而在处理非稀疏网络时也能实现1.9TOPS的峰值性能。应该说,作为来自工业界的设计,三星这款芯片在新技术的应用上属于中规中矩,其主要优势仍然是来自于工程上的高度优化,因此可以实现高达11TOPS/W的能效比。

同时,我们也看到,作为手机应用NPU,其峰值性能提升速度远小于其能效比提升速度,这从另一个角度似乎也说明手机端的AI应用目前的需求对于AI芯片性能提升的推动力尚不够强,手机AI的真正爆款应用还没有真正出现。

另一个值得关注的方向是与新内存器件结合的人工智能芯片。由于内存性能提升速度低于晶体管性能提升速度,因此在目前主流处理器基于的冯诺伊曼架构中,内存已经成为了整体性能的重要瓶颈。为了改善这个问题,新的内存器件,包括内存内计算,就成了学术界探索的重要方向。而在近几年,随着人工智能主题的火热,以及人工智能计算会牵涉到频繁的内存访问,因此如何为了人工智能计算优化内存器件以及整体芯片架构就成了关注的热点。在本届ISSCC上,计算-内存协同优化相关的论文共有七篇之多,其中即包括美国密歇根大学、中国东南大学等研究机构分别提出的带有计算功能的SRAM MACRO,也包括台湾国立清华大学、美国斯坦福大学等提出的基于ReRAM器件的内存内计算。

在这些计算-内存协同优化的论文中,值得关注的是清华大学刘勇攀教授研究组提出的STICKER-T芯片,该芯片结合了多方面的优化。首先,在算法上,STICKER-T支持CirCNN架构,该算法架构对于深度学习中的权重矩阵拆分为多个自矩阵,并且通过训练使得每个子矩阵都是循环矩阵,这样一来传统的矩阵相乘计算即可转化为FFT+元素相乘+IFFT,从而极大地节省了计算量,同时对于分类精度的损失也在可控范围内。

此外,STICKER-T使用了转置SRAM (T-SRAM),T-SRAM可以实现按行写入而按列读出,从而大大改善了内存访问效率。在结合算法、电路和器件三方面的优化后,STICKER-T可以实现130TOPS/W的高能效比。STICKER-T的优越性能也告诉我们,如果能从上至下将多个层面的创新结合在一起,将释放出非常大的能量,实现极大的性能提升。

医疗与健康:另一个蓝海市场

除了AI之外,另一个本届ISSCC关注的热点是医疗健康相关的芯片,在ISSCC 2019共有三个相关议程(Diagnostics,  Technologies for Human Interaction & Health以及Physiological Monitoring)。

在相关的论文中,我们看到研究者们的努力集中在分子级别诊断以及特定生理信号监控两方面。分子级别诊断主要是指通过设计专用传感器和芯片,能够快速读出血液等生物样本中是否含有特定成分,从而能快速实现诊断,以及帮助一些疾病的早期筛查。举例来说,目前诊断细菌感染往往需要用病人的样本做细菌培养,这样的诊断需要花数天甚至更多的时间,从而为积极治疗带来了阻碍。而使用生物芯片则可以直接通过判断血液样本中是否含有特定细菌的DNA片段来完成快速诊断,从而将诊断时间缩短到了一小时之内。

这类生物芯片往往需要一些特别的生化传感器并且对于信号读取电路的灵敏度有很高的要求,因此如何将这些生化传感器集成在CMOS芯片中并且设计相应的读取电路就成了最大的挑战。在今年的ISSCC,我们看到了来自于美国InSilixa、韩国延世大学、美国UCSD等研究机构带来的论文,分别描述了用于常规DNA/分子检测、VEGF标记物检测和磁性免疫检测的电路芯片,能大大缩短诊断的时间并降低成本和仪器体积。

另一个健康相关芯片的重要应用领域是生理信号检测,例如心电信号ECG、生物阻抗信号BioZ和脑电信号EEG。ECG和BioZ检测主要应用于可穿戴设备以实现心脏以及呼吸信号的连续监控,从而对于心血管和呼吸疾病的管理与监控。在这个领域,我们看到了来自欧洲IMEC、韩国KAIST和中国上海交通大学的相关研究成果,能以非常低的功耗(<1mW)实现高灵敏度的信号检测和读出,从而为可穿戴设备的健康检测功能带来新的进步。

另一方面,EEG则可以实现脑部信号的实时监控,并结合脑部电刺激对于癫痫等疾病实现闭环控制,我们看到了来自于美国哥伦比亚大学、UCSD和加拿大多伦多大学的相关论文。EEG除了做健康相关监控之外,可望还能实现未来的脑机接口,这也将是一个新机会。

 

随着ISSCC 2019落下帷幕,我们看到了过去一年半导体芯片研究的最新进展。今年ISSCC关注的两大热点分别是AI和医疗健康,这两大热点也分别代表了先进生产力方向以及人类对于美好生活的追求。归根到底,芯片还是要以人为本。让我们在新的一年继续努力,也希望能在新的一年中看到半导体芯片行业更多新成果诞生。

继续阅读
高度集成APU,联发科新AIOT芯片发布助力物联网生态升级

全球领先的IC设计公司联发科技发布AIoT平台, 包含拥有高集成度和高端APU性能的i300和i500系列处理器芯片,为业界提供面向智能家居、智慧城市和智能工厂三大领域的解决方案,助力人工智能技术和物联网技术的落地融合。

恩智浦与东土科技签署全球战略合作备忘录,深入智能交通项目合作

4月初,东土科技和恩智浦在美国进行了会面,这是继去年双方签署全球战略合作备忘录的进一步深入合作,致力于智能交通领域,并就汽车行业展开广泛的合作。

扩增驾驶有望凭借强悍的车内辅助驾驶系统提高驾驶员安全性

在过去几年,自动驾驶车辆产业一直非常乐观,声称Level 4与Level 5的自动驾驶技术将可以在2015年导入大众车款。然而,去年在美国亚利桑那州发生的自动驾驶测试车辆撞人致死事故,以及数起与滥用Tesla Autopilot功能导致的致命案件,透露了一个共同的事实:它们证明,要在现实世界的条件下以机器驾驶取代人类驾驶相当困难。

996运动即将波及中国芯片设计行业?未来团队管理成重要发展瓶颈

996.ICU,听起来很心碎,轻松有钱的工作都是别人的,苦逼的工作才是自己的。人各自有命,只是人生的际遇不同,过程和结果也就不同。改变,属于每一个人的机会和追求。

心脏MRI检测再传福音,西门子采用英特尔平台创新AI检测技术

英特尔与西门子医疗(Siemens Healthineers)* 正在合作开发一种突破性的基于人工智能的的心脏MRI(磁共振成像)分割和分析模型,有望提供实时的心血管疾病诊断。英特尔和西门子医疗使用了第二代英特尔®至强®可扩展处理器进行人工智能推理,为技术专家、心脏病专家和放射科医生提供实时磁共振成像(MRI)推理结果。

精彩活动