CPU频率止步于4G?难道真的到极限了吗?

分享到:

QQ截图20171113233739

想要提高CPU的运算效能,不能够简单通过堆砌内核的方式。那么能不能简单提高CPU主频,让CPU每个内核更快的算出结果呢?为什么持CPU制程牛耳的Intel,不再勇攀主频高峰了呢?

回首2004年,Intel雄心勃勃,宣布代码为Prescott超长流水线的奔腾4将会发布4GHz主频CPU,但最后结果是因为种种原因止步于3.8GHz。其后主频不进反退,直到到代号Haswell的酷睿4代(4790K)才真正站上4GHz,继任的broadwell, Skylake, Kabylake和Coffeelake对频率提高又变得无所作为。时间走过了十几年,为什么CPU主频不能继续提高呢?究竟发生了什么?我们是不是已经顶到频率天花板了呢?

我们知道,想要提高CPU的运算效能,不能够简单通过堆砌内核的方式。那么能不能简单提高CPU主频,让CPU每个内核更快的算出结果呢?为什么持CPU制程牛耳的Intel,不再勇攀主频高峰了呢?其实,瓶颈主要在于散热,我们来详细了解一下个中原因。

为什么CPU会发热

从含有1亿4000万个场效应晶体管FET的奔腾4到高达80多亿的Kabylake,Intel忠实的按照摩尔定律增加着晶体管的数目。这么多个FET随着每一次的翻转都在消耗者能量。一个FET的简单示意图如下:

38cef2e2-7455-495b-8047-cbc2334754bd
当输入低电平时,CL被充电,我们假设a焦耳的电能被储存在电容中。而当输入变成高电平后,这些电能则被释放,a焦耳的能量被释放了出来。因为CL很小,这个a也十分的小,几乎可以忽略不计。但如果我们以1GHz频率翻转这个FET,则能量消耗就是a × 10^9,这就不能忽略了,再加上CPU中有几十亿个FET,消耗的能量变得相当可观。

耗能和频率的关系

从图示中,也许你可以直观的看出,能耗和频率是正相关的。这个理解很正确,实际上能耗和频率成线性相关。能耗关系公示是(参考资料2):

c76a7dc0-e118-4d69-aec3-2dec30d09cc6
P代表能耗。C可以简单看作一个常数,它由制程等因素决定;V代表电压;而f就是频率了。理想情况,提高一倍频率,则能耗提高一倍。看起来并不十分严重,不是吗?但实际情况却没有这么简单。

我们这里要引入门延迟(Gate Delay)的概念。简单来说,组成CPU的FET充放电需要一定时间,这个时间就是门延迟。只有在充放电完成后采样才能保证信号的完整性。而这个充放电时间和电压负相关,即电压高,则充放电时间就短。也和制程正相关,即制程越小,充放电时间就短。让我们去除制程的干扰因素,当我们不断提高频率f后,过了某个节点,太快的翻转会造成门延迟跟不上,从而影响数字信号的完整性,从而造成错误。这也是为什么超频到某个阶段会不稳定,随机出错的原因。那么怎么办呢?聪明的你也许想到了超频中常用的办法:加压。对了,可以通过提高电压来减小门延迟,让系统重新稳定下来。

让我们回头再来看看公式,你会发现电压和功耗可不是线性相关,而是平方的关系!再乘以f,情况就更加糟糕了。我们提高频率,同时不得不提高电压,造成P的大幅提高!我们回忆一下初中学过的y=x^3的函数图:

000ac4be-c034-4cf3-9d00-85e8135ff749
Y在经过前期缓慢的提高后在a点会开始陡峭的上升。这个a就是转折点,过了它,就划不来了。功耗和频率的关系也大抵如此,我们看两个实际的例子:

78810f33-6b0c-4154-8864-42df246c0920
i7-2600K频率和功耗的关系

57ed526d-88d0-43ac-ad47-e370c217e412
Exynos频率和功耗的关系

从ARM和X86阵营来看,他们能耗曲线是不是和幂函数图很像?

不可忽视的其他因素

现实情况比这个更复杂。实际上,上面公式里的P只是动态能耗。CPU的整体功耗还包括短路功耗和漏电功耗:

d39caa61-f097-4532-93d0-ab41eb1b53ca
短路功耗是在FET翻转时,有个极短时间会有电子直接跑掉。它和电压、频率正相关。

漏电功耗是电子穿透MOSFET的泄漏情况,它和制程与温度有关。

综合这些,我们看一个实际的例子:

a202bf87-ee07-47d2-9e67-ec9519af948b
这里的Transition Power就是动态能耗,可以看出它随着频率陡峭上升;短路功耗和频率几乎呈现线性关系;而Static power就是指漏电功耗,它也上升是因为频率上升导致温度上升,从而漏电加重。

我们这里引入热密度的概念,即单位面积发出热的数量。从此图看出,随着频率的提高,各种因素综合叠加导致功耗上升严重,而芯片尺寸不变,从而热密度提高很快,现有散热设备短时间内排不出这么多热量,就会造成死机等现象。这也是为什么超频往往需要很好的散热设备的原因。

一个脑洞

我们最后开一个脑洞:假设没有散热问题,没有门延迟,一个完美的世界里,频率有上限吗?这是个很有意思的思考。大家都知道电信号在导线里的传播速度很快,接近光速。我们这里就取光速:每秒30万公里。相信每个略微了解相对论的人都知道光速是物理极限,我们这里不讨论科幻问题。因为没有门延迟,电信号以光速传播。光速,这个数字很大,但我们的频率可是以G为单位,就是10^9,也非常大。在1GHz的情况下,电信号只能传播30cm!10GHz的话,才能传播3cm。晶圆大小是300mm,如果我们做出个和它一样大的CPU,也许最高频率只有1GHz。而现在CPU的die大小差不多1cm,所以理论上30GHz是极限频率!

(这里超级简化很多条件,权作脑洞。)

结论

经由液氮制冷的加持,CPU的频率在极限玩家的帮助下才能挑战9GHz。这对于我们日常电脑用户来说十分遥远,在可以预见的未来,CPU频率因为热密度的关系并不会大幅提高,我们可能永远也看不到10GHz的硅基CPU。也许只有在抛弃硅或者转换到量子计算,CPU频率才会有翻天覆地的变化。

这并不意味着CPU效能的止步不前,实际上目前的CoffeeLake 3.8G的CPU相比奔腾4的3.8G,Benchmark跑下来效能提高了十几倍,而功耗反倒下降不少!这全拜改进架构的福。在吸取了基于netburst深度流水来提高主频,却被“誉为”高频低能的奔腾4教训后,这也是Intel等芯片制造商努力的方向。

继续阅读
中国强!在2023年预计5G手机出货将超越4G

北京时间7月1日晚间消息,美国科技网站TechCrunch援引调研公司Canalys报告显示,全球5G手机出货量将于2023年超越4G手机。

MIPS或RISC-V:恐难担当华为的未来

MIPS阵营最近的大新闻,是从2018年12月开始,这个架构被其新的拥有者Wave Computing公司宣布开源。该公司在“开放MIPS(MIPS Open)”计划中表示,他们会开放对32位和64位设计最新版本的网络访问,而用户无需像使用ARM或者X86那样,给该公司任何许可或特许使用费。

比现有AI算法更快更准确?麻省再推新算法加速AI优化设计

今年5月,麻省理工学院的一个研究团队将展示一种名为“神经架构搜索”( “neural architecture search” )的算法,该算法可以使被AI优化过的AI设计过程加速240多倍。 这有利于人工智能更快、更准,并且在实际范围内广泛应用于图像识别算法和其他相关应用。

国内4G普及率接近 84%,与日韩仍有较大差距

据工信部《2018 年通信业统计公报》最新数据显示,我国已建成全球最大 4G 网络,2018 年新建 4G 基站 43.9 万个,总数达到 372 万个,4G 网络向纵深覆盖,人口密度较大的农村地区均已实现较好覆盖,网络能力提升拉动 4G 用户规模快速扩大。

挤牙膏大厂成为众矢之的?曾经的霸主为何陷入十面埋伏

2016 年,Intel 数据中心部门销售额为 172 亿美元,营运利润高达 75 亿美元,Intel 对此十分自豪,并在广告上称:「98% 的云服务器都使用 Intel 的晶片」。 虽然,目前 Intel 在 PC 和服务器 (Server ) 芯片两大市场依然占据着超过 80% 的市场份额,但是全球 PC 出货量已经从高峰时期的 3 亿 5000 万台下降到了 2 亿 6000 万台,留给 Intel 的已不是份额增长的空间。