CPU＋GPU二合一回顾英特尔核显时代

《电脑爱好者》2017年第24期 2018-05-28 10:53 专题标签：英特尔核显

[an error occurred while processing the directive]

收购ATI之后，AMD最早提出来融聚理念：将CPU和GPU打包成为一颗芯片。然而，英特尔却凭借32nm制程工艺的领先优势，抢先在第一代酷睿Westmere（桌面/笔记本代号分别为Clarkdale/Arrandale）尝鲜CPU和GPU的融合，从此掀开了核显时代的序幕。

一代酷睿：掀开核显序幕

虽然第一代酷睿赶上了CPU融合GPU的头班车，但不得不说英特尔此次有些匆忙了，因为此时CPU和GPU还都是独立存在的，只是被封装在同一块PCB上而已，它们之间使用QPI总线相连，被玩家形象地称为英特尔用“胶水”将CPU和GPU粘在了一起（图1）。

不过，至少在形态和空间占用上，这一代的酷睿处理器已经达成了目的，英特尔也做出了集成显卡→核芯显卡的更名。

需要注意的是，这代处理器的CPU部分采用了32nm工艺，GPU部分还停留在45nm工艺层面（图2）。其中，GPU部分里包含了PCI-E控制器和内存控制器，其本质就是一颗北桥芯片。和上代GMA4500集成显卡相比，第一代核芯显卡将EU单元从10个提升到了12个，核心频率提升到了最高900MHz，性能提升还是颇为显著的。为了延长笔记本的续航时间，移动版处理器的GPU还可以通过Turbo Boost动态调整频率。

二代酷睿：实现真正的融合

有了Westmere的经验积累，英特尔2011年发布的第二代酷睿处理器（Sandy Bridge）终于实现了CPU和GPU“真融合”的目标：CPU和GPU全部为32nm工艺打造，并和内存控制器、PCI-E控制器全部整合到一个核心之中（图3）。

为了满足不同客户的需求，英特尔将第二代核芯显卡细分为了HD2000和HD3000，其中HD2000内置6个EU单元，为不支持超频的桌面处理器所用；HD3000拥有12个EU单元，专为移动酷睿（笔记本专用）和桌面K系列可超频的处理器猎装。

需要注意的是，由于二代酷睿处理器的三级缓存改用了环形总线设计，而GPU可共享三级缓存，所以哪怕是6个EU单元的HD2000，其性能也会明显超过第一代核芯显卡。

三代酷睿：性能功能大跃进

2012年上市的第三代酷睿处理器（Ivy Bridge）凭借首发22nm工艺，对GPU部分进行了大幅度的优化更新。首先，英特尔将和核芯显卡细分为HD2500和HD4000（图4），前者EU单元为6个（桌面处理器），而后者EU单元则提升到了16个（移动酷睿和K系列桌面处理器），同时加入了对DirectX11、OpenGL3.2的支持，增强了并行运算能力，Quick Sync 2.0编码加速技术还能加速视频编辑进度，视频输出能力也从原来的双屏上升到三屏输出。

从HD4000开始，笔记本电脑终于可以凭借唯一的核芯显卡应对主流3D游戏的挑战了，比如在低画质下流畅运行《英雄联盟》不再是奢望。要知道，当年《英雄联盟》可是堪称集显杀手的存在哦。

四代酷睿：规范命名锐炬诞生

2013年，第四代酷睿处理器（Haswell）对核芯显卡进行了“大手术”，引入了模块化设计、可扩展的设计，从而走上了暴力堆砌核显规格的道路，并规范了以“GT＋数字”的核芯命名方式。

此次英特尔将核显细分为了GT1（具体型号为HD Graphics，内置10个EU单元，用于赛扬等低端处理器）、GT2（HD4200/HD4400/HD4600，内置20个EU单元，主要为移动酷睿和桌面处理器所用）。

GT3内置40个EU单元，并被进一步细分为15W GT3、28W GT3和GT3e。其中，15W GT3具体型号为HD5000，为i5-4260U等移动酷睿所用；28W GT3名为Iris（锐炬）5100，专为i5-4258U等移动酷睿所用；而GT3e被命名为Iris Pro 5200，集成额外的128MB eDRAM（可作为L4缓存（图5），性能堪比当时的GeForce GT650M独显，被i7-4980HQ移动酷睿和i7-4770R等桌面酷睿所用。

可惜，锐炬核显只为小众的高端和顶级处理器所用，而搭配它们的产品却大都还配备了额外的高性能独显，核显的重要性被大幅淡化。最需要更强核显加持的中低端处理器则只能使用GT1和GT2，这是时至今日英特尔也没能改进的无奈特色。

五代酷睿：蓄势待发中

第五代酷睿处理器（Broadwell）诞生于2014年，其核显在API方面有了大幅提升，支持DirectX11.2、OpenGL4.2和OpenCL2.0，甚至已经领先于NVIDIA当时主打的麦克斯韦架构。

这一代核显GT1、GT2、GT3内置的EU单元分别提升到了12个、24个和48个，分别对应HD Graphics、HD5300/HD5500和HD6000/Iris 6100/Iris Pro 6200。这一年，英特尔还推出了TDP仅有4.5W的酷睿M（集成HD5300，针对新兴的二合一设备），同时桌面（如i7-5775c）也开始集成Iris Pro 6200。

还是上面的问题，买i7-5775c的用户怎能不配独立显卡，再强的核显又有什么意义？此外，这一代酷睿主要是为英特尔试水14nm工艺，尝试“真正”的SoC（System on a Chip）设计（图6），为第六代酷睿的推出奠定基础。

六代酷睿：核显最终定型

第六代酷睿处理器（Skylake）在2015年发布，这一代的核显有着较大的革新，支持最新的DirectX12、OpenCL 2.x、OpenGL 5.x、Vulkan等图形规范，还支持HEVC/H.265、AVC、SVC、VP8、MJPG硬件加速。同时，英特尔还对核显进行了更名，后缀型号由四位数缩减为三位数（如HD515、HD520、HD530），并推出了集成72个EU单元的GT4（Iris Pro 580）（图7）。

可以说，正是从Skylake开始英特尔核显才最终定型，第七代和第八代酷睿处理器的核显都是在其基础上进行的修修补补。

七代酷睿：提供硬件级解码能力

2016年上市的第七代酷睿（Kaby Lake）集成的核显取名为HD615、HD620、HD630和Iris Plus，它们和上代核显在规格上并无不同，只是取消了GT4，全系列加入了HEVC Main/Main10、VP9 8-bit/10-bit的硬解码能力，在应对4K级别视频的播放变得无比轻松和省电。

八代酷睿：马甲改名再战一年

今年9月面世的第八代酷睿处理器（Kaby Lake-Refresh和Coffee Lake）集成的核显与上代依旧没有太大变化，只是名字从HD620等改为了UHD620，性能上的提升几乎都源于更高频率带来的增益效果。这一代的核显最大特色是支持HDMI 2.0/HDCP 2.2标准，以及硬件编解码10bit 4K HEVC，可流式处理4K UHD视频（图8）。

核显性能遭遇瓶颈

纵观英特尔近些年的核显战略，移动酷睿的整体规格都要优于桌面处理器，目的就是帮助没有空间安置独立显卡的轻薄本提升图形性能。然而，从Skylake开始，最近三代核显在性能上处于原地踏步的节奏，虽然多媒体特性有所增强，但还不足以驾驭最新3D游戏的挑战。哪怕英特尔旗下还有锐炬核显，但其性能也只是勉强比肩NVIDIA GeForce 930MX的水准，随着以MX150为代表的新一代主流独显的出现，英特尔高端核显优势不再。

问题来了，更轻更薄更强是未来PC的发展趋势（图9），特别是对超薄本和PC平板二合一类型的设备而言，英特尔酷睿处理器的CPU运算性能没的说，如何才能弥补核显性能层面的瓶颈？为了满足未来市场的发展需要，英特尔做出了一个破天荒的决定——携手AMD一起打造处理器！

上一篇：紧跟DX的脚步英特尔的集成显卡之旅

下一篇：敌人的敌人就是朋友英特尔携手AMD打造移动处理器

CPU＋GPU二合一 回顾英特尔核显时代

CPU＋GPU二合一回顾英特尔核显时代