五年前,移动电话体验便因为能访问互联网而开始有了改变。但是如果你手机用的SoC主频只有 500MHz那么你可能需要更多的运气才干让它运行顺畅。
但今天,一个新款智能手机的处置能力可能是五年前的10倍或更高。消费电子领域中联网内容的革命驱动了如此大幅度的性能提升—任何设备都能随时随地访问内容—这个愿景已不仅扩大到移动电话,还包括电视和机顶盒,并且成为推动平板电脑兴起的重要因素。
要在消费电子设备上通过网络浏览器提供令人惊艳的用户体验,取决于许多因素,包括访问内容、设备尺寸/用户界面和性能等。让我更进一步探讨性能特性,以它作为下一代连网消费电子应用处置器需求的考量之一。
如果仅希望通过改变一个设计参数,就达到数量级的性能提升是非常困难的过去五年来,这样的做法已经面临瓶颈。从整体来看,性能增益主要来自主频的提升,从1GHz甚至 1.5GHz然后再将单核扩展到多核来增加更多的平行处置能力。这两个因素大约能提升46倍的性能。
但不幸的对业界来说,主频翻番和增加平行处置能力,未来五年中能发挥的作用将越来越小。摩尔定律描述的比例—通过继续跃迁到更小的制程来达到更高频率与更低功率—已逐渐面临面临极限。过去五年来,设计方面的进步对提升频率的贡献,同工艺进步起到作用差不多相同。移动电话的设计目标已与过去不同;五年前,优先任务是要降低功耗,接下来才是设定的功耗预算中提升性能。但现在规范已经改变,设计的优先要素是逾越最低性能等级,然后才是尽可能将功耗降到最低。
扩展到多核的应用处置器技术,虽然是大幅提升性能的最佳方式,但还是有诸多实际限制。硬件中提供更多内核,只有在软件能够充沛发挥硬件功能时才会有效。这一直以来都是业界争论的话题,这一点容我留到下次再来阐述。不只软件需要改进才干满足如今智能设备多核处置器需求,新兴的四核设计还有更多的问题有待解决。
过去五年来,性能目标都是朝着“极致”方向发展,对小型、电池供电设备来说也是如此。因此,现在问题是还有什么方法可以为连网消费应用提供更多处置器性能?这里有两个重要关键点:采用专用处置器/加速器,以及设计更先进的CPU微架构。增加浮点运算单元 FPU协处置器和专用图形处置单元 GPU等功能模块,已成为常见的做法。多年来,半导体 IP供应商已经能提供这些 IP模块,但是智能手机、电视和机顶盒中不时涌现更多的联网内容、复杂图形用户界面、应用顺序和游戏,这些模块将继续不时提升功能和性能,包括与 CPU更紧密整合,以及软件上的互补,如此才干更好地分配任务,将所有SoC中的处置单元利用到极致。
这就涉及到应用处置器设计本身。从MIPS看来,一直以来都能为客户提供可综合的软核 IP让 SoC设计人员能自由配置内核的多项特性,以满足应用顺序的需求。相同的处置器内核会用在不同的SoC中,并面向网络、数字电视和智能手机等不同应用,每个芯片的配置可能会非常不同,需要根据使用情况调配。根据 MIPSJavaJavaScript网页浏览和在Linux和Android上运行的相关经验,对消费设备所需的CPU配置建议已经有了明显改变。
五年前,罕见的数字电视或移动电话 CPU会包括 16KBL1指令与数据cach不需要L2cach32个 TLB入口、无需FPU操作系统 OS可配置为 4KB页面大小。过去几年,建议SoC设计人员将L1cach容量加倍,增加一个容量为总L1cach4-8倍的L2cach并将每个内核MMU中的TLB入口数加大、采用我FPU协处理器,并将OS页面大小配置为16KB这样能为相关软件负载提供双倍或甚至更多的性能。
但是既有处置器内核上调整配置选项只能带来暂时的效益,还需采取更多方法才干为下一代产品提升CPU架构性能。如果制造工艺无法在未来带来更高的主频,而且消费电子的软件并行化过程不能达到理想水平,那么每个处置器的设计都必需能有效执行更多工作才行。更高性能的CPU设计已开始朝更宽的指令执行、更深流水线、乱序执行、提升线程平行处置能力等方向发展。但在采用这些设计方法时,仍须确保能满足消费电子产品对功耗和成本限制的敏感要求。为了要让先进CPU达到这些目标,必需具备很好的分支预测能力、更多的TLB和其他增强性能,才干确保执行流水线能充沛发挥作用。
这是联网消费电子产品应用处置器的未来发展,这也是为什么你会看到市场上呈现专为推动下一代消费电子SoC设计的新款内核IP产品—MIPSproA ptiv多处置内核系列—能为单核性能带来显著的提升,并同时兼顾高效率及完美平衡的微架构优势,将能充沛满足新一代消费电子产品的处置器需求。 |