【原创】深入解读 Imagination最新超强GPU!它为啥如此强大?

winniewei 提交于 周三, 12/04/2019
【原创】深入解读 Imagination最新超强GPU!它为啥如此强大?

作者:张国斌

它是一款能同时处理图形和人工智能应用的GPU,还是一款可以智能调度实现多APP流畅应用的GPU!更是有史以来可带来绝佳流畅图形体验的最快GPU 

12月3日,Imagination Technologies Inspire 2019在上海召开,在会上宣布推出其第十代PowerVR图形处理架构IMG A系列(IMG A-Series)。是其有史以来发布过性能最强大的图形处理器(GPU),IMG A系列可包打一切!“可应用于各种场景的GPU”,是多种垂直应用领域的终极解决方案可支持从汽车电子(包括辅助驾驶/自动驾驶)、AIoT、计算一直到数字电视/机顶盒/数字电视盒(DTV / STB / OTT)、移动设备和服务器等应用。

据悉,IMG A系列从多维度实现了性能可扩展性,可覆盖从面向入门级市场的每时钟周期处理1个像素(1 PPC)的组件,一直到用于高性能设备的速度高达每秒2万亿次浮点运算(2 TFLOP)的内核,甚至到针对云应用的、速度超越该数值的多核解决方案 。

1

在本次发布会上,Imagination公司副总裁兼中国区总经理刘国军在致辞中指出Imagination是全球最具影响力的IP供应商之一,Imagination目前是100%的本土企业,将全力帮助助本土企业在移动计算、人工智能领域实现突破。

11

 

Imagination   Technologies首席执行官Ron Black博士表示:“乐观是产业延续的发展,回顾历史长河,人类只是沧海一粟,从历史发展来看,人类走向富裕,大家需要提升自己的生活质量,过去只是部分人富裕大多数贫困而现在则相反,我们相信创新和努力的回报。”

在谈到新GPU时候他说,自15年前推出首款移动PowerVR GPU以来,IMG A系列是我们最重要的GPU新品,并且是有史以来最出色的移动GPU IP。在所有的应用市场中,它都能够在更长的运行时间里以低功耗预算提供最佳性能。它确实是可应用于一切设备的GPU。”

11

Imagination PowerVR 产品执行副总裁Steve Evans分享了这款GPU更多信息,他说过去几年我们和中外领先合作伙伴都有合伙,大家都认  Imagination 的技术方案,在性能上,IMG A系列在每一个维度上都提供了显著的改进,在相同的时钟和半导体工艺上,与当前正在出货的PowerVR设备相比,其性能提高了2。5倍,机器学习处理速度提高了8倍,且功耗降低了60%。

 

1

他表示和目前主流GPU相比,新的IMA系列GPU在能效上有很大提升,例如以目前流行的高通  Adreno  GPU和ARM Mali GPU对比,以高通为基准,同样性能ARM需要184%的芯片面积,这意味着功耗更大,而如果用IMG A系列GPU则如果要达到高通的性能,面积要小一半左右,如果同样面积,则可实现高通GPU 175%的性能,所以,IMA系列GPU堪称最强移动GPU并不过分。

 

11

IMG A系列GPU还可提供强大的差异化优势,例如可确保50%的图像压缩数据(在大多数情况下是无损的,或者在特别的场景中采用视觉无损的压缩)。他透露,IMG A系列已经在多个市场中授权给了客户包括知名的中国公司,首批搭载该IP的SoC器件预计将在2020年供货。

Steve Evans表示未来 Imagination推B,C,D其他三个系列,性能更是大幅度提升。

 

1

此外他表示 IMG A系列GPU强大的性能源于Imagination的技术积累,他稍微秀了一些肌肉---下图是Imagination多年来积累的技术结晶。

1

 

01 IMG A系列IP内核特性

 

1

IMG A系列提供四种高性能配置:

•IMG AXT-64-2048旗舰版,拥有2。0 TFLOPS, 64 Gpixels的性能,以及8 TOPS的AI性能。

•IMG AXT-48-1536面向高端手机;其性能为1.5 TFLOPS、48 Gpixels和6 TOPS

•IMG AXT-32-1024面向高性能移动设备和汽车应用;其性能为1 TFLOP、32 Gpixels和4TOPS

•IMG AXT-16-512面向中高性能移动设备和汽车应用;其性能为0.5 TFLOPS、16 Gpixels和2 TOPS

•IMG AXM-8-256面向中端移动设备;其性能为 0.25 TFLOPS、8 Gpixels和1 TOPS

对于更低成本的细分市场,IMG A系列可提供最佳的面积、成本和效率:

•IMG AX-2-16面向高端物联网、入门级DTV / STB、显示和其他需要高填充率的应用;其性能为2 PPC、16 GFLOPS和2 Gpixels

•IMG AX-1-16面向入门级移动设备和物联网,为同类产品中速度最快的且支持Vulkan功能的GPU;其性能为 1 PPC、16 GFLOPS和1 Gpixels

面向游戏玩家的GPU

由于散热条件限制,大多数移动GPU都很难提供持续一致的游戏体验,即它们在短时间内可快速运行,然后随着芯片发热其性能下降到不可接受的水平,最后再也无法恢复,最终导致令人失望的用户体验。IMG A系列以一致的帧速提供持续可靠的性能以及更长游戏时间,避免了因芯片过热导致时钟降频甚至故障等过热情况。

基于分块延迟渲染(TBDR)技术,IMG A系列的PowerVR架构GPU只需绘制屏幕上可见的内容,这使它具有与生俱来的带宽和功耗优势。 

使用主动动态电压与频率调节 (DVFS)以及时限调度算法(Deadline Scheduling algorithms)的先进功耗控制技术,可提供超低响应延迟的快速功耗控制。如果GPU的某些部分没有得到充分利用或没用于处理工作,它们就会被立即降频甚至进入睡眠状态,以确保最佳的功耗效率。

IMG A系列旨在通过提供持续稳定的帧速来为游戏用户提供最佳的体验。

这要求很高的GPU功耗效率,为此PowerVR系列GPU配备了基于固件的低延迟DVFS算法,并具有直接接入系统的GPIO控制路径。在此基础上,IMG对视觉完美像素的强烈专注,还体现于很多细节上,比如行业领先的视觉无损PVRIC压缩技术、完全重新设计的各向异性采样、以及其他一些完全重新设计的算法实现。

IMG A系列由行业领先的工具集和软件开发包(SDK)提供支持,通过提供诸如基于硬件的分块热分布图等全新功能,来帮助开发人员优化其产品。

02 深度解读全新GPU

 

1

在下午的专访中,电子创新网专访了Imagination Technologies产品管理资深总监Kristof Beets,他表示MG A系列 GPU跟以往GPU相比在架构上有很大改进,“这个新的GPU将ALU的数量提升了4倍,目前我们看到GPU跟CPU一样也在将架构简单化,我们提升了密度,ALU提升了4倍,密度(fps/mm2)提升了2.5倍,现在很多游戏玩家对游戏体验要求很高,例如绝地求生等,这就是需要提升的FPS。”Kristof指出。“这个改进的方法大家都懂的,当时单纯提升ALU并不能带来性能的绝对大幅度提升还要考虑能效等因素,在实现上也有我们独特的技术。”

 

1

他还介绍了 IMG A系列还采用的Imagination的HyperLane技术--这个技术将独立的硬件控制通道都隔离在内存中,从而可将不同的任务同时提交给GPU,以锁定GPU来实现多任务处理。借助动态性能控制功能,GPU可以在多个任务之间分配其性能并执行所有任务,同时最大程度地利用GPU。

 

1

“这样做的好处是看可以实现资源的动态组合和利用,例如,在执行一项AI任务时可以优先处理图形需求,为其提供充足的计算资源,并用剩余的计算资源处理AI任务。”他指出,“在有些成本敏感的应用中如数字电视应用,一般厂商需要配备NPU来进行人工智能的处理,但是采用我们的新GPU后,可以省去NPU ,因为GPU也可以进行AI处理。”这个功能就是AI Synergy,这可以让SoC设计人员能够利用IMG A系列计算能力加速其AI工作负载。通过AI Synergy,GPU在可以提供图形处理功能的同时,使用其备用资源来支持可编程AI以及固定功能,即高度优化的Imagination神经网络加速器。

AI Synergy在最小的芯片面积中提供可编程的人工智能,而统一的软件栈则可实现灵活性和出色的性能。据他介绍,HyperLane技术还可以隔离受保护的内容以进行权限管理,所有IMG A系列GPU可支持多达八个HyperLanes。

 

1

他表示HyperLane技术源于汽车,在汽车中,需要并行的应用都可以流畅的运行,这个诉求也是目前移动端客户需求的,例如很多手机用户会在多个APP中切换都希望有流畅的体验,而HyperLane技术可以实现这样的体验。

03 总结

 

1

本次新品发布,这次Imagination来了包括CEO在内的很多高管,足见对中国市场的重视,Imagination营销副总裁David强调新GPU几乎就是针对本土厂商量身打造,而且国内重量级客户已经授权,老张认为这个GPU可能会成为一个分水岭型的产品,对某些GPU友商而言,过去可以用捆绑销售方式提升自己的份额,但是未来用户更注重消费体验,而且Imagination就是100%的本土企业,这样的产品用起来才更安心啊!大家说呢。(完)

注:本文为原创文章,转载请注明作者及来源

相关文章

Digi-Key