IOs interface memory secutity

Imagination推出B系列GPU IP,力挺本土芯片的图形渲染和AI创新

发布时间:2020-10-29 点击数:

2020年10月,半导体知识产权(IP)供应商Imagination Technologies在京举办了IMG B系列图形处理器(GPU)新技术暨IP新产品发布会。B系列革命性地采用了多核技术,它们支持更高性能,同时芯片面积比前代产品更小。借助其原生的可扩展性,B系列是诸多应用市场的终极解决方案,包括Imagination传统的市场——移动设备、汽车、数字电视等,以及新的桌面PC、数据中心等。

多核是否会成为GPU的未来趋势?B系列IP对标市面上现有的哪些GPU芯片?为何B系列会专门推出一个型号面向汽车领域?本土企业用IP有何挑战?为此,电子产品世界等媒体采访了Imagination的相关领导。线上是英国总部的首席营销官David Harold,技术产品高级总监Kristof Beets, 线下是副总裁兼中国区总经理刘国军,中国区战略市场与生态高级总监时昕等。

1.jpg

图:Imagination首席营销官David Harold、技术产品高级总监Kristof Beets,副总裁兼中国区总经理刘国军,中国区战略市场与生态高级总监时昕


1、GPU多核是否是趋势

此次发布的B系列的一个亮点是增加了多核技术,那么,多核技术架构是不是会成为未来主流的一种技术趋势?原有的单核的产品是否会逐渐被多核替代?

我们应该在单核和多核之间达到一种平衡。单核模块对细节的优化是非常高效的。但是如果把单核做得过大,对布局、设计和扩展就比较难做的。多核能带来更好的扩展效果、设计和布局。这就是为什么在多核方面有很多的模块,以应对不同的市场。BXT有4款产品,应对到不同的专业市场。

另一方面,市面上GPU的工作负载也有很大的改变,越来越多样化,有图形渲染的需求,有计算的需求,有更大更小的需求,这就带来了GPU的布局和架构变化的需求。多核架构能更好地实现最优化,以满足不同GPU工作负载的布局。而单核/单片平台对大工作负载是有效的,但对于小工作负载的效率很低。因此,Imagination的灵活多变的动态的多核架构,可以把大的工作负载来细分,切分成不同的小的工作负载,并且同时进行操作。这对多样性和灵活度来说都是有好处的。

同时从单核、多核趋势角度来看,GPU的这种多核趋势是和CPU之前的向多核发展的趋势是类似的。所以此次发布的B系列是多核架构,它更加灵活,而且更加具有动态性,所以不仅仅能带来更好的渲染/性能,同时降低了功耗,还有可以满足chiplet(小芯片)需求。

2.jpg

图:B系列从左至右,分别面向低、中、高和汽车应用


2、Chiplet的趋势

chiplet在GPU行业里是个主流趋势,无论是英伟达还是AMD都在进入这个领域。所以imagination非常合理、也非常有必要地要赋能客户实现chiplet能力。

chiplet的出现是因为现在处理器的成本非常高。与传统的1个处理器来负责1个性能点的做法不同,chiplet架构由不同的组件构成,然后在独立的软件上进行设计和执行。因此,不同的chiplet可以用不同的工艺节点来制造,甚至可以由不同的供应商来提供,这样可以减少设计时间和成本。

但是chiplet有个问题:在裸片之间信号的传输可能会受限制,所以Imagination的多核架构和去中心化措施堪称完美的解决方案,解决了大量的信息集中到单一模块上的这种问题。这种去中心化的多核架构很好地符合了chiplet的趋势。从客户那里获得的反馈是性能有大幅提升,也不存在裸片之间的信号传输问题。

3.jpg

图:BXT系列GPU是1个4核部件


3、与主流GPU芯片的对标

B系列GPU IP面向桌面级和数据中心,对标的是友商的哪款GPU芯片?

实际上很难直接去对标,因为IP和芯片有不同的评测方式。要等采用了IP的芯片出来之后才能去跑分。目前来看,一个量化指标是TFLOPS(每秒万亿次计算)。IMG B系列可提供高达 6 TFLOPS的计算能力,并通过多核技术,支持更高性能。

另一个指标是每瓦性能表现。PC等桌面高端显卡高峰时的功耗达到几百瓦,这是可接受的,但有些应用,例如数据中心很难接受,因其自然散热条件不能充分散热,只能通过被动方式散热,例如会把频率降低,从而使功耗低一些。在这样的场景下,Imagination的优势可以体现出来,因为Imagination的GPU IP传统上是为移动产品应用的,基本上就是几瓦,这样来看B系列在功耗上更有优势。

从图形角度来看,Imagination不能像市面上的GPU芯片公司一样直接比TFLOPS,因为这不准确,仅供参考,因为还要有结合的场景。但至少Imagination有信心:做桌面级的处理是没有问题的,B系列也能达到TFLOPS。

目前,在桌面GPU和云端平台上,已经有5家中国客户在与Imagination接洽。


4、汽车电子的独特需求

B系列的上代——A系列不是按照应用划分,而是性能。B系列有专门面向汽车应用的子系列BXS。为什么要把汽车部分单独提出来?这和A系列运用于汽车的产品之间的区别是什么?

Imagination有多年和汽车行业伙伴的合作经验,也了解到汽车行业的工作特点,所以才将之前几代的GPU IP进行了调整,来更加适合汽车行业。

首先,性能方面。消费产品用内核市场与汽车行业是完全不同的,消费行业的流程是:内核会有一个内存的请求,然后进入到SoC,之后再进入到DDR,再回去。

但是汽车行业不同。汽车业SoC的很多操作是要实时进行的,这就对内存控制等优先级要求很高,要求低延迟,比消费产品市场有2倍的提升。Imagination设计的GPU架构允许这样的延迟的提升。

另外,汽车行业的图像渲染要求和游戏、消费类行业也不太一样。在汽车行业,自动驾驶所需要的图像渲染的能力更加简单直接,所以BXS从几何渲染的角度进行了微调。

再有,要确保GPU IP能完全满足ISO26262标准(如下图)。

4.jpg

此外,BXS做了很多小的架构方面的改进,来确保GPU能进行自我检测。为此,融入了很多GPU的自然冗余,以确保计算结果是正确的;同时能将一些误判不回馈给系统。

最后,Imagination有RISC-V固件,还有基于CRC的动态数据的完全性保护,例如Imagination在工具包里有很多工具来保证自动驾驶过程中的功能安全性。

在这个过程中,包括硬件的设计,驾驶软件的设计,以及内部的安全管理信息的开发,以及和汽车行业伙伴的合作,使Imagination了解在汽车自动驾驶的过程中真正的工作负担是什么,并了解从图像渲染和计算算法方面是从什么角度来切入,这样,通过微调才能真正实现满足市场的所有需求。

但是相比之下,很多竞品只将一个消费类产品的移动端内核重新封装,然后复制到汽车行业,并不是一个真正的汽车行业的自动驾驶级别的解决方案。

而Imagination从根本上来实现内核的改变,从安全性和验证角度,将内核进行重新的改变,完全适应汽车行业和自动驾驶和ADAS(高级辅助驾驶系统)的需求。这才能为客户提供最好的汽车行业的GPU IP内核。

值得一提的,Imagination汽车行业的GPU团队并不是从Imagination整体的GPU团队中分离出来的一个小团队,而是一个独立团队,与其他行业GPU IP团队并行工作。

那么,Imagination如何满足无人驾驶产业的需求?

到目前为止,很多无人驾驶的测试平台是通过桌面GPU的算法实现的,这种算法是浮点运算能力和神经网络计算能力。自动驾驶汽车要真正成熟,需要有异构的计算平台,即GPU+NNA的并行计算能力。Imagination的多核架构可以满足功能安全性,为自动驾驶市场提供功能安全性和灵活性的解决方案。

具体地,从功能安全性的角度,Imagination可以提供硬件级的保证。在汽车验证过程中,Imagination的方案可以在核内进行。例如在异构平台上,即把GPU和神经网络加速器(NNA)整合到同一平台上(如下图),通过GPU的动态性能控制和多任务机制以及GPU和神经网络加速器(NNA)之间的协同工作机制,可以轻松地同步应对图形处理和AI计算任务;再发展到自动驾驶,对算力有超高需求时,Imagination的多核NNA就可以充分发挥作用。

另外对于汽车行业,性能也是非常重要的。自动驾驶汽车在行驶过程中会产生大量的热,算法平台需要在一定的性能下满足功耗的降低,而Imagination的架构在性能的优化和功耗降低方面能满足自动驾驶汽车行业的需求。

最后,Imagination在汽车行业有很多的合作伙伴,有的已有10~15年的合作经验,这些终端用户无论是汽车主机厂还是汽车供应链上其他的用户,给了Imagination使用反馈,使Imagination能在汽车行业给出理想的解决方案。


5、下一代GPU IP的挑战

在下一系列的产品中,就是C系列,如果性能持续保持或超过现在的增长速率,需要突破的关键技术大概会有哪些?

正如很多大型IT企业所提到的,就是工艺节点的问题。目前为止,在有限的空间里,晶体管的密度越来越高了,以满足在有限的空间里实现我们想要实现的性能,无论是7 nm、5 nm还是3 nm。但是还有一些其他的挑战。例如在有限的空间和带宽内提升性能,同时降低功耗。另外带宽也是一个问题,在过去几代的手机端已经看到在功耗限制下,手机的性能提升也不那么明显了,Imagination此次发布的B系列,在这方面有自己的建树,Imagination在人工智能和光线追踪这2个领域的技术,也能为未来大规模提升性能模块有一定的帮助。

5.jpg


6、中国市场如何降低专利风险

中美贸易摩擦导致中国公司在芯片领域有较大的风险,贵公司如何帮助中国公司规避风险?

中国的很多客户在此前对美国技术有过分的依赖,但在中美贸易摩擦中无法进口美国的技术,而且美国对中国大量的技术出口的意愿也受到打击。因此,中国企业要避免对美国技术的过分依赖,同时更快地发展中国本土的半导体产业。

Imagination是少数拥有图形处理基本专利公司之一,另一方面也是唯一一家非美国的拥有基本GPU IP的公司,所以可以非常合理地进入到中国,与中国的合作伙伴进行密切的合作。


7、是否成功取决于生态

Imagination的GPU IP可用于中国哪些市场?

这和生态系统有很大的关系。Imagination的客户是芯片的设计者,以及客户的客户,取决于它们在某一个应用市场。特别是AI,Imagination有异构计算平台来进入AI边缘或云端的计算,前提是云端或桌面AI级计算的应用要能起来。所以每个垂直应用的市场都需要一个完整生态的建立。

Imagination现在对生态的建立,特别是在中国的生态建立是非常重视的,公司目前在不断地在招募新员工。


8、中国的芯片设计水平和欧美的比较

Imagination的IP在欧美的关系就是直接买卖。但中国公司或从业人员跟国外的不一样,成熟度有差距,包括做SoC或大芯片,生态/软硬件,以及设计高手等。

尽管国内少数公司的设计高手的水平已经超过国外的,但是大部分公司的团队成熟度还是跟欧美有差距。因此他们对EDA工具和IP提供商的依赖度很高。所以Imagination在中国的技术支持的方式和力量都不一样,需要大量的现场支持,这还是针对常规的公司。国内还有很多初创公司,很多人没有production(生产)的经验,所以要求Imagination的支持方式完全与欧美不一样。欧美哪怕一个小的团队,设计能力和做事的成熟度也比国内一些团队的成熟度高——但这不一定是说欧美公司就比国内的厉害。因为一家公司是否成功,还涉及到第二点——企业的商业文化。国内工程师可以做到996(员工上班时间从早上9点开始,到晚上9点下班,每周工作6天。),英国是绝对不可能的,美国也是极个别的公司才能做到996。

具体地,欧美成熟的fabless(设计芯片公司)购买产品,他们都按照规矩和流程,例如他们需要你的支持,怎样支持。因为他们自己有非常清晰的怎样做SoC项目的流程。

包括利润率的要求也不一样,欧美往往要求毛利不低于60%,欧美做的速度也有规律,他们不是看到你的这个产品赚钱,我也要去做这个。但中国是这样的,如果这个赚钱,我就做,而且要快,快就变成了996。前不久还听说了007(一天24小时待命,每周7天)。这是中国市场普遍存在的特点,而且即使他做不到,他也一定想这么做,因为如果产品雷同,他不这么做,根本活不了。

所以在这样的要求下,Imagination的支持或客户用IP的方式都不一样。但是也正因为有这样的文化,所以只要Imagination的产品是好的,他们确定是有价值的,他们就会采用。

中国的创新力也是惊人的。例如国内某大型芯片设计公司,刘国军副总裁一二十年前在一家美国EDA公司时,就跟该公司打交道,美国人不能相信一个刚出来的设计方法,该公司居然花了不到1年的时间,使用的效果超过了Cisco。

为此,刘国军副总裁一直跟英国、美国人讲这个故事,这家国内芯片公司当时不去花钱买顾问服务,当时的产品手册全是纸质的,有1尺高,该公司的工程师白天黑夜地去抠那些东西,最后用出来的效果超过了预期。

所以中外的商业文化不一样。

那么,相比欧美,中国的方式更好吗?这很难评判。因为欧美的流程的效率其实挺高的,他们做出来的东西基本上不太会同质化。

但是你说这不好吗?国内企业就是能做出来欧美人都不敢相信的事情。

所以针对B系列,国内企业会把Imagination的东西用起来,这没问题;其次,这个用法跟欧美不一样,所以Imagination的支持方式要努力适合国内的特点。


来源:电子产品世界

作者:王莹

赞助企业