您现在的位置是:首页 > 数字电源 > 技术解析

通过Xilinx工具和Amazon EC2云上的InTime优化设计性能

时间:2017-10-07 来源:

介绍

传统时序优化的方法和训练方向主要集中在检查和改善RTL代码或是时序约束。尽管这种方法行之有效,但在实战中因为技术和商业方面的限制,很多更改都不可能真正的执行下去。比如某些对设计比较大的修改,可能会让产品的发布日期承担滞后的风险。当下盛行可重复使用的设计模块,设计中经常会出现不能轻易更改的第三方IP核。最糟糕情况的解决方案(“worst-case scenario” solution)也不过就是把目标器件升级到一个更大的或是有更快速度等级的版本,尽管它们都将带来一笔不小的花费。

万幸的是,当今FPGA工具(比如Xilinx的Vivado)都有很多开关和设置选项来帮助时序收敛。InTime的方法,就是通过调整FPGA工具的编译过程来解决用户的时序问题和其他性能问题。Xilinx 的ISE和Vivado软件包含了很多综合和布局布线的参数,每一项都至少有两个值可以直接影响最终结果。InTime帮助设计师深入挖掘这些工具的性能,以达到要求的结果。

 

 

上图是一个客户案例,X轴代表采用不同综合和布局布线的编译批次,Y轴显示的是失败最差余量(FailingWorst Slack, 0代表时序通过)的绝对值,单位为纳秒。在这里您可以清楚地看到InTime把失败最差余量从-0.45ns(-450ps)减少到了0ns,仅通过调整编译参数就达到了时序目标,而且对设计没有任何变动。

很多情况下,用户经常使用默认的综合和布局布线的参数。因为不确定会有什么后果,很少有人会尝试改变这些参数。再加上很多参数是相互联动的,多个参数如果被同时设置错误会让时序变得更加糟糕;所以调试参数这项任务,就变得更加举步维艰。

了解InTime的流程

InTime 使用机器学习来探索FPGA编译过程中不同的参数设置。下面要说明的技术重点关注在性能达到峰值之前,生成足够的数据点。

这里有一个非常关键的概念,叫做“配方”。InTime的优化技术被归结成不同的配方,配方又被分类成“Learning”配方和“Last Mile”配方。

 

 

分类的原因是因为编译是一种高强度的计算过程。获得新数据的运行时间成本很高(一般人耐心也很有限),所以每个配方不能无限地运行,必须要根据结果改善的情况来限制Learning的运行数。一旦结果达到稳定(由花费时间和结果改善所决定的投资回报率逐渐减少),用户就会切换到Last Mile配方。Last Mile 配方采用一种高度随机的技巧,设计离目标性能越近,这个配方就工作地越好。例如,如果把目前取得的最好结果当作一个参考,Last Mile配方会随机对不同的逻辑单元进行布局。

优化设计的步骤

步骤0:设计建模

为了减少集中在一个结果所需要的时间,InTime自带一个包含元数据的数据库。我们在长时间内在不同设计上测试,逐步归纳出在各种设计上用什么参数合适,然后把这些经验总结成了这个数据库。这样做的目标就是缩小需要调节参数的范围,只选取重要的,对某个设计最有效的参数进行调节。

步骤一:生成数据

在这一步,InTime在每一轮的执行中,生成编译参数(也被称作“策略”)。设计师应该对每一轮进行配置,运行10到30个编译。有些配方会比其他的配方更合适,这取决于所得数据点(编译结果)的数量。

学习和分析只出现在每一轮的结尾或是下一轮的开始。作为一种指导,InTime需要在3到5轮内分析100个数据点来达到一个本地最优数据。

 

 

如果结果表示没有明显的改善,我们就需要运行更多的编译,因为这个配方还没有得到本地最优数据。然而,如果结果显著改善(和原始结果比较)并且改善已经不再继续,接下来就要更换配方了(参见Deep Dive配方)。

步骤二:使用“Deep Dive”配方

一旦我们获得了几个优良的结果,或者结果的改善已经开始减缓,就要准备使用“Deep Dive”配方了。这个配方检查当前的结果,然后对本地最优数据与其周围的数据点做一个深入的分析;与之前的配方相比,在更短的时间内将结果改善了10%。当然,没有之前配方的结果,Deep Dive也不会这么有效。

 

 

步骤三:Auto Placement配方或Extra Optimization 配方

最终,Last Mile配方会使用Vivado的设置,这些设置伪随机,并且对代码变化高度敏感。根据设计的具体情况,Last Mile配方可以生成仅仅9个编译或者多达100个编译。比如,在Vivado,随机的Placement Exploration配方可以轻易地生成100个编译,然而Extra Optimization则被限制在9个编译。

云端运行InTime和Vivado

您也可以在亚马逊网络服务(AWS)上面运行InTime来减少总共的运行时间,达到时序目标。通过把您的并行运行数加倍,您可以把您优化所需的时间减半。

InTime和Xilinx结为合作伙伴,为亚马逊机器映像(AMI)提供所有的预装软件许可。这可以让您更快的开始一个实例,不用任何安装就可以在云端运行您的FPGA项目。

结论

选择正确的综合和布局布线的参数一种十分强大的技能,它可以帮您达到设计性能目标,从FPGA工具中(如Vivado)获得的最大的受益。然而,把每一组参数都尝试一遍是完全不可能的。如下图所示,快速地聚焦到正确的参数组合,可以产生极好的结果(总负余量从-3000ns到-3ns)。使用云端服务也可以减少达到理想结果的总耗时。

 

换一批

延伸阅读

[真心话] 英研究发现使用轻触式付款信用卡安全隐患大

英研究发现使用轻触式付款信用卡安全隐患大

现在有越来越多的信用卡具备轻触式付款功能,用户只需轻轻在传感器上拍一下,不需要签名,也不需要密码认证,就可轻松付款。然而,方便的代价是有可能信用卡数据会被偷取。据香港《东方日报》7月23日报道,英国消费者组织“Which?”最新进行的测试就......

关键字:东方日报 信用卡 环球科技 测试结果 消费者

[真心话] 神技能get!教你当场测试智能手机功能?

神技能get!教你当场测试智能手机功能?

不少人在专卖店或是电信营业厅买完手机后,仅仅只是看看屏幕有没有亮点、外壳有没有刮伤,开开心心用了7天后才发现某个功能不正常。为了避免错失7天内可免费换一台全新机的好机会,建议消费者在购买时可以立刻输入代码、开启手机内置的“测试模式”,来检查......

关键字:智能手机 功能测试

[新鲜事] 没盼头了!无人驾驶汽车绝对安全还得几百年

没盼头了!无人驾驶汽车绝对安全还得几百年

无人驾驶汽车是不是比人类驾驶的汽车更安全?关于这个问题业界一直存在争议。美国国家公路交通安全管理局在之前的报告中指出,汽车撞车94%是由于人为失误造成的,包括酒驾、超速、分心、疲劳。以分析国家安全享誉全球的兰德集团(Rand Corpora......

关键字:谷歌 无人驾驶 安全测试

[图酷] ARM+FPGA

ARM+FPGA

基于ARM+FPGA的高速同步数据采集方案,主要包括以下几个部分:ARM控制器、存储电路、FPGA逻辑控制电路、A/D转换电路、FIFO缓存、电源电路、接口电路等。......

关键字:

[疯狂史] 紫光疯狂收购史 投3000亿圆芯片帝国梦!

紫光疯狂收购史 投3000亿圆芯片帝国梦!

继7亿美金收购展讯,9亿美金收购锐迪科,25亿美金收购新华三,38亿美金控股西数,再砸5亿人民币“娶”西数,紫光疯狂的步伐还远未停止。近日,紫光投资3000亿元打造第三大芯片制造商,媲美Intel。不得不说......

关键字:紫光 收购史 FPGA 半导体

[新鲜事] Ryzen运行部分FMA3测试会崩溃,AMD承诺固件修复

Ryzen运行部分FMA3测试会崩溃,AMD承诺固件修复

现在Ryzen处理器还真的被爆出一个bug——运行部分FMA3测试会导致系统锁定,AMD也确认了这个问题,已经承诺通过主板固件升级解决。......

关键字:Ryzen FMA3测试

[新鲜事] 拒绝马路杀手!谷歌无人驾驶开进了沙漠

拒绝马路杀手!谷歌无人驾驶开进了沙漠

谷歌自动驾驶汽车正在不断走向成熟,除了凤凰城的城市路况,这次它们还要挑战新的地形,那就是亚利桑那州的大沙漠。谷歌自动驾驶汽车业务总监詹妮弗表示,谷歌选定亚利桑那不但是因为该州对技术研发张开怀抱,还因为它境内有各种奇特的沙漠地形可供车辆进行测......

关键字:谷歌 无人驾驶汽车 地形测试
发表评论 共有条评论
用户名: 验证码: