您现在的位置是:首页 > 数字电源 > 技术解析

通过Xilinx工具和Amazon EC2云上的InTime优化设计性能

时间:2017-10-07 来源:

介绍

本文引用地址: http://power.21ic.com//digi/technical/201710/57678.html

传统时序优化的方法和训练方向主要集中在检查和改善RTL代码或是时序约束。尽管这种方法行之有效,但在实战中因为技术和商业方面的限制,很多更改都不可能真正的执行下去。比如某些对设计比较大的修改,可能会让产品的发布日期承担滞后的风险。当下盛行可重复使用的设计模块,设计中经常会出现不能轻易更改的第三方IP核。最糟糕情况的解决方案(“worst-case scenario” solution)也不过就是把目标器件升级到一个更大的或是有更快速度等级的版本,尽管它们都将带来一笔不小的花费。

万幸的是,当今FPGA工具(比如Xilinx的Vivado)都有很多开关和设置选项来帮助时序收敛。InTime的方法,就是通过调整FPGA工具的编译过程来解决用户的时序问题和其他性能问题。Xilinx 的ISE和Vivado软件包含了很多综合和布局布线的参数,每一项都至少有两个值可以直接影响最终结果。InTime帮助设计师深入挖掘这些工具的性能,以达到要求的结果。

 

 

上图是一个客户案例,X轴代表采用不同综合和布局布线的编译批次,Y轴显示的是失败最差余量(FailingWorst Slack, 0代表时序通过)的绝对值,单位为纳秒。在这里您可以清楚地看到InTime把失败最差余量从-0.45ns(-450ps)减少到了0ns,仅通过调整编译参数就达到了时序目标,而且对设计没有任何变动。

很多情况下,用户经常使用默认的综合和布局布线的参数。因为不确定会有什么后果,很少有人会尝试改变这些参数。再加上很多参数是相互联动的,多个参数如果被同时设置错误会让时序变得更加糟糕;所以调试参数这项任务,就变得更加举步维艰。

了解InTime的流程

InTime 使用机器学习来探索FPGA编译过程中不同的参数设置。下面要说明的技术重点关注在性能达到峰值之前,生成足够的数据点。

这里有一个非常关键的概念,叫做“配方”。InTime的优化技术被归结成不同的配方,配方又被分类成“Learning”配方和“Last Mile”配方。

 

 

分类的原因是因为编译是一种高强度的计算过程。获得新数据的运行时间成本很高(一般人耐心也很有限),所以每个配方不能无限地运行,必须要根据结果改善的情况来限制Learning的运行数。一旦结果达到稳定(由花费时间和结果改善所决定的投资回报率逐渐减少),用户就会切换到Last Mile配方。Last Mile 配方采用一种高度随机的技巧,设计离目标性能越近,这个配方就工作地越好。例如,如果把目前取得的最好结果当作一个参考,Last Mile配方会随机对不同的逻辑单元进行布局。

优化设计的步骤

步骤0:设计建模

为了减少集中在一个结果所需要的时间,InTime自带一个包含元数据的数据库。我们在长时间内在不同设计上测试,逐步归纳出在各种设计上用什么参数合适,然后把这些经验总结成了这个数据库。这样做的目标就是缩小需要调节参数的范围,只选取重要的,对某个设计最有效的参数进行调节。

步骤一:生成数据

在这一步,InTime在每一轮的执行中,生成编译参数(也被称作“策略”)。设计师应该对每一轮进行配置,运行10到30个编译。有些配方会比其他的配方更合适,这取决于所得数据点(编译结果)的数量。

学习和分析只出现在每一轮的结尾或是下一轮的开始。作为一种指导,InTime需要在3到5轮内分析100个数据点来达到一个本地最优数据。

 

 

如果结果表示没有明显的改善,我们就需要运行更多的编译,因为这个配方还没有得到本地最优数据。然而,如果结果显著改善(和原始结果比较)并且改善已经不再继续,接下来就要更换配方了(参见Deep Dive配方)。

步骤二:使用“Deep Dive”配方

一旦我们获得了几个优良的结果,或者结果的改善已经开始减缓,就要准备使用“Deep Dive”配方了。这个配方检查当前的结果,然后对本地最优数据与其周围的数据点做一个深入的分析;与之前的配方相比,在更短的时间内将结果改善了10%。当然,没有之前配方的结果,Deep Dive也不会这么有效。

 

 

步骤三:Auto Placement配方或Extra Optimization 配方

最终,Last Mile配方会使用Vivado的设置,这些设置伪随机,并且对代码变化高度敏感。根据设计的具体情况,Last Mile配方可以生成仅仅9个编译或者多达100个编译。比如,在Vivado,随机的Placement Exploration配方可以轻易地生成100个编译,然而Extra Optimization则被限制在9个编译。

云端运行InTime和Vivado

您也可以在亚马逊网络服务(AWS)上面运行InTime来减少总共的运行时间,达到时序目标。通过把您的并行运行数加倍,您可以把您优化所需的时间减半。

InTime和Xilinx结为合作伙伴,为亚马逊机器映像(AMI)提供所有的预装软件许可。这可以让您更快的开始一个实例,不用任何安装就可以在云端运行您的FPGA项目。

结论

选择正确的综合和布局布线的参数一种十分强大的技能,它可以帮您达到设计性能目标,从FPGA工具中(如Vivado)获得的最大的受益。然而,把每一组参数都尝试一遍是完全不可能的。如下图所示,快速地聚焦到正确的参数组合,可以产生极好的结果(总负余量从-3000ns到-3ns)。使用云端服务也可以减少达到理想结果的总耗时。

 

换一批

延伸阅读

[新鲜事] Ryzen运行部分FMA3测试会崩溃,AMD承诺固件修复

Ryzen运行部分FMA3测试会崩溃,AMD承诺固件修复

现在Ryzen处理器还真的被爆出一个bug——运行部分FMA3测试会导致系统锁定,AMD也确认了这个问题,已经承诺通过主板固件升级解决。......

关键字:Ryzen FMA3测试

[真心话] 致青春 FROM:一只嵌入式行业摸爬滚打数十载的老鸟

致青春   FROM:一只嵌入式行业摸爬滚打数十载的老鸟

作为一名在嵌入式行业摸爬滚打许久的老鸟,回想自己的经历之路,那么漫长可又仿佛近在眼前。——此文仅献给那些刚刚踏上硬件之路和还在徘徊的同学们,在此我简要的记录了我的学习经历和其间自己所获的一些心得,以帮助初学者少走弯路。......

关键字:工程师 嵌入式 FPGA

[真心话] 跨度13年,BUG数194个,20年老工程师总结的重要经验教训

跨度13年,BUG数194个,20年老工程师总结的重要经验教训

我在《从你的bug总结经验教训》一文中写道,我一直在如何跟踪遇到的最有意思的bug。我最近回顾了全部194个bug(时间跨度达13年),看看从中学到了什么经验教训。......

关键字:编码 测试 调试

[疯狂史] 从汇编、C语言的起点出发,到从事FPGA开发的漫漫十年

从汇编、C语言的起点出发,到从事FPGA开发的漫漫十年

从大学时代第一次接触FPGA至今已有10多年的时间,至今记得当初第一次在EDA实验平台上完成数字秒表、抢答器、密码锁等实验时那个兴奋劲。当时由于没有接触到HDL硬件描述语言,设计都是在MAX+plus II原理图环境下用74系列逻辑器件搭建......

关键字:FPGA 开发

[图酷] ARM+FPGA

ARM+FPGA

基于ARM+FPGA的高速同步数据采集方案,主要包括以下几个部分:ARM控制器、存储电路、FPGA逻辑控制电路、A/D转换电路、FIFO缓存、电源电路、接口电路等。......

关键字:

[真心话] 神技能get!教你当场测试智能手机功能?

神技能get!教你当场测试智能手机功能?

不少人在专卖店或是电信营业厅买完手机后,仅仅只是看看屏幕有没有亮点、外壳有没有刮伤,开开心心用了7天后才发现某个功能不正常。为了避免错失7天内可免费换一台全新机的好机会,建议消费者在购买时可以立刻输入代码、开启手机内置的“测试模式”,来检查......

关键字:智能手机 功能测试
发表评论 共有条评论
用户名: 验证码:

精确稳定 让平均电流法帮你实现模块电源并联

精确稳定 让平均电流法帮你实现模块电源并联

今天要为大家介绍的是平均电流法,这种方法能够精确稳定的帮助工程师实现电源模块的并……

九款最简单的电子镇流器电路图原理图分析

九款最简单的电子镇流器电路图原理图分析

从工作原理而言,电子镇流器是一个电源变换电路,它将交流输入市电电源的波形、频率和……

干货|交流接触器常用接线电路图和实物图

干货|交流接触器常用接线电路图和实物图

今天分享一些电气知识中的交流接触器常用接线电路图和实物图,从简单到复杂。

……

项目外包