二进制转译加速方法及其在低电压处理器中的应用研究

发布时间:2019-06-15 11:15
【摘要】:随着移动互联网和物联网的发展,基于ARM的嵌入式处理器越来越普及,例如智能手机和智能平板等。一方面,代码的二进制兼容性已经成为新的处理器架构能否进入嵌入式市场的主要阻碍。另一方面,这些处理器往往采用电池供电,面临严重的功耗问题。动态二进制转译技术不但能够有效解决上述代码兼容性问题,实现跨平台执行;还能够实时获得程序的运行信息,有针对性的对程序进行动态优化,以获得最佳能效。本文围绕动态二进制转译的关键技术进行了研究,提出了面向动态转译的加速方法;并利用二进制转译的跨平台特性和动态优化特性,将二进制转译技术和瞬态错误自适应的低电压处理器设计技术相结合,以有效提高处理器能效。本文主要研究内容和创新点为:1、基于转移指令特性的动态转译方法。针对传统方法统一转译转移指令导致转译器效率较低,基于转移目标地址在函数内外的不同特征提出直接映射和指令类型转译策略组合的动态转译方法。对函数内转移指令,直接采用目标架构中对应的分支指令进行映射,通过转移前后指令转译码无缝链接高效转译条件分支指令,且无需生成源寄存器到内存同步指令;对函数间转移指令,区别对待函数转移和其他转移指令,通过将源程序函数转移指令属性继承给转译码以提高目标机转移预测器准确率。2、基于高速缓存负荷均衡的动态转译方法。针对动态转译时指令和数据高速缓存访问负荷大幅增加且增幅不均衡导致的转译器性能下降问题,提出基于指令与数据高速缓存访问负荷动态均衡的软硬件协同转译方法。该方法为处理器设计高速缓存负荷平衡状态,该状态将数据高速缓存分为普通区和负荷平衡区,普通区缓存正常的程序数据,负荷平衡区通过负荷转化通道吸收动态转译器调度器将源机器代码空间地址向目标机器代码空间地址转换时在指令高速缓存上产生的部分负荷,提高数据高速缓存利用率。3、基于瞬态错误预测模型的单周期纠错的低电压处理器。基于低电压处理器中的瞬态错误在流水线中分布的局部性和可预测性,提出软硬件协同设计的单周期纠错的低电压处理器设计方法。该方法的核心思想是基于动态转译技术建立处理器瞬态错误预测模型。该模型在程序编译时对可能出错的指令流进行预测。对于那些可能出错的指令流,通过处理器瞬态错误消除编程接口,在编译时即将可能出现的瞬态错误规避掉,有效提高系统的容错能力和能效。4、基于轻量级动态优化的低电压处理器。基于低电压处理器中的瞬态错误在指令级的局部性,提出基于动态优化的软硬件协同设计的低电压处理器设计方法。该方法在软硬件之间,引入一个基于动态转译技术的轻量级的动态优化器。该优化器在程序运行时实时收集程序的瞬态错误信息,在处理器空闲时分析这些错误信息并在热点错误指令之前插入瞬态错误警报。当程序再次执行时,如果优化器发现特定的指令序列不断引起瞬态错误,立即激活预留在该指令序列之前的瞬态错误警报,以通知硬件采取措施,避免该指令未来执行时的瞬态错误。该方法通过软硬件协同设计以极低的成本消除了高达95%以上的瞬态错误,不但大幅减少因为纠错导致的性能损失和功耗损失,而且使得底层的容错硬件可以设计的非常简单和鲁棒,有效提高系统的容错能力和能效。
[Abstract]:With the development of mobile Internet and Internet of Things, embedded processors based on ARM are becoming more and more popular, such as smart phones and smart tablets. On the one hand, the binary compatibility of the code has become a major impediment to the ability of the new processor architecture to access the embedded market. On the other hand, these processors are often powered by batteries and are subject to severe power consumption problems. The dynamic binary translation technology can not only effectively solve the code compatibility problem, realize cross-platform execution, but also can obtain the operation information of the program in real time, and carry out dynamic optimization on the program to obtain the optimal energy efficiency. In this paper, the key technology of dynamic binary translation is studied, and an acceleration method for dynamic translation is proposed, and the binary translation technology and the transient error adaptive low-voltage processor design technology are combined with the cross-platform characteristic and the dynamic optimization characteristic of the binary translation. So as to effectively improve the energy efficiency of the processor. The main content and innovation point of this paper are as follows:1. Dynamic translation method based on the characteristic of transfer instruction. A dynamic translation method of direct mapping and instruction type translation strategy combination is proposed based on the different features of the transfer target address inside and outside the function. the transfer instruction in the function is directly mapped by the branch instruction corresponding to the target structure, and the branch instruction of the high-efficiency translation condition is not required to be generated by the instruction forwarding and decoding before and after the transfer, and the source register is not required to be generated to the memory synchronization instruction; and the function-to-function transfer instruction is executed, The method of dynamic translation based on the load balance of the cache is based on the transfer of the function of the source program and the other transfer instruction. A software and hardware co-translation method based on instruction and data cache access load dynamic balance is proposed for the problem of the decrease of the translator's performance due to the significant increase of the instruction and data cache access load and the unbalanced increase in the dynamic translation. The method comprises the following steps of: designing a cache load balance state for a processor, dividing the data cache into a normal area and a load balance area, and caching normal program data in the normal area; the load balance region absorbs the partial load generated on the instruction cache when the dynamic translator scheduler absorbs the partial load generated on the instruction cache when the source machine code space address is converted to the target machine code space address by the load conversion channel absorption dynamic translator scheduler, A low voltage processor based on a single-cycle error correction of a transient error prediction model. Based on the local and the predictability of the transient error in the low voltage processor in the pipeline, a low-voltage processor design method for the single-cycle error correction of the hardware and software co-design is proposed. The core idea of the method is to set up a processor transient error prediction model based on the dynamic translation technology. The model predicts the possible error of the instruction stream when the program is compiled. For those instruction streams that may be wrong, the programming interface can be eliminated by the processor's transient error, and the possible transient errors can be avoided at the time of the compilation, so that the fault-tolerance and energy efficiency of the system can be effectively improved. Based on the local error of the low voltage processor, the design method of the low voltage processor based on the dynamic optimization of the hardware and software is proposed. The method introduces a lightweight dynamic optimizer based on dynamic translation technology between hardware and software. The optimizer collects the transient error information of the program in real time while the processor is running, analyzes the error messages when the processor is idle and inserts a transient error alert before the hotspot error instruction. When the program is executed again, if the optimizer finds that a particular instruction sequence continues to cause a transient error, the transient error alert that is reserved before the instruction sequence is immediately activated to notify the hardware to take steps to avoid a transient error in the future execution of the instruction. The method eliminates the transient error of up to 95% at a very low cost through the cooperative design of the hardware and software, not only greatly reduces the performance loss and the power loss caused by error correction, but also makes the fault-tolerant hardware of the bottom layer simple and robust in design, And the fault tolerance and energy efficiency of the system can be effectively improved.
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP332

【相似文献】

相关期刊论文 前10条

1 陶品;;嵌入式系统——第二讲 百花齐放的嵌入式处理器[J];世界电子元器件;2006年03期

2 李超;张美琳;杨旭;徐勇军;骆祖莹;;安全处理器体系结构的现状与展望[J];小型微型计算机系统;2011年10期

3 王恩东;秦济龙;;处理器互联体系结构的一些特点分析[J];科学技术与工程;2011年30期

4 余卫东;MMX技术[J];电脑知识;1997年03期

5 Dipl.-Ing.Alexander Sch銉der;;嵌入式处理器解决车载多媒体系统中的设计难题[J];世界电子元器件;2007年12期

6 C.A.(Al)Dennis ,陈瑞源 ,力康;公用信号处理器的应用和设计[J];系统工程与电子技术;1987年06期

7 张健;奔腾Ⅱ、奔腾Ⅱ至强、赛扬处理器各司其职[J];电脑技术;1998年09期

8 Robert Cravotta;;可配置处理器应用日趋红火[J];电子设计技术;2003年11期

9 刘磊;邹候文;唐屹;;一种可编程安全处理器体系结构的研究与实现[J];广州大学学报(自然科学版);2006年04期

10 张铮;赵荣彩;颜峻;邰铭;陈科;;网络处理器体系结构和应用综述[J];信息工程大学学报;2006年04期

相关会议论文 前3条

1 宋绯;刘晓宁;;DSP/MCU结构的新型处理器[A];第九届全国青年通信学术会议论文集[C];2004年

2 赵秋平;杨灿群;王锋;;LBM算法在Cell处理器上的实现和优化[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年

3 周巍;孙冰;战立明;吕建华;王国仁;于戈;;基于DOM模型的XML查询处理器的设计与实现[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

相关重要报纸文章 前10条

1 ;处理器上演多核大戏[N];计算机世界;2005年

2 心元;PC“心脏”的搏击[N];计算机世界;2004年

3 清华大学微处理器与SoC技 术研究中心 王海霞 汪东升;颠覆传统理念[N];计算机世界;2005年

4 清华大学微处理器与SoC技术研究 中心 汪东升 王海霞 张悠慧 李兆麟;CMP 开启处理器效能时代[N];计算机世界;2005年

5 江苏 netfan;体现速度与性能[N];电脑报;2004年

6 四川 王毅;变革进行时[N];电脑报;2004年

7 清华大学微处理器与SoC技术研究中心 汪东升;多核技术天地广阔[N];计算机世界;2006年

8 本报记者 李献 王皓;2002年服务器四大景观[N];计算机世界;2003年

9 ;MontaVista Linux 2.1跨平台[N];中国计算机报;2002年

10 ;CPU技术进步牛气冲天[N];计算机世界;2004年

相关博士学位论文 前10条

1 吴臻志;多标准高性能前向纠错码处理器[D];北京理工大学;2015年

2 刘晓楠;面向国产处理器的二进制翻译关键技术研究[D];解放军信息工程大学;2014年

3 李战辉;二进制转译加速方法及其在低电压处理器中的应用研究[D];浙江大学;2016年

4 高军;CAMPER:一种高效能处理器核体系结构关键技术研究与实现[D];国防科学技术大学;2014年

5 魏继增;可配置可扩展处理器关键问题研究[D];天津大学;2010年

6 霍文捷;嵌入式处理器安全运行机制的研究与设计[D];华中科技大学;2010年

7 从明;类数据流驱动的分片式处理器体系结构[D];中国科学技术大学;2009年

8 徐光;分片式流处理器体系结构[D];中国科学技术大学;2010年

9 李勇;异步数据触发微处理器体系结构关键技术研究与实现[D];国防科学技术大学;2007年

10 任永青;逻辑核动态可重构的众核处理器体系结构[D];中国科学技术大学;2010年

相关硕士学位论文 前10条

1 梁彦;可配置的众核结构验证系统的研究与实现[D];中国科学院大学(工程管理与信息技术学院);2015年

2 张艳;面向通信算法的处理器核功能部件的设计和实现[D];国防科学技术大学;2014年

3 曹金阳;猜测并行多核体系结构模拟环境研究与实现[D];国防科学技术大学;2013年

4 范孟秋;基于LISA的专用指令集处理器汇编工具链的研究与实现[D];南开大学;2015年

5 曾斌;分片式处理器体系结构上的超块优化技术[D];中国科学技术大学;2009年

6 黄冕;X处理器存储一致性模型的研究与实现[D];国防科学技术大学;2008年

7 赵灿明;分片式处理器上激进执行模型分析[D];中国科学技术大学;2009年

8 刘晋汾;处理器描述语言的研究与应用[D];解放军信息工程大学;2011年

9 刘子扬;基于虚拟计算群的众核处理器动态在线任务调度算法研究[D];上海交通大学;2013年

10 邸志雄;多核包处理器数据控制总线技术研究[D];西安电子科技大学;2010年



本文编号:2500172

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2500172.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6ef6e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com