查看: 2137|回复: 0
打印 上一主题 下一主题

STM32L476 FPU 执行效率之比较浅析

[复制链接] qrcode

23

主题

26

帖子

79

积分

注册会员

Rank: 2

积分
79
楼主
跳转到指定楼层
发表于 2016-8-9 01:52 PM | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
1.前言

本应用笔记基于STM32L476平台,通过实际测量来评定使能FPU时浮点运算效率的情况。

2.测试工具

STM32L476 Nucleo,示波器

3.测试方法
MCU 运行频率设置为16MHz,根据下面公式1 做N 次浮点运算,分使能FPU和禁止FPU两种情况,测试完成相同运算所需要的时间。在例程中通过翻转IO PB13 来标定完成运算所需要的时间(如图)。


3.1 测试代码




3.2 代码分析
根据测试用的一元二次方程,经过IAR 编译后,汇编结果如下:

3.2.1 FPU 使能
从汇编代码可以看出,使能FPU 的情况下,完成一元二次方程的运算只需要7 条单周期指令,总共耗时为7 个Clock 周期。通过IAR 的方针模式运行,需要的CPU cycles 为7。






3.2.2 FPU 禁止
从汇编代码可以看出,未使能FPU 的情况下,完成该一元二次方程的运算需要执行14 条指令,其中包括3 条两周期指令,6 条单周期指令,5 条程序跳转指令。通过IAR 的方针模式运行,需要的CPU cycles 为207.



4.测试数据及结论
IO完成两次翻转耗时6.48 uS;
使能FPU 时,除去IO 翻转耗时,完成一次运算时间为6.52 uS(13 uS -6.48 uS),
如下图示:


禁止FPU 时,除去IO 翻转耗时,完成一次运算时间为87.4 uS(93.88 uS -6.48 uS),如下图示:


小结下,根据上面相关测试数据大致可得出如下结论:

• 完成同样的一元二次方程运算,禁止FPU时所消耗的时间约为使能FPU时消耗时间的13.4 倍左右。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表