STM32 | 一种简单、实用的测量程序运行时间的方法

发布者:RadiantExplorer最新更新时间:2021-08-11 来源: eefocus关键字:STM32  测量程序  运行时间 手机看文章 扫描二维码
随时随地手机看文章

前言

平时我们可能很少去关注程序运行的时间,但是在一些情况下可能需要对程序进行一个整体的复盘、优化。


那么,程序运行的时间就是一个可以考虑的方面,可以测一下某些代码块、函数、算法的运行时间,然后整体考虑看看有没有必要进行优化。


之前在某工控类项目中,我就有接到一个任务去测试程序中关键代码的执行时间,并输出报告。当时是使用一个GPIO+示波器进行测试的,也可以使用逻辑分析仪来测。


当时测量的方法很简单:

在要测试的代码块/函数之前设置该GPIO的电平为高电平,在要测试的代码块/函数之后设置该GPIO为低电平,使用示波器测高电平的时间,就知道了这一代码块/函数的运行时间。


下面就通过实例来介绍一下这种简单而有效的方法。


我这里使用逻辑分析仪来测量,使用小熊派开发板来验证,小熊派的主控为STM32L431RCT6,系统时钟设置为80MHz。


这里顺带提一点题外话,之前有一些初学的读者朋友问我说逻辑分析仪贵不贵。逻辑分析仪有贵的也有便宜的,贵则上千上万元,便宜则有几十、几百。我觉得无论工作、还是学习,都有必要入手一个逻辑分析仪。

本篇笔记的测试用的逻辑分析仪就是某宝上二十几块钱买的,可以满足平时的学习所用。条件有限的学生朋友可以入手。有条件的可以考虑入手几百块钱的。


GPIO+逻辑分析仪测时间

1、测量HAL_Delay函数

STM32的HAL库有给我们提供一个HAL_Delay延时函数,这是一个ms级延时函数。这个延时函数依赖于系统滴答定时器,所以是一个比较精确的延时函数。


这里,我们就使用GPIO+逻辑分析仪的方法来测量一下这个延时函数。为了方便测试,我们在while死循环里进行测量。


代码:

测量结果:

可见,我们通过逻辑分析仪测出了HAL_Delay(100);运行的时间为100.4315ms,符合我们的预期。


这里高电平两侧其实就是低电平部分,只不过低电平持续的时间太短了,在这里看起来像一条竖线,我们放大来看看:

结果已经很准了,可以满足平时的测量。这种测量很难保证百分之百的精确,小数点后面的那一部分可能是受很多不可控因素的影响,这不在我们本篇文章的讨论范围之内。

我们是想通过这个示例来介绍这种测量方法的使用及证明这种方法是可行的。下面再继续看两个实例。


2、测量软件延时函数

我们以前刚开始学单片机的时候,经常有用到一些粗略的延时函数,其实现方法就是循环执行n条空语句,以达到一个延时的效果。


那么,我们怎么来构造一个us级或ms级的粗略延时函数(软件延时函数)。我们之前看到的粗略延时函数类似这样子:

这些函数里面需要给出一些循环的次数,这个值是怎么来确定的呢?比如上面这个函数中123这个值是怎么来确定的?我们可以使用GPIO+逻辑分析仪的方法来进行一个简单的确定。


确定1us:

不同的处理器,结果是不一样的。针对小熊派开发板(主控:STM32L431RCT6),循环运行15条空语句的时间实测结果是1.083us,这算是比较接近1us了。


我们就运用这个结果来构建一个us级软件延时函数如下:

接下来我们测一下soft_delay_us(100);实际运行了多长时间:

可见,结果差不多接近我们想要的结果。构建这样的粗略延时函数可以使用这样的方式来确定一些循环次数的值。


3、查表法VS常规法运行时间

在之前的文章:空间换时间,查表法的经典例子《空间换时间,查表法的经典例子》中,我们有说可以适当使用查表法降低程序的执行时间。这里我们来实际测量对比一下那篇文章中查表法与常规法的优劣。


关键代码:

/* 测试结果 */

struct test_res

{

 unsigned int data;  /* 数据          */

 unsigned int count; /* 数据中1的个数 */

};


/* ============常规法============ */

#if 1

struct test_res get_test_res(unsigned int data)

{

 /* 保存测试结果 */

 struct test_res res;

 

 /* 保证数据总会在0~0xf之间 */

 // unsigned int temp = data & 0xf;  

 unsigned int temp = data & 0xff;  

 

 res.count = 0;

 res.data = temp;

 

 /* 循环判断每一位 */

 for (int i = 0; i < 16; i++)

 {

  if (temp & 0x01)

  {

   res.count++;

  }

  temp >>= 1;

 }

 

 return res;

}

#else

/* ============查表法============ */


int table[16] = {0, 1, 1, 2, 1, 2, 2, 3, 1, 2, 2, 3, 2, 3, 3, 4};


struct test_res get_test_res(unsigned int data)

{

 /* 保存测试结果 */

 struct test_res res;

 

 /* 保证数据总会在0~0xf之间 */

 unsigned int temp = data & 0xff;  

 

 /* 获取低4位中1的个数 */

 unsigned int low_data = temp & 0xf;

 unsigned int low_cnt = table[low_data];

 

 /* 获取高4位中1的个数 */

 unsigned int high_data = (temp >> 4) & 0xf;

 unsigned int high_cnt = table[high_data];

 

 /* 结果 */

 res.count = low_cnt + high_cnt;

 res.data = temp;

 

 return res;

}


int main(void)

{

  /* USER CODE BEGIN 1 */

  struct test_res res = {0};

    

  /* 省略部分代码。。。。。。。。。 */

    

  while (1)

  {

  /* USER CODE END WHILE */

  /* USER CODE BEGIN 3 */

    HAL_GPIO_WritePin(GPIOA, GPIO_PIN_2, GPIO_PIN_SET);

    res = get_test_res(30);

    HAL_GPIO_WritePin(GPIOA, GPIO_PIN_2, GPIO_PIN_RESET);

  }

  /* USER CODE END 3 */

}

#endif


常规法程序的运行时间:

查表法程序的运行时间:

可见,这个例子中常规法程序运行时间约为2ns,而查表法程序运行时间约为500ns。查表法的程序运行之间仅为常规法的1/4,省下了3/4的时间。


随着调用次数的增多,这里的查表法的优势越大。比如循环计算0~31这32个数中每一个数二进制位为1的个数,则相关代码改为:


  int i;

  while (1)

  {

    HAL_GPIO_WritePin(GPIOA, GPIO_PIN_2, GPIO_PIN_SET);

    for (i = 0; i < 32; i++)

    {

      res = get_test_res(i);

    }

    HAL_GPIO_WritePin(GPIOA, GPIO_PIN_2, GPIO_PIN_RESET);

  }


常规法:

查表法:

可见,随着调用次数的增多,查表法相对于常规法更省时,即查表法的优势越大。

以上就是关于GPIO+逻辑分析仪测程序运行时间的几个实例。下面顺带提一下使用MDK+ST-LINK测STM32程序运行时间的方法。


MDK+ST-LINK测时间

在使用MDK作为开发工具时,可以搭配一些仿真器来查看程序执行时间。这里通过实例来介绍MDK+ST-LINK测STM32程序运行时间的方法。

这里重点是设置Trace里面的系统内核时钟,我们这里使用的是小熊派开发板(主控:STM32L431RCT6),并且配置的系统时钟是80MHz:

所以在Trace中要设置为80MHz。这个得根据实际芯片的型号就需要根据进行修改,比如STM32F103系列默认是72MHz,STM32F429系列默认为180MHz等,根据实际进行修改。


下面我们通过在线调试、打断点的方式看一下 HAL_Delay(1000);运行了多长时间:

可见程序运行到HAL_Delay(1000);前后的时间分别为:

前:0.00008964s

后:1.00108161s

即HAL_Delay(1000);走过的时间约为1s,符合预期。

关键字:STM32  测量程序  运行时间 引用地址:STM32 | 一种简单、实用的测量程序运行时间的方法

上一篇:STM32 | TCP通信实例分析
下一篇:STM32 | 请写一个函数输出如下波形

推荐阅读最新更新时间:2024-11-13 21:30

STM32激光电源控制系统设计
  利用STM32实现了激光电源的控制系统设计。本文针对激光焊接的实际应用,对激光电源的功能做了更好的扩展和完善,采用人机界面(HMI)显示来控制激光电源,可以对针对不同的焊接要求进行激光波形和参数的设定,能够满足多数实际运用的需求。系统控制界面稳定性高,易操作,控制能力强;气阀控制和光栅控制能更好的保护焊接操作者;温度控制能有效的保证激光电源系统稳定工作。   0 引言   随着激光行业的飞速发展,激光器已广泛应用于工业加工领域,如激光切割、激光打标、激光调阻、激光热处理等,除此之外还被作为诊疗设备应用于医疗领域。   激光焊接是以聚焦的激光束作为能源轰击焊件所产生的热量进行焊接的方法,是激光材料加工技术应用的重要方面之一。
[电源管理]
<font color='red'>STM32</font>激光电源控制系统设计
STM32的串口(UART)及串口通信原理
一、通信接口介绍 1、处理器与外部设备通信的两种方式: 并行通信 - 传输原理:数据各个位同时传输。 -优点:速度快 -缺点:占用引脚资源多 串行通信 - 传输原理:数据按位顺序传输(一位一位传输)。 -优点:占用引脚资源少 -缺点:速度相对较慢 2、串行通信三种传送方式: 单工: 数据传输只支持数据在一个方向上传输 半双工: 允许数据在两个方向上传输,但是,在某一时刻,只允许数据在一个方向上传输,它实际上是一种切
[单片机]
<font color='red'>STM32</font>的串口(UART)及串口通信原理
利用STM32定时器的PWM输出功能,直接获取PWM波形
本实验向大家展示如何输出占空比固定的PWM波形。 1.工程的建立: 2.主函数代码: 3.pwm_output.c代码: 4.output.h代码: 5.结果: 6.结果显示不出来的请看上几节的文章,已解决。
[单片机]
关于STM32能否使用malloc申请动态内存的问题
首先,malloc( )属于标准C语言函数,当然可以在单片机上使用,如STM32可以先在启动文件中设置heap的大小,再使用动态内存分配: Heap_Size EQU 0x00000200 \也就是 512字节; 但是一般单片机的内存都比较小,而且没有MMU,malloc 与free的使用容易造成内存碎片。而且可能因为空间不足而分配失败,从而导致系统崩溃,因此应该慎用,或者自己实现内存管理。 以下摘自网络: 在函数中使用malloc,如果是大的内存分配, 而且malloc与free的次数也不是特别频繁,使用malloc与free是比较合适的, 但是如果内存分配比较小,而且次数特别频繁,那么使用mall
[单片机]
stm32硬件I2C测试例程,亲测可用
对于stm32的硬件I2C确实有不尽人意的地方。但是还是可以实现的,毕竟使用stm32的硬件I2C确实比使用IO口来模拟简单的多。下面的程序代码是使用stm32F03ZET6的I2C1(PB6,PB7)和AT24C02的EEPROM来测试的。希望对于需要的朋友有帮助。 i2c.c #include iic.h #include stm32f10x.h #include usart.h u16 timeout=TIMEOUT; /*i2c的初始化*/ void IIC1_Init() { GPIO_InitTypeDef GPIO_InitStruct; I2C_InitTypeDef I2C_InitStr
[单片机]
STM32 UART串口驱动程序
示例1.通过UART1进行数据发送 UART 1 的初始化 /** * @brief UART1 Initialise. * @param None. * @retval None. */ void UART1_Init(void) { GPIO_InitTypeDef GPIO_InitStructure; USART_InitTypeDef USART_InitStructure; RCC_APB2PeriphClockCmd(RCC_APB2Periph_USART1, ENABLE); //UART1 选择对应UART的RCC时钟 RCC_APB2PeriphClockCmd(RCC_APB2Periph_GP
[单片机]
基于STM32的GPS模块驱动(AIR530)
一、概述 由于做项目要用到GPS定位,于是在某宝购买了这款GPS模块。项目采用的MCU是STM32。废话少说,进入正题。 二、GPS模块简介 Air530 模块是一款高性能、高集成度的多模卫星定位导航模块。体积小、功耗低,可用于车载导 航、智能穿戴、无人机等 GNSS 定位的应用中。而且提供了和其他模块厂商兼容的软、硬件接口,大幅 减少了用户的开发周期。 模块支持GPS/Beidou/GLONASS/Galileo/QZSS/SBAS。采用了射频基带一体化设计,集成了 DC/DC、 LDO、 LNA、射频前端、基带处理、32 位 RISC CPU、RAM、FLASH 存储、RTC 和电源管理等功能。提供 超高的性能,即使在弱信
[单片机]
基于<font color='red'>STM32</font>的GPS模块驱动(AIR530)
意法半导体量产STM32 F0系列入门级MCU
意法半导体(ST)5月15日在北京媒体沟通会上宣布,开始量产基于ARM Cortex-M0处理器内核的入门级STM32 F0系列32位MCU。其适于工业控制器、家庭自动化、打印机和白色家电等应用。   STM32 F0的主要特性包括:①工作频率48MHz时,性能为38DMIPS,独立第三方评测机构的CoreMark评分为68;24MHz时,22DMIPS,CoreMark39。11项外设映射在5通道的DMA,结合总线矩阵,使闪存中执行代码与DMA数据传输同步操作。   ②四个低功耗模式包括5.3μA停止模式,实时时钟运行的2.8μA待机模式,电池供电模式下且实时时钟运行时0.4μA。1.8V/2-3.6V电源电压。功耗效率如图
[模拟电子]
意法半导体量产<font color='red'>STM32</font> F0系列入门级MCU
小广播
设计资源 培训 开发板 精华推荐

最新单片机文章
  • 学习ARM开发(16)
    ARM有很多东西要学习,那么中断,就肯定是需要学习的东西。自从CPU引入中断以来,才真正地进入多任务系统工作,并且大大提高了工作效率。采 ...
  • 学习ARM开发(17)
    因为嵌入式系统里全部要使用中断的,那么我的S3C44B0怎么样中断流程呢?那我就需要了解整个流程了。要深入了解,最好的方法,就是去写程序 ...
  • 学习ARM开发(18)
    上一次已经了解ARM的中断处理过程,并且可以设置中断函数,那么它这样就可以工作了吗?答案是否定的。因为S3C44B0还有好几个寄存器是控制中 ...
  • 嵌入式系统调试仿真工具
    嵌入式硬件系统设计出来后就要进行调试,不管是硬件调试还是软件调试或者程序固化,都需要用到调试仿真工具。 随着处理器新品种、新 ...
  • 最近困扰在心中的一个小疑问终于解惑了~~
    最近在驱动方面一直在概念上不能很好的理解 有时候结合别人写的一点usb的例子能有点感觉,但是因为arm体系里面没有像单片机那样直接讲解引脚 ...
  • 学习ARM开发(1)
  • 学习ARM开发(2)
  • 学习ARM开发(4)
  • 学习ARM开发(6)
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved