STM32裸机和RTOS中的线程安全问题及STM32cubeMX中的线程安全策略

STM32线程安全问题

术语“线程” 和“多线程” 适用于裸机和基于RTOS的应用程序，线程安全问题并不只存在于基于RTOS的应用程序中；裸机应用程序中也存在这个问题，在裸机应用程序中，中断服务程序允许调用C库函数。线程安全问题可能出现在多线程应用程序中，如其中两个线程试图操作共享内存的一个实例，如malloc()或free()。当然一般也不会在中断中进行malloc（动态内存分配）。但是在开发阶段可能会存在有使用C库函数中的printf函数，那么就会有线程安全问题，C库函数可以进行不那么明显的调用(隐式调用)导致类似的问题。例如，printf()可以调用malloc()。

RTOS应用程序:多个任务或ISR。

在这里插入图片描述
在RTOS应用中，并发调用C库函数的情况可能有三个来源：

低优先级中断：
①用于对时间不敏感的操作
②用于RTOS的时基
③用于RTOS的任务切换
高优先级中断：可能在应用程序中有对执行时间敏感的操作
任务切换

裸机应用程序:主循环被ISR中断，那么中断服务程序也被视为第二个执行线程。

在这里插入图片描述

裸机编程的时候通常会勾选Use MicroLIB，通过把printf函数重定向到串口输出的方式打印一些log，当主循环中使用printf时发生中断，在中断中也使用printf可能导致异常。这种异常在RTOS工程中更容易复现。比如使用STM32CubeMX生成FreeRTOS工程，同时创建两个优先级相同的任务，任务每隔1s使用printf函数打印log，使能抢占式调度（configUSE_PREEMPTION）和时间片轮转（configUSE_TIME_SLICING）。

 /* definition and creation of led_task */
 osThreadDef(led_task, led_func, osPriorityNormal, 0, 256);
 led_taskHandle = osThreadCreate(osThread(led_task), NULL);

 /* definition and creation of lcd_task */
 osThreadDef(lcd_task, lcd_func, osPriorityNormal, 0, 256);
 lcd_taskHandle = osThreadCreate(osThread(lcd_task), NULL);
  
void led_func(void const * argument)
{
 	const TickType_t xDelay = 1000 / portTICK_PERIOD_MS;
 	for(;;)
 	{
		LED_R_TOGGLE();
		printf("led_func running\r\n");
		vTaskDelay(xDelay);
  }
}

void lcd_func(void const * argument)
{
 	const TickType_t xDelay = 1000 / portTICK_PERIOD_MS;
 	for(;;)
 	{
		LED_R_TOGGLE();
		printf("lcd_func running\r\n");
		vTaskDelay(xDelay);
  }
}

理想情况下的输出应该是两个灯每隔1s翻转状态，两个任务每隔一秒输出一次，实际情况是两个灯每隔1s翻转状态，但是串口输出异常，串口输出如下：
在这里插入图片描述
可见，printf不是线程安全函数，在printf前后使用taskENTER_CRITICAL()和taskEXIT_CRITICAL()函数进行临界段代码保护，输出结果就正常。

FreeRTOS任务级临界段代码保护

#define taskENTER_CRITICAL()	             	portENTER_CRITICAL()
#define portENTER_CRITICAL()					vPortEnterCritical()

#define taskEXIT_CRITICAL()		            	portEXIT_CRITICAL()
#define portEXIT_CRITICAL()						vPortExitCritical()

taskENTER_CRITICAL()和taskEXIT_CRITICAL()函数为任务级进入临界段代码，在进入函数 vPortEnterCritical()以后会首先关闭中断，然后给变量 uxCriticalNesting加一， uxCriticalNesting 是个全局变量，用来记录临界段嵌套次数的。函数 vPortExitCritical()是退出临界段调用的，函数每次将 uxCriticalNesting 减一，只有当 uxCriticalNesting 为 0 的时候才会调用函数 portENABLE_INTERRUPTS()使能中断。这样保证了在有多个临界段代码的时候不会因为某一个临界段代码的退出而打乱其他临界段的保护，只有所有的临界段代码都退出以后才会使能中断。最终调用的函数如下：

void vPortEnterCritical( void )
{
	portDISABLE_INTERRUPTS();
	uxCriticalNesting++;
	if( uxCriticalNesting == 1 )
	{
		configASSERT( ( portNVIC_INT_CTRL_REG & portVECTACTIVE_MASK ) == 0 );
	}
}

void vPortExitCritical( void )
{
	configASSERT( uxCriticalNesting );
	uxCriticalNesting--;
	if( uxCriticalNesting == 0 )
	{
		portENABLE_INTERRUPTS();
	}
}

其中，portDISABLE_INTERRUPTS和portENABLE_INTERRUPTS定义如下：

#define portDISABLE_INTERRUPTS()				vPortRaiseBASEPRI()
#define portENABLE_INTERRUPTS()					vPortSetBASEPRI( 0 )

static portFORCE_INLINE uint32_t ulPortRaiseBASEPRI( void )
{
uint32_t ulReturn, ulNewBASEPRI = configMAX_SYSCALL_INTERRUPT_PRIORITY;

	__asm
	{
		/* Set BASEPRI to the max syscall priority to effect a critical
		section. */
		mrs ulReturn, basepri
		msr basepri, ulNewBASEPRI
		dsb
		isb
	}

	return ulReturn;
}

static portFORCE_INLINE void vPortSetBASEPRI( uint32_t ulBASEPRI )
{
	__asm
	{
		/* Barrier instructions are not used as this function is only used to
		lower the BASEPRI value. */
		msr basepri, ulBASEPRI
	}
}

假设stm32中断优先级分组设置为4，那就是4位抢占优先级，没有子优先级，即0-15，因此宏configLIBRARY_LOWEST_INTERRUPT_PRIORITY定义了最低优先级为15，configLIBRARY_MAX_SYSCALL_INTERRUPT_PRIORITY定义为5，也就是优先级高于5（数值小于5）的中断不归FreeRTOS管理。

vPortRaiseBASEPRI函数的作用是屏蔽所有低于configMAX_SYSCALL_INTERRUPT_PRIORITY（数值大于configLIBRARY_MAX_SYSCALL_INTERRUPT_PRIORITY）宏的中断。

#define configPRIO_BITS         4
#define configLIBRARY_LOWEST_INTERRUPT_PRIORITY   15
#define configLIBRARY_MAX_SYSCALL_INTERRUPT_PRIORITY 5
#define configMAX_SYSCALL_INTERRUPT_PRIORITY 	( configLIBRARY_MAX_SYSCALL_INTERRUPT_PRIORITY << (8 - configPRIO_BITS) )

FreeRTOS中断级临界段代码保护

#define taskENTER_CRITICAL_FROM_ISR() portSET_INTERRUPT_MASK_FROM_ISR()
#define portSET_INTERRUPT_MASK_FROM_ISR()		ulPortRaiseBASEPRI()

#define taskEXIT_CRITICAL_FROM_ISR( x ) portCLEAR_INTERRUPT_MASK_FROM_ISR( x )
#define portCLEAR_INTERRUPT_MASK_FROM_ISR(x)	vPortSetBASEPRI(x)

taskENTER_CRITICAL_FROM_ISR()和taskEXIT_CRITICAL_FROM_ISR( x )函数为中断级进入临界段代码，可以看到是没有嵌套处理，直接操作BASEPRI寄存器实现。

STM32cubeMX中的线程安全策略

使用STM32cubeMX生成工程时，可选的线程安全策略有五种：
在这里插入图片描述

如果选择Default，裸机应用会自动选择策略2，RTOS应用会自动选择策略4。

对于单核项目，策略1会额外生成stm32_lock.h、 armlib_lock_glue.c和stm32 _lock_user.h三个文件；策略2/3/4/5会额外生成stm32_lock.h、 armlib_lock_glue.c两个文件；对于多核项目，每个核引用相同的文件(stm32_lock.h和armlib_lock_glue.c)，每个核使用一个单独的文件(stm32_lock_user.h)。

策略1为处理线程安全的自定义解决方案，这时候需要自己实现临界区锁。
策略2适用于裸机系统，策略2允许从中断使用锁。这个实现通过禁用所有中断来确保线程安全，例如，调用malloc()期间。如果ISR调用malloc()，它会获取一个锁，完成执行，然后释放锁。就从ISR重新进入而言，应用程序是安全的，并且共享数据不会损坏。然而，这种策略的副作用是中断被延迟。
策略3适用于裸机系统，策略3拒绝使用中断锁，实现假设单线程执行，并拒绝任何从ISR上下文中获取锁的尝试，不会延迟中断。但是使用这种策略，不可能从ISR上下文中获得锁。因此，当C库函数试图从ISR上下文中获取锁时，该尝试将被拒绝， CPU将卡在Error_Handler()中。下图左边：main()调用malloc()。malloc()执行被中断，但ISR不调用malloc()；因此，不会尝试从ISR上下文中获取锁。没有数据损坏，因为malloc()可以在从ISR上下文返回后完成临界区。下图右边：main()调用malloc()。 malloc()执行被中断，ISR调用malloc()；会尝试从ISR上下文中获取锁，那么应用程序挂起在Error_Handler()中。这样做的目的是向开发人员发出一个明确的信号，即C库不能以这种方式使用。通过让开发人员意识到在ISR上下文中使用C库函数的危险。
策略4适用于RTOS应用，策略4使用FreeRTOS锁实现。这个实现通过在调用malloc()期间进入RTOS ISR临界区来确保线程安全。这意味着线程安全是通过禁用低优先级中断和任务切换来实现的。通过宏taskENTER_CRITICAL_FROM_ISR在调用malloc()期间进入具有RTOS ISR能力的临界区来确保线程安全。 taskENTER_CRITICAL_FROM_ISR宏的实现略有不同，具体取决于项目所针对的Cortex‑M核心。当获得锁时，malloc()进入临界区，因此低优先级中断和任务切换被禁用。这个实现，默认情况下，支持两级嵌套锁定。嵌套级别的数量可通过STM32_LOCK_MAX_NESTED_LEVELS宏配置。每增加一个嵌套等级，额外增加4字节的RAM开销。

typedef struct
{
  uint32_t basepri[STM32_LOCK_MAX_NESTED_LEVELS];
  uint8_t nesting_level;
} LockingData_t;

在这里插入图片描述
然而，策略4高优先级中断也是不安全的（数值小于configMAX_SYSCALL_INTERRUPT_PRIORITY宏的中断）。高优先级中断仍然可能发生，代价是不安全的并发C库函数调用。

策略5适用于RTOS应用，策略5拒绝使用中断锁，该实现通过暂停所有任务来确保线程安全，例如，在调用malloc()期间。通过在malloc()调用期间暂停所有任务来确保线程安全，但使中断处于启用状态。当由malloc()获得锁时，在锁被释放之前，任务切换不会发生。然而，中断是允许切换执行的。如果试图从ISR上下文中获取锁，则应用程序将被Error_Handler()捕获并挂起。因此，使开发人员意识到C库函数的危险使用，那么应用程序在ISR上下文中也被认为是安全的。