per-CPU变量 - 其它 - 程序员开发

TOP

per-CPU变量(一)

2019-09-01 23:08:47 【大中小】浏览:48次

为什么需要per-CPU变量

假设系统中有4个cpu，同时有一个变量在各个CPU之间是共享的，每个cpu都有访问该变量的权限。

当cpu1在改变变量v的值的时候，cpu2也需要改变变量v的值。这时候就会导致变量v的值不正确。这时候机智的你就会说，在cpu1访问变量v的时候可以使用原子操作加锁，cpu2访问变量v的时候需要等待。可是机智的是否考虑过加锁对性能的影响，原子操作对cpu是极耗cpu的。

再考虑一种情况，现在高速的cpu都带有高速缓冲cache。它介于cpu和主存之间，主要作用是加快cpu的访问速度。因为主存的访问速度相比cpu读写比较慢，在之间引入cache之后，当CPU调用大量数据时，就可避开内存直接从缓存中调用，从而加快读取速度。

比如cpu1对变量v操作子后，变量v的值就发生了变化。而cpu2, cpu3, cpu4的cache中的值还是以前的值，所以这时候就需要将cpu2, cpu3, cpu4的cache中的值变为无效的，当cpu2读取变量v的时候就需要从内存中读取v。所以当某一个cpu对共享数据v做操作后，比较对其余的cache做无效操作，这也是对性能有所损耗的。

所以，就引入了per-cpu变量。

什么是per-CPU变量

per-CPU变量是linux系统一个非常有趣的特性，它为系统中的每个处理器都分配了该变量的副本。这样做的好处是，在多处理器系统中，当处理器操作属于它的变量副本时，不需要考虑与其他处理器的竞争的问题，同时该副本还可以充分利用处理器本地的硬件缓冲cache来提供访问速度。

per-CPU按照存储变量的空间来源分为静态per-CPU变量和动态per-CPU变量，前者的存储空间是在代码编译时静态分配的，而后者的存储空间则是在代码的执行期间动态分配的。

静态per-CPU变量声明和定义

声明DECLARE_PER_CPU宏：

<include/linux/percpu-defs.h>
----------------------------------------------------------------
#define DECLARE_PER_CPU(type, name)                 \
    DECLARE_PER_CPU_SECTION(type, name, "")

#define DECLARE_PER_CPU_SECTION(type, name, sec)            \
    extern __PCPU_ATTRS(sec) __typeof__(type) name

#define __PCPU_ATTRS(sec)                       \
    __percpu __attribute__((section(PER_CPU_BASE_SECTION sec))) \
    PER_CPU_ATTRIBUTES

<include/asm-generic/percpu.h>
-----------------------------------------------------
#ifndef PER_CPU_BASE_SECTION
#ifdef CONFIG_SMP
#define PER_CPU_BASE_SECTION ".data..percpu"
#else
#define PER_CPU_BASE_SECTION ".data"
#endif
#endif

对上的宏定义DECLARE_PER_CPU使用例子： DECLARE_PER_CPU(int, val)来详细说明。

DECLARE_PER_CPUT(int, val)
 -> DECLARE_PER_CPU_SECTION(int, val, "")
    -> extern __PCPU_ATTRS("") __typeof__(int) val
       -> extern __percpu __attribute__((section(".data..percpu"))) int val

从上面的分析可以看出，该宏在源代码中声明了__percpu int val变量，该变量放在一个名为”.data..percpu”的section中。

定义DEFINE_PER_CPU宏：

<include/linux/percpu-defs.h>
----------------------------------------------------------------
#define DEFINE_PER_CPU(type, name)                  \
    DEFINE_PER_CPU_SECTION(type, name, "")

#define DEFINE_PER_CPU_SECTION(type, name, sec)             \
    __PCPU_ATTRS(sec) PER_CPU_DEF_ATTRIBUTES            \
    __typeof__(type) name

#ifndef PER_CPU_DEF_ATTRIBUTES
#define PER_CPU_DEF_ATTRIBUTES
#endif

声明和定义	解释
DECALRE_PER_CPU(type, name)/DEFINE_PER_CPU(type, name)	普通的per-CPU声明和定义
DECLARE_PER_CPU_FIRST(type, name)/DEFINE_PER_CPU_FIRST(type, name)	该per-CPU变量会在整个serction的最前面，所谓的first
DECLARE_PER_CPU_SHARED_ALIGNED(type, name)/DEFINE_PER_CPU_SHARED_ALIGNED(type, name)	该per-CPU在SMP系统下会对齐到cache line,在UP系统下不需要对齐
DECLARE_PER_CPU_ALIGNED(type, name)/DEFINE_PER_CPU_ALIGNED(type, name)	在SMP和UP系统都对齐到cache line
DECLARE_PER_CPU_PAGE_ALIGNED(type, name)/DEFINE_PER_CPU_PAGE_ALIGNED(type, name)	该per-CPU变量必须页对齐
DECLARE_PER_CPU_READ_MOSTLY(type, name)/DEFINE_PER_CPU_READ_MOSTLY(type, name)	该per-CPU变量必须是read mostly

静态per-CPU变量的链接脚本

在上一节per-CPU变量的声明和定义中，可以看到最后的变量都是存在一个”.data..percpu”段中。

. = ALIGN((1 << 12)); 
.data..percpu : AT(ADDR(.data..percpu) - 0) 
{
    __per_cpu_load = .;
    __per_cpu_start = .;
     *(.data..percpu..first) . = ALIGN((1 << 12));
     *(.data..percpu..pag

首页上一页 1 2 下一页尾页 1/2/2
【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇：第一篇深入嵌入式之Linux裸机	下一篇：Zephyr学习（四）系统时钟