一、数据结构
用户进程创建后可以访问整个用户空间的虚拟地址,这段空间是未分段的线性地址范围,在内核中进程地址空间以及与之相关的所有信息都保存在 mm_struct 中,该结构出现在进程控制结构 task_struct 中。进程用到的每段连续有效地址范围称为内存区,一个内存区由 vm_area_struct 描述符表示,每个内存区描述符都描述它所表示的一段连续地址区间。不同的内存区有不同的保护方案和特点,比如程序代码段的某些部分标记为只读,而其他部分标记为可写或可执行。
1、mm_struct
[cpp]
struct mm_struct {
struct vm_area_struct * mmap; /* list of VMAs */
struct rb_root mm_rb;
struct vm_area_struct * mmap_cache; /* last find_vma result */
...
pgd_t * pgd;
atomic_t mm_users; /* How many users with user space */
atomic_t mm_count; /* How many references to "struct mm_struct" (users count as 1) */
int map_count; /* number of VMAs */
struct rw_semaphore mmap_sem;
spinlock_t page_table_lock; /* Protects page tables and some counters */
struct list_head mmlist; /* List of maybe swapped mm's. These are globally strung
* together off init_mm.mmlist, and are protected
* by mmlist_lock
*/
...
unsigned long total_vm, locked_vm, shared_vm, exec_vm;
unsigned long stack_vm, reserved_vm, def_flags, nr_ptes;
unsigned long start_code, end_code, start_data, end_data; // 进程在内存中代码段、数据段的起始和结束地址
unsigned long start_brk, brk, start_stack; // 进程堆的起始和结束地址、栈的起始地址
unsigned long arg_start, arg_end, env_start, env_end; // 参数、环境段的起始和结束地址
...
};
其中 mmap 参数表示进程的所有内存区描述符组成链表的头节点地址,mm_struct 通过 mmap访问该链表,而 vm_area_struct 中的 vm_next 指针将各个内存区链接起来;mmap_cache 指向进程最后一次访问的内存区描述符指针,用于提高访问效率;mm_users 存放访问该进程地址空间的进程数量;mm_count 是对 mm_struct 的使用统计,其值为0时说明没有进程使用则将其回收;map_count 存在在进程地址空间中的内存区数量,即 vm_area_struct 描述符数量。
2、vm_area_struct
struct vm_area_struct {
struct mm_struct * vm_mm; /* The address space we belong to. */
unsigned long vm_start; /* Our start address within vm_mm. */
unsigned long vm_end; /* The first byte after our end address
within vm_mm. */
/* linked list of VM areas per task, sorted by address */
struct vm_area_struct *vm_next;
pgprot_t vm_page_prot; /* Access permissions of this VMA. */
unsigned long vm_flags; /* Flags, see mm.h. */
struct rb_node vm_rb;
...
/* Function pointers to deal with this struct. */
const struct vm_operations_struct *vm_ops;
...
};
其中 vm_mm 指向该内存区所属的进程地址空间;vm_start 和 vm_end 表示该虚拟内存区的起始和结束地址,考虑到性能问题,内存区的起始地址必须是页面大小的整数倍;vm_next 指向该进程的下一个虚拟内存区;vm_ops 用于操作特定的虚拟内存区,包括打开、关闭、反映射内存区等操作。
二、 编程接口
在用户空间动态申请内存的函数为 malloc,释放函数为 free。内核空间申请内存涉及的函数主要包括 kmalloc、__get_free_pages 和 vmalloc 等。kmalloc 和 __get_free_pages 申请的内存位于物理内存映射区域,而且在物理也是连续的,它们与真实的物理地址只有一个固定的偏移,因此存在较简单的转换关系。而 vmalloc 在虚拟内存空间给出一块连续的内存区,实质上,这片连续的虚拟内存在物理内存中并不一定连续,其申请的虚拟内存和物理内存之间也没有简单的换算关系。
1、kmalloc
[cpp]
/**
* kmalloc - 分配一块指定大小的内存
* @size: 内存区的大小
* @flags: 分配标志,可能值有 GFP_ATOMIC、GFP_KERNEL 等
*
* Note: 当标志为 GFP_KERN