设为首页 加入收藏

TOP

Linux 线程库性能测试与分析(一)
2011-03-21 13:23:03 】 浏览:2636
Tags:Linux 线程 性能 测试 分析

一、 前言

在 Linux 2.6.x 内核中,调度性能的改进是其中最引人注目的一部分[1]。NPTL(Native Posix Thread Library)[2]使用内核的新特性重写了 Linux 的线程库,取代历史悠久而备受争议的 LinuxThreads[3] 成为 glibc 的首选线程库。

NPTL 的性能究竟如何?相对 LinuxThreads 又有哪些明显的改进?在对NPTL进行全面分析之前,本文针对这两种线程库,以及内核中"内核可抢占"(Preemptible)和超线程(HyperThreading)[4]等特性进行了全面的性能评测,结果表明NPTL绝对值得广大服务器系统期待和使用。

 


二、 Benchmark

1. 测试平台

进行本测试的硬件平台为浪潮NF420R服务器[7],4个Hyperthreading-enabled Intel Xeon 2.2G处理器,4G内存。Linux选择了Slackware 9.0发行版[8],所使用的内核源码来自 www.kernel.org

2. 针对测试:LMBench

lmbench是一个用于评价系统综合性能的多平台开源benchmark[5],但其中没有对线程的支持。其中有两个测试进程性能的benchmark:lat_proc用于评测进程创建和终止的性能,lat_ctx用于评测进程切换的开销。lmbench拥有良好的benchmark结构,只需要修改具体的Target程序(如lat_proc.c和lat_ctx.c),就可以借用lmbench的计时、统计系统得到我们关心的线程库性能的数据。

基于lat_proc和lat_ctx的算法,本文实现了lat_thread和lat_thread_ctx两个benchmark。在lat_thread中,lat_proc被改造成使用线程,用pthread_create()替代了fork(),用pthread_join()替代wait();在lat_thread_ctx中,沿用lat_ctx的评测算法(见lat_ctx手册页),将创建进程的过程改写为创建线程,仍然使用管道进行通信和同步。

lat_thread null

null参数表示线程不进行任何实际操作,创建后即刻返回。

lat_thread_ctx -s #threads

size参数与lat_ctx定义相同,可表示线程的大小(实际编程(www.cppentry.com)时为分配K数据;#threads参数为线程数,即参与令牌传递的线程总数,相当于程序负载情况。

3. 综合测试:Volanomark

volanomark是一个纯java的benchmark,专门用于测试系统调度器和线程环境的综合性能[6],它建立一个模拟Client/Server方式的Java聊天室,通过获取每秒平均发送的消息数来评测宿主机综合性能(数值越大性能越好)。Volanomark测试与Java虚拟机平台相关,本文使用Sun Java SDK 1.4.2作为测试用Java平台,Volanomark版本2.5.0.9。

 


三、 测试结果

测试计划中将内核分为2.4.26、2.6.6/支持内核抢占和2.6.6/不支持内核抢占三类;通过配置内核以及NF420R的BIOS实现三类SMP规模:单处理机(UP)、4CPU的SMP(SMP4)和打开超线程支持的虚拟8CPU SMP(SMP8*)。内核配置和SMP规模的每一种组合都针对LinuxThreads和NPTL使用lat_thread、lat_thread_ctx和volanomark获取一组数据。由于NPTL无法在2.4.x内核上使用,该项数据空缺。


图 1 
 


四、 结果分析

1. LinuxThreads vs NPTL:线程创建/销毁开销

使用2.6.6/preemptible内核配置下UP和SMP4的测试数据获得下图:


图1
图1 

在线程创建/销毁开销方面,NPTL的改进相当明显(降低约600%)。实际上,NPTL不再像LinuxThreads那样需要使用用户级的管理线程来维护线程的创建和销毁[9],因此,很容易理解它在这方面的开销能够大幅度降低。

同时,由图可见,单CPU下创建线程总是比多CPU下迅速。

2. LinuxThreads vs NPTL:线程切换开销

同样使用2.6.6/preemptible内核配置下UP和SMP4的数据:


图2
图2 

随着lat_thread_ctx的参与线程增多,不管是哪个线程库,单处理机条件下的线程切换开销都陡峭上升,而SMP条件下则上升比较平缓。在这方面,LinuxThreads和NPTL表现基本相同。

3. 内核影响


图3
图3 

图4
图4 

图5
图5 

图6
图6 

从上面四张图中我们可以得出两点结论:

  • "内核可抢占"是Linux对实时应用提供更好支持的有力保障,但对线程性能影响很小
首页 上一页 1 2 下一页 尾页 1/2/2
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇云计算基础 下一篇在 POSIX 线程编程中避免内存泄漏

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目