设为首页 加入收藏

TOP

多线程统计多个文件的单词数目
2014-11-22 10:00:26 】 浏览:7764
Tags:线程 统计 多个 文件 单词 数目

  1.C++0X 多线程简介


  C++0x STL提供了对多线程的支持就不用再去选择跨平台的多线程库了,用标准的吧:)


  看了一下BOOST和当前STL的接口几乎完全一致:)也就是说用boost thread写的程序应该把例如boost::thread, boost::unique_lock ...等等的地方换成std::thread, std::unique_lock...就OK了,个人觉得,不过我还没用过boost thread.所以说熟悉pthread的应该能很快上手,而熟悉boost thread应就可以直接上手了~


  但是现在GCC还不支持thread local变量。不支持原子操作。基本的mutex,condional 变量等等都支持了。


  关于C++0X thread的入门介绍请参考:


  Simpler Multithreading in C++0x


  http://www.devx.com/SpecialReports/Article/38883/0/page/1


  该文有中文的翻译


  C++0x 概览: 多线程(1) - VC++ - 逆风者


  www.upwinder.com/www/c1/2999.html


  Multithreading in C++0x


  http://www.justsoftwaresolutions.co.uk/threading/multithreading-in-c++0x-part-1-starting-threads.html


  [译]放弃原来的线程API,采用新的C++线程


  www.cppprog.com/2009/0102/30.html


  另外使用C++0X的话大家最好了解一下所谓的右值引用和move语义,个人觉得这两个概念很有用处的,算是突破性的概念了,当然不清楚也可以用thread.参考刘未鹏写的,《C++0x漫谈》系列之:右值引用(或“move语意与完美转发”)(上),既可


  http://blog.csdn.net/pongba/archive/2007/07/10/1684519.aspx


  或者看A Brief Introduction to Rvalue References http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2006/n2027.html


  2. 如何编译运行


  我只在linux下用GCC4.4.2试过。能够调试成功。


  首先你要确保你的GCC编译时是thread enable的一般默认安装就是enable的了。可以用gcc -v查看一下:


  allen:~/study/unix_system/CH14$ gcc -v


  使用内建 specs。


  目标:i686-pc-linux-gnu


  配置为:../configure


  线程模型:posix


  gcc 版本 4.4.2 (GCC)


  如上显示线程模型posix,表示就是可以用多线程了否则显示为空。注意本质上还是posix多线程所以你要加编译参数-pthread


  同时标明使用 c++0x特性, -std=c++0x 或者-std=gnu0x


  例如:


  g++ -g -o wordcount wordcount.cc -std=c++0x -pthread


  3.一个完整的小程序示例,多线程文本单词数目统计


  首先说一下程序目的,多个线程每个统计一个文本的单词数目,作为实验程序,这里演示3个线程统计的例子。这个例子会涉及到线程的同步,因为要每个线程统计完之后向主线程报告自己已经完成统计并且将信息写到互斥区的mail_box中。而主线程会将信息从mail_box中读出,然后通知下一个线程可以写mail_box.就是说当3个统计单词的线程看为写者,主线程看为读者,一个时间只能有一个线程访问mail_box读或者写。


  这个问题来源是《unix 编程实践教程》p14.5.2使用条件变量编写程序 一节的例子 twocount4.c的例子改写的,原文中使用pthread, 但是它是有问题的,因为书中的例子是2个线程负责统计,如果扩充到3个会死锁,主要由于书中的例子只用了一个条件变量,并没有区分读者通知和写者通知。我以前写过一篇文章分析这个情况多线程同步问题 条件变量和信号量 http://www.cnblogs.com/rocketfan/archive/2009/07/24/1530477.html


  当时我对条件变量理解的还不是很清楚,所以用信号量写了一个正确的版本。其实mutex+条件变量可以解决一切用信号量能解决的问题。不过我还是不是很清楚为什么c++0x STL不提供信号量,boost thread也不提供而是存在在boost interprocess库中,好像大家用多线程也基本不用信号量,为什么呢,谁比较清楚给我详细解释下,谢谢。确实条件变量更强大,但我始终觉得用信号量还是更清晰一些的,操作系统课本也基本都用信号量举例。比如操作系统内核设与设计原理一书。例如这个问题用信号量可以表示如下,当然用条件变量类似:


  write = 0


  read = 0


  mail = null


  //server main thread


  v(read) //to let one client sub thread can write at first since mail == null


  for (i =0 ; i < sub threads num; i++)


  p(write)


  read mail


  mail = null


  v(read)


  //clinent sub threads


  p(read)


  write mail


  v(write)


  用C++0X,mutex + conditional variable 的实现,如下, 有很详细的注释的,如有问题还请指正:


  代码


  /**


  *


  *


  * \file wordcount.cc


  *


  * \author chenghuige@gmail.com


  *


  * \date 2009-12-02 09:55:25.197674


  *


  * Description: 演示c++0x,线程建立结束,mutex,条件变量的使用,注意为了简单名字未加


  * std::


  *


  */


】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇VisualC++调试时查看数组内容 下一篇C++标准编程:虚函数与内联

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目