您的位置:首页 > 其它

服务器设计系列:线程

2016-07-29 00:00 309 查看
废话不多说,详细介绍使用线程的优点好处请参考baidu、google。

一、线程使用场景

使用线程的方式大致有两种:

(1)流水线方式。根据业务特点,将一个流程的处理分割成多个线程,形成流水线的处理方式。产生的结果:延长单一流程的处理时间,提高系统整体的吞吐能力。

(2)线程池方式。针对处理时间比较长且没有内蕴状态的线程,使用线程池方式分流消息,加快对线程消息的处理,避免其成为系统瓶颈。

线程使用的关键是线程消息队列、线程锁、智能指针的使用。其中以线程消息队列最为重要。所谓线程消息队列,就是一个普通的循环队列(其它数据结构也未尝不可)加上多生产者-单(多)消费者的PV操作。流水线方式中的线程是单消费者,线程池方式中的线程是多消费者。

假定循环队列CircleQueue中,存放的消息指针类型是MyMSG *,入队操作EnQueue,出队操作DeQueue,判断队满IsQueueFull,判断队空IsQueueEmpty。生产者和消费者的流程通常是这样的:生产者线程生产消息(MyMSG *),放在一个空缓冲区中(CircleQueue),供消费者线程消费,生产者生产消息(EnQueue),如果缓冲区满(IsQueueFull),则被阻塞,消费者消费消息(DeQueue),如果缓冲区空(IsQueueEmpty),则被阻塞。线程消息队列就是生产者消费者问题中的缓冲区,而它的生产者是不限定的,任何线程都可以作为生产者向其中进行EnQueue操作,消费线程则可能是一个,也可能是多个。因此对循环队列的任何操作都要加锁,以保证线程安全。

二、Linux内核的线程库

2.6内核的默认安装的是redhat公司的NPTL(原生posix线程库),以前内核安装的是LinuxThreads库,两者的简单介绍可以看http://www.ibm.com/developerworks/cn/linux/l-threading.html。不过对于应用者,分析两者的区别和优劣也没什么大意义。这里特别提下NPTL的futex机制。借助该机制,pthread_mutex的性能大大提高,只要不进入竞争态,进程就不会陷入内核态。这点可以自己写示例程序,通过strace -c 跟踪进程的系统调用得以证实,另外还可以证实总是进入内核态的操作有pthread_cond_signal和sem_post。

线程的相关操作包括以下几种:

(1)线程类型pthread_t的创建、属性创建设置等。包括pthread_creat; pthread_attr_init; pthread_detach; pthread_join等,用法查看man。
(2)线程锁类型pthread_mutex_t的操作。包括pthread_mutex_init,查看man可看到所有相关的操作。
(3)条件变量类型pthread_cond_t的操作。包括pthread_cond_init。pthread_cond_t的wait和signal操作一定要和pthread_mutex_t的lock、unlock配合使用。类似于此:

pthread_mutex_t mux=PTHREAD_MUTEX_INITIALIZER;
pthread_cond_t cond=PTHREAD_COND_INITIALIZER;

//wait操作:
pthread_mutex_lock(&mux);
pthread_cond_wait(&cond,&mux);//睡眠前将内部会执行pthread_mutex_unlock,醒来时内部会执行pthread_mutex_lock
pthread_mutex_unlock(&mux);

//signal操作
pthread_mutex_lock(&mux);
pthread_cond_signal(&cond);
pthread_mutex_unlock(&mux);
(4)信号号类型sem_t的操作。PV操作和锁机制的基础都是信号量。下面列出posix标准中给出的有关信号量的操作:

#include <semaphore.h>
int sem_init(sem_t *sem, int pshared, unsigned int value);
int sem_wait(sem_t * sem);
int sem_trywait(sem_t * sem);
int sem_post(sem_t * sem);
int sem_getvalue(sem_t * sem, int * sval);
int sem_destroy(sem_t * sem);
各个函数的详细用法,请在linux/unix上查看man。信号量通常用的不多,它比较重量级,但功能也最强大。

三、线程消息队列实现
通过将线程和线程消息队列封装在一起,可形成带有消息队列的线程。其它线程向该线程的消息队列插入消息,本线程取消息处理,之后再向其它线程的消息队列插入消息,如此形成流水线运行方式。下面设计一个简单的具有线程消息队列的线程封装类。通过上面的分析,我们可以有如下结论:
* 减少pthread_cond_signal和sem_post的调用,只在有必要的时候调用;
* 尽量避免pthread_mutex进入竞争态。增大消息队列的大小,可以有效减少竞态条件的出现。

代码如下,实现时使用了线程锁:

class CThreadQueue
{
private:
pthread_mutex_t mux;
pthread_cond_t condGet;
pthread_cond_t condPut;

void **buffer;    //循环消息队列
int sizeQueue;      //队列大小
int lput;           //location put 放数据的指针偏移
int lget;           //location get 取数据的指针偏移
int nFullThread;    //队列满,阻塞在putq处的线程数
int nEmptyThread;   //队列空,阻塞在getq处的线程数
int nData;          //队列中的消息个数,主要用来判断队列空还是满
public:
CThreadQueue(int queueSize=1024):
sizeQueue(queueSize),lput(0),lget(0),nFullThread(0),nEmptyThread(0),nData(0)
{
pthread_mutex_init(&mux,0);
pthread_cond_init(&condGet,0);
pthread_cond_init(&condPut,0);
buffer=new (void *)[sizeQueue];
}
virtual ~CThreadQueue()
{
delete[] buffer;
}
void * getq()  //出队操作
{
void *data;
pthread_mutex_lock(&mux); //加锁
//此处循环判断的原因如下:假设2个线程在getq阻塞,然后两者都被激活,而其中一个线程运行比较块,快速消耗了2个数据,
//另一个线程醒来的时候已经没有新数据可以消耗了。注意pthread_cond_wait是信号安全的系统调用,不会被信号中断。
while(lget==lput && nData==0)
{
nEmptyThread++;
pthread_cond_wait(&condGet,&mux);
nEmptyThread--;
}

data=buffer[lget++];
nData--;
if(lget==sizeQueue)
{
lget=0;
}
if(nFullThread) //必要时才进行signal操作,勿总是signal
{
pthread_cond_signal(&condPut);
}
pthread_mutex_unlock(&mux); //解锁
return data;
}
void putq(void *data)  //入队操作
{
pthread_mutex_lock(&mux);
while(lput==lget && nData)
{
nFullThread++;
pthread_cond_wait(&condPut,&mux);
nFullThread--;
}
buffer[lput++]=data;
nData++;
if(lput==sizeQueue)
{
lput=0;
}
if(nEmptyThread)
{
pthread_cond_signal(&condGet);
}
pthread_mutex_unlock(&mux);
}
};
一般系统设计中应该尽量减少锁的使用。但有的时候无法避免,这时就是mutex登场的时候了。mutex的实现,Linux下有pthread_mutex_t,ACE里有ACE_Thread_Mutex,boost里有boost::mutex。为了高效的操作可以进一步实现出其它不同的锁机制,比如常见的读写锁,条件锁,在Linux/ACE/boost中这些锁均有实现。lock和unlock要成对使用,但是很多情况下,一个函数有很多出口,再加上异常的情况,需要针对一个lock写很多unlock,这样不仅容易遗漏unlock,而且代码也变得很丑陋。ACE中提供了Guard封装mutex,使用起来比较方便,使用的时候不需要关心锁的释放,具体请看ACE。

在使用线程消息队列时,线程的创建可以使用posix的pthread_create函数,或者boost的boost::thread。具体使用请查看相关文档。另ACE中的ACE_Task实现了带有消息队列的线程,可以直接使用。下面给出这个线程消息队列的一个使用举例:

#include <pthread.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
CThreadQueue queue;//使用的时候给出稍大的CThreadQueue初始化参数,可以减少进入内核态的操作
void * produce(void * arg)
{
int i=0;
pthread_detach(pthread_self());
while(i++<100)
{
queue.putq((void *)i);
}
}
void *consume(void *arg)
{
int data;
while(1)
{
data=(int)(queue.getq());
printf("data=%d\n",data)
}
}
int main()
{    pthread_t pid;
int i=0;

while(i++<3)
pthread_create(&pid,0,produce,0);
i=0;
while(i++<3)
pthread_create(&pid,0,consume,0);
sleep(300);
}

四、使用智能指针的需求

在线程池方式中,为了去掉内蕴状态,线程间不得不传递对象指针,这样很难判断指针的生命周期,难以找到释放内存空间的合适位置。智能指针完美解决了这个问题。boost中有boost::shared_ptr,ACE中有ACE_Refcounted_Auto_Ptr。我们主要讲述线程相关,智能指针就不再展开了。
五、线程间消息传递框架
(1)面向过程的消息传递。
C语言常用方式。消息以结构体的形式定义。

enum MsgType
{
CONCRETE_MSG1=1,
CONCRETE_MSG2=2
};
struct MyMsg
{
MsgType type;
union union_st
{
concreteMsg1 *msg1;
concreteMsg2 *msg2;
}msg;
};
concreteMsg1和concreteMsg2的详细结构不再列出。消息发送线程构建正确的具体消息,指明正确的消息类型,进一步构建正确的MyMsg,发送到线程消息队列。消息处理线程在消息队列头端循环getq,取出消息,根据消息类型调用相应的方法处理。

(2)面向对象的消息传递。线程消息队列中存储command模式中ICommand类型的指针。消息发送线程实例化具体的command,消息处理线程取出command执行command的execute方法。
缺点是command比较多的时候,会生成大量的类文件,代码不够紧凑。优点则是可以方便的增加command而不需要过多改动已有代码。

参考文献:

【原创】技术系列之 线程(二):http://www.cppblog.com/CppExplore/archive/2008/03/20/44949.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: