您的位置：首页 > 运维架构 > Linux

Linux驱动编程 step-by-step （七）

2011-11-23 13:43 633 查看

分类：
C/C++ Linux
2011-11-17 00:24
2589人阅读评论(4)
收藏
举报

并发竞态 (信号量与自旋锁)

代码传至并发竞态控制

并发进程导致竞态的一个例子

前面所述的字符驱动都是没有考虑并发竟态的情况，想象一下

一个进程去读一个字符设备，另一个进程在同一时间向这个设备写入（完全有这种情况）

原来设备中存有 A B C D 要想设备写入1 2 3 4 每次读写一个字节

t1	t2	t3	t4	t5	t6	t7	t8
R	W	W	R	W	R	R	W
A	1	2	2	3	3	D	4

R: read

W:write

所以最后读出了A23D不是原来的ABCD

而如果两个进程同时写入一个设备则写入的值可能既不是A进程想要的又不是B进程想要的。

并发与竞态

并发是指多个进程同时访问相同一段代码（不仅限于内核空间的代码）

竞态是对共享资源访问的结果，并发进程访问了相同的数据或结构（硬件资源）等。

解决竞态的思想主要有两种

1、所有的代码都不使用全局变量

2、使用锁机制确保一次只有一个进程使用共享资源

显然第一种方式是不可能的，我们只能尽量少的使用全局变量，而不能完全避免它

下边介绍两种锁机制

信号量

这个概念对我们来说应该不是很陌生，至少听说过，它有两种操作：通常叫做P操作与V操作

希望进入临界区的进程调用P操作，检测当前信号量，如果信号量大于0，则信号量减1，进入临界区，否则进程等待其他进程释放此信号量，信号量的释放通过一个V操作增加信号量的值，在某些情况下会去唤醒等待此信号量的进程。

以上说到了一个临界区这个名词简单来讲就是内部操作了共享数据的代码

Linux 内核中信号量的实现

因为从LLD3（2.6.10）版本出来到现在（3.1）内核函数有了很多的变化，许多书上介绍的函数都已经不存在了，也能几版新kernel之后现在我说的函数也会有变化了。

信号量结构以及相关函数的定义在<linux/semaphore.h>中

创建信号量

view plaincopy
to clipboardprint ?

void sema_init(struct semaphore *sem, int val)

view plaincopy
 to clipboardprint?

void init_MUTEX();  

void init_MUTEX_LOCKED();  

void init_MUTEX();
void init_MUTEX_LOCKED();

两个定义互斥锁的函数（最新的内核中已经没有这两个函数了，所以不要用它）

view plaincopy
to clipboardprint ?

struct simple_dev{

char *data;
loff_t count;
struct cdev cdev;

struct semaphore semp;

};

static __init int simple_init(void)

{
...
for( index = 0 ; index < DEV_COUNT ; ++index )

{
sema_init(&char5_dev[index].semp,1);
//init_MUTEX(&(char5_dev[index].semp));

init_waitqueue_head(&(char5_dev[index].queue));

}
...

}

view plaincopy
 to clipboardprint?

void down(struct semaphore *sem);  

int __must_check down_interruptible(struct semaphore *sem);  

int __must_check down_killable(struct semaphore *sem);  

int __must_check down_trylock(struct semaphore *sem);  

int __must_check down_timeout(struct semaphore *sem, long jiffies)  

void down(struct semaphore *sem);
int __must_check down_interruptible(struct semaphore *sem);
int __must_check down_killable(struct semaphore *sem);
int __must_check down_trylock(struct semaphore *sem);
int __must_check down_timeout(struct semaphore *sem, long jiffies)

第一个函数在信号量大于0时直接将信号量的值减一程序继续运行，在信号量为0时进程睡眠只有等到有其他进程释放信号量时候才被唤醒（不推荐使用）

第二个函数在第一个操作的基础上，如果进程因为没有得到信号量睡眠，在别的进程释放信号量或者发成中断的情况下都会被唤醒,在被中断信号唤醒时候返回－EINTR，成功返回0

第三个函数如果没有另外的任务会获取此信号量，则可以调用此函数，在收到中断信号时会返回－EINTR

第四个函数试图去获取信号量，在获取不到的时候不会睡眠，而是继续运行，返回0值表示得到了此信号量，返回1 表示没能获取到。

第五个函数可以去设置最长睡眠时间，但是此函数不可中断

V操作

view plaincopy
to clipboardprint ?

void up(struct semaphore *sem)

view plaincopy
 to clipboardprint?

static ssize_t simple_read(struct file *filp, char __user *userstr, size_t count, loff_t *loff)  

{   
       
    struct simple_dev *dev = NULL;  

    int data_remain = 0;  

    int err;   
    D("[%s:] In %s \n",current->comm, __func__);  

       
    dev         = filp->private_data;   
       
    err = down_interruptible(&dev->semp);   
    if(err)   
    {   
        if(err == -EINTR)  

            WAR("return by an interrupt signal\n");  

        else   
            printk(KERN_ERR "an error occured in down_interruptible\n");  

        return err;   
    }   
       
    else  

    {   
        D("have get the mutex %d\n", __LINE__);  

    }   
    /******************************************* 

    *       临界区代码  
    ********************************************/  

       
    up(&dev->semp);   
    return count;   
}  

static ssize_t simple_read(struct file *filp, char __user *userstr, size_t count, loff_t *loff)
{
	
	struct simple_dev *dev = NULL;
	int data_remain = 0;
	int err;
	D("[%s:] In %s \n",current->comm, __func__);
	
	dev			= filp->private_data;
	
	err = down_interruptible(&dev->semp);
	if(err)
	{
		if(err == -EINTR)
			WAR("return by an interrupt signal\n");
		else
			printk(KERN_ERR "an error occured in down_interruptible\n");
		return err;
	}
	
	else
	{
		D("have get the mutex %d\n", __LINE__);
	}
	/*******************************************
	*		临界区代码
	********************************************/
	
	up(&dev->semp);
	return count;
}

自旋锁

自旋锁是另一种锁机制，信号量会引起进程的休眠，而在不能睡眠的代码中我们就需要使用自旋锁。

自旋锁也是一个互斥的概念，有“锁定”与“解锁”两个操作，当程序需要锁定时候，则先检测锁是否可用，如果可用则获得锁，程序进入临界区，否则进入忙等待重复检测这个锁是否可用（这就是自旋），临界区代码操作完成则解锁。

信号量实现中其实也用到了自旋锁机制（有兴趣的刻一看内核源码，这边不展开，等以后写内核时候再介绍）

因为自旋锁在得不到锁的时候会“自旋” 即不会让出CPU ，所以我们的临界区执行速度应该尽量的快，最好使用原子操作（不会睡眠）。这也是使用自旋锁的核心规则，在多数情况下我们做不到这一点，所以自旋锁在驱动程序中使用的不如信号量频繁。

初始化

view plaincopy
to clipboardprint ?

spin_lock_init(_lock)

view plaincopy
 to clipboardprint?

static inline void spin_lock(spinlock_t *lock)  

static inline int spin_trylock(spinlock_t *lock)  

static inline void spin_lock_irq(spinlock_t *lock)  

spin_lock_irqsave(lock, flags)   
static inline void spin_lock_bh(spinlock_t *lock)  

static inline void spin_lock(spinlock_t *lock)
static inline int spin_trylock(spinlock_t *lock)
static inline void spin_lock_irq(spinlock_t *lock)
spin_lock_irqsave(lock, flags)
static inline void spin_lock_bh(spinlock_t *lock)

第一个函数是不去禁止中断直接锁定

第二个函数会尝试加锁，检测返回之判断是否锁定，在不能锁定时候程序也继续运行

第三个函数禁止中断，不保存保存原先的中断状态

第四个函数在禁止中断之前，保存原先的中断状态，

第五个函数表示只禁止软件中断而保持硬件中断的打开

因为自旋锁本质上要不会被中断，所以调用时候建议使用包含有禁止中断的函数

解锁

view plaincopy
to clipboardprint ?

static inline void spin_unlock(spinlock_t *lock)

//static inline void spin_unlock(spinlock_t *lock)

static inline void spin_unlock_irq(spinlock_t *lock)

static inline void spin_unlock_irqrestore(spinlock_t *lock, unsigned long flags)

static inline void spin_unlock_bh(spinlock_t *lock)

static inline void spin_unlock(spinlock_t *lock)
//static inline void spin_unlock(spinlock_t *lock)
static inline void spin_unlock_irq(spinlock_t *lock)
static inline void spin_unlock_irqrestore(spinlock_t *lock, unsigned long flags)
static inline void spin_unlock_bh(spinlock_t *lock)
对应于锁定的五个函数，分别解锁,(对应于锁定的第二个操作，在加锁成功时候需要使用spin_unlock来解锁)

死锁

上边只提到了使用锁的好处，以及如何使用锁，但是引入锁机制也会带来风险，那就是死锁，进程死锁最明显的表现就是死机。

如上图所示，A进程占有锁1，并在持有锁1的时候需要得到锁2程序才能继续进行

B进程占有锁2，并在保持锁2的同时去获取锁1程序才能继续运行，这样A， B 进程就卡在这里，互不相让，这就导致了死锁。

亦或在一个进程内同时试图获取同样的锁

死锁的名词解释

是指两个或两个以上的进程在执行过程中，因争夺资源而造成的一种互相等待的现象，若无外力作用，它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁

解决死锁的方法：

1、加解锁顺序一致

在必须使用多个锁的时候，应该始终以相同的顺序获取，也最好以获取锁顺序逆序解锁。

2、使用原子变量

原子变量不会被多个进程并发操作，内核提供了一种原子类型（atomic_t <asm/stomic.h>中）

3、设置加锁timeout值

在一定时间内不能获得锁，就放弃，并释放已占有的锁

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航