您的位置：首页 > 运维架构 > Linux

Linux设备驱动程序学习（7）-内核的数据类型

2011-03-27 14:17 525 查看

由于前面的学习中有用到第十一章内核数据结构类型的知识，所以我先看了。要点如下：

将linux移植到新的体系结构时，开发者遇到的若干问题都与不正确的数据类型有关。坚持使用严格的数据类型和使用-Wall-Wstrict-prototypes进行编译可能避免大部分的bug。

内核数据使用的数据类型主要分为3个类型:标准C语言类型、确定大小的类型和特定内核对象的类型。

标准C语言类型
当需要“一个2字节填充符”或“用一个4字节字串来代表某个东西”，就不能使用标准C语言类型，因为在不同的体系结构，C语言的数据类型所占的空间大小不同。后面的datasize程序实验展示了用户空间各种C的数据类型在当前平台所占空间的大小。而且有的构架，内核空间和用户空间的C数据类型所占空间大小也可能不同。kdatasize模块显示了当前模块的内核空间C数据类型所占空间大小。

尽管概念上地址是指针，但使用一个无符号整型可以更好地实现内存管理;内核把物理内存看成一个巨型数组,内存地址就是该数组的索引。我们可以方便地对指针取值，但直接处理内存地址时，我们几乎从不会以这种方式对他取值。使用一个整数类型避免了这种取值，因此避免了bug。所以，利用至少在Linux目前支持的所有平台上，指针和长整型始终是相同大小的这一事实，内核中内存地址常常是unsignedlong。

C99标准定义了intptr_t和uintptr_t类型，它们是能够保存指针值的整型变量。但没在2.6内核中几乎没使用。

确定大小的类型

当需要知道你定义的数据的大小时，可以使用内核提供的下列数据类型（所有的数据声明在<asm/types.h>,被包含在<linux/types.h>）：

u8;/*unsignedbyte(8bits)*/ u16;/*unsignedword(16bits)*/ u32;/*unsigned32-bitvalue*/ u64;/*unsigned64-bitvalue*/

/*虽然很少需要有符号类型，但是如果需要，只要用s代替u*/

若一个用户空间程序需要使用这些类型，可在符号前加一个双下划线:__u8和其它类型是独立于__KERNEL__定义的。

这些类型是Linux特定的，它们妨碍了移植软件到其他的Unix机器。新的编译器系统支持C99-标准类型，如uint8_t和uint32_t。若考虑移植性，使用这些类型比Linux特定的变体要好。

接口特定的类型（_t类型）
内核中最常用的数据类型由它们自己的typedef声明，阻止了任何移植性问题。“接口特定（interface-specific）”由某个库定义的一种数据类型,以便为了某个特定的数据结构提供接口。很多_t类型在<linux/types.h>中定义。

注意：近来已经很少定义新的接口特定的类型。有许多内核开发者已经不再喜欢使用typedef语句，他们宁愿看到代码中直接使用的真实类型信息。很多老的接口特定类型在内核中保留，他们不会很快消失。

即使没有定义接口特定类型，也应该始终是用和内核其他部分保持一致、适当的数据类型。只要驱动使用了这种“定制”类型的函数，但又不遵照约定，编译器会发出警告，这时使用-Wall编译器选项并小心去除所有的警告，就可以确信代码的可移植性了。

_t类型的主要问题是：打印它们时，常常不容易选择正确的printk或printf格式。打印接口特定的数据的最好方法是：将其强制转换为可能的最大类型(常常是long或unsignedlong)并用相应的格式打印。

其他移植性问题
移植的一个通常规则是：避免使用显式的常量值，要使用预处理宏使常量值参数化。

时间间隔

当处理时间间隔时，不要假定每秒的jiffies个数，不是每个Linux平台都以固定的速度运行.当计算时间间隔时，要使用HZ(每秒的定时器中断数)来标定你的时间。s3c2410的HZ值默认为200。

页大小

当使用内存时，记住一个内存页是PAGE_SIZE字节,不是4KB。相关的宏定义是PAGE_SIZE和PAGE_SHIT（包含将一个地址移位来获得它的页号的位数），在<asm/page.h>中定义。如果用户空间程序需要这些信息，可以使用getpagesize库函数。

若一个驱动需要16KB来暂存数据，一个可移植得解决方法是get_order:

#include<asm/page.h> intorder=get_order(16*1024); buf=get_free_pages(GFP_KERNEL,order);/*get_order的参数必须是2的幂*/
字节序
不要假设字节序。代码应该编写成不依赖所操作数据的字节序的方式。

头文件<asm/byteorder.h>定义：

#ifdef__ARMEB__ #include<linux/byteorder/big_endian.h> #else #include<linux/byteorder/little_endian.h> #endif
在<linux/byteorder/big_endian.h>中定义了__BIG_ENDIAN，而在<linux/byteorder/little_endian.h>中定义了__LITTLE_ENDIAN，这些依赖处理器的字节序当处理字节序问题时,需要编码一堆类似#ifdef__LITTTLE_ENDIAN的条件语句。

但是还有一个更好的方法：Linux内核有一套宏定义来处理处理器字节序和特定字节序之间的转换。例如:

u32cpu_to_le32(u32); u32le32_to_cpu(u32); /*这些宏定义将一个CPU使用的值转换成一个无符号的32位小头数值，无论CPU是大端还是小端，也不管是不是32位处理器。在没有转换工作需要做时，返回未修改的值。*/ /*有很多类似的函数在<linux/byteorder/big_endian.h>和<linux/byteorder/little_endian.h>中定义*/

数据对齐

编写可移植代码而值得考虑的最后一个问题是如何访问未对齐的数据。存取不对齐的数据应当使用下列宏:

#include<asm/unaligned.h>
get_unaligned(ptr);
put_unaligned(val,ptr);
这些宏是无类型的，并对各总数据项，不管是1、2、4或8个字节，他们都有效，并且在所有内核版本中都有定义。

关于对齐的另一个问题是数据结构的跨平台移植性。同样的数据结构在不同的平台上可能被不同地编译。为了编写可以跨体系移植的数据结构，应当始终强制数据项的自然对齐。自然对齐（naturalalignment）指的是：数据项大小的整数倍的地址上存储数据项。应当使用填充符避免强制自然对齐时编译器移动数据结构的字段，在数据结构中留下空洞。

dataalign程序实验展示了编译器如何强制对齐。

为了目标处理器的良好性能，编译器可能悄悄地插入填充符到结构中，来保证每个成员是对齐的。若定义一个和设备要求的结构体相匹配结构，自动填充符会破坏这个意图。解决这个问题的方法是告诉编译器这个结构必须是"紧凑的",不能增加填充符。例如下列的定义:

struct

{

u16id;

u64lun;

u16reserved1;

u32reserved2;

}

__attribute__((packed))scsi;

/*如果在64-位平台上编译这个结构，若没有__attribute__((packed)),lun成员可能在前面被添加2个或6个填充符字节。指针和错误值*/

你还可以在利用ARM9和USB摄像头进行视频采集的servfox源代码的spcaframe.h头文件中找到这种方法的实际应用：

structframe_t{

charheader[5];

intnbframe;

doubleseqtimes;

intdeltatimes;

intw;

inth;

intsize;

intformat;

unsignedshortbright;

unsignedshortcontrast;

unsignedshortcolors;

unsignedshortexposure;

unsignedcharwakeup;

intacknowledge;

}__attribute__((packed));

structclient_t{

charmessage[4];

unsignedcharx;

unsignedchary;

unsignedcharfps;

unsignedcharupdobright;

unsignedcharupdocontrast;

unsignedcharupdocolors;

unsignedcharupdoexposure;

unsignedcharupdosize;

unsignedcharsleepon;

}__attribute__((packed));

指针和错误值

许多内核接口通过将错误值编码到指针值中来返回错误信息。这样的信息必须小心使用，因为它们的返回值不能简单地与NULL比较。为帮助创建和使用这类接口,<linux/err.h>提供了这样的函数：

void*ERR_PTR(longerror);/*将错误值编码到指针值中，error是常见的负值错误码*/
longIS_ERR(constvoid*ptr);/*测试返回的指针是不是一个错误码*/
longPTR_ERR(constvoid*ptr);/*抽取实际的错误码，只有在IS_ERR返回一个真值时使用，否则一个有效指针*/

链表

操作系统内核常需要维护数据结构的链表。Linux内核已经同时有几个链表实现。为减少复制代码的数量,内核已经创建了一个标准环形双向链表，并鼓励需要操作链表的人使用这个设施.

使用链表接口时，应当记住列表函数没做加锁。若驱动可能同一个列表并发操作，就必须实现一个锁方案。

为使用链表机制，驱动必须包含文件<linux/list.h>，它定义了一个简单的list_head类型结构:

struct

list_head

struct

list_head

next

prev

};

实际代码中使用的链表几乎总是由某个结构类型组成,每个结构描述链表中的一项.为使用Linux链表，只需嵌入一个list_head在构成在这个链表的结构里面。链表头常常是一个独立的list_head结构。下图显示了这个简单的structlist_head是如何用来维护一个数据结构的列表的.

/*链表头必须在使用前初始化,有两种形式：*/
/*一是运行时初始化:*/
structlist_headtodo_list;
INIT_LIST_HEAD(&todo_list);
/*二是编译时初始化:*/
LIST_HEAD(todo_list);
list_add(structlist_head*new,structlist_head*head);
/*在紧接着链表head后面增加新项。注意：head不需要是链表名义上的头;如果你传递一个list_head结构,它在链表某处的中间,新的项紧靠在它后面。因为Linux链表是环形的,链表头通常和任何其他的项没有区别*/
list_add_tail(structlist_head*new,structlist_head*head);
/*在给定链表头前面增加新项，即在链表的尾部增加一个新项。*/
list_del(structlist_head*entry);
list_del_init(structlist_head*entry);
/*给定的项从队列中去除。如果入口项可能注册在另外的链表中,你应当使用list_del_init,它重新初始化这个链表指针.*/
list_move(structlist_head*entry,structlist_head*head);
list_move_tail(structlist_head*entry,structlist_head*head);
/*给定的入口项从它当前的链表里去除并且增加到head的开始。为安放入口项在新链表的末尾,使用list_move_tail代替*/
list_empty(structlist_head*head);
/*如果给定链表是空,返回一个非零值.*/
list_splice(structlist_head*list,structlist_head*head);
/*将list紧接在head之后来连接2个链表.*/
/*list_entry是将一个list_head结构指针转换到一个指向包含它的结构体的指针。看了源码你就会发现，似曾相识。是的，其实在模块的open方法中已经用到了container_of。list_entry的变体好有很多，看源码就知道了*/
#definelist_entry(ptr,type,member)\
container_of(ptr,type,member)

ARM9实验板实验

datasize实验

实验中有用到uname函数，介绍如下（载自《UNIX环境高级编程》，第6章系统数据文件和信息6.8系统标识）：

POSIX.1定义了uname函数，它返回与主机和操作系统有关的信息。

#include<sys/utsname.h>

intuname(structutsname*name);

返回：若成功则为非负值，若出错则为-1

通过该函数的参数向其传递一个utsname结构的地址，然后该函数填写此结构。POSIX.1只定义了该结构中至少需提供的字段(它们都是字符数组)，而每个数组的长度则由实现确定。某些实现在该结构中提供了另外一些字段。在历史上，系统V为每个数组分配9个字节，其中有1个字节用于字符串结束符(null字符)。

structutsname{

charsysname[9];/*nameoftheoperatingsystem*/

charnodename[9];/*nameofthisnode*/

charrelease[9];/*currentreleaseofoperatingsystem*/

charversion[9];/*currentversionofthisrelease*/

charmachine[9];/*nameofhardwaretype*/

};

utsname结构中的信息通常可用uname(1)命令打印。

实验程序源码链接：datasize

kdatasize模块实验

实验中有用到utsname函数，源码如下：

//<linux/utsname.h>
structnew_utsname{
charsysname[65];
charnodename[65];
charrelease[65];
charversion[65];
charmachine[65];
chardomainname[65];
};
staticinlinestructnew_utsname*utsname(void)
{
return¤t->nsproxy->uts_ns->name;
}
实验模块源码链接：kdatasize

kdataalign模块实验

具体试验原理请看源码

实验模块源码链接：kdataalign

实验现象：

[Tekkaman2440@SBC2440V4]#cd/tmp/
[Tekkaman2440@SBC2440V4]#./datasize
archSize:charshortintlongptrlong-longu8u16u32u64
armv4tl1244481248
[Tekkaman2440@SBC2440V4]#cd/lib/modules/
[Tekkaman2440@SBC2440V4]#insmodkdatasize.ko
archSize:charshortintlongptrlong-longu8u16u32u64
armv4tl1244481248
insmod:cannotinsert'kdatasize.ko':Nosuchdevice(-1):Nosuchdevice
[Tekkaman2440@SBC2440V4]#insmodkdataalign.ko
archAlign:charshortintlongptrlong-longu8u16u32u64
armv4tl1244441244
insmod:cannotinsert'kdataalign.ko':Nosuchdevice(-1):Nosuchdevice

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航