您的位置:首页 > 编程语言 > Python开发

Python模块--struct 数据格式转换

2011-01-22 22:19 579 查看
Python是
一门非常简洁的语言,对于数据类型的表示,不像其他语言预定义了许多类型(如:在C#中,光整型就定义了8种),它只定义了六种基本类型:字符串,整数,
浮点数,元组,列表,字典。通过这六种数据类型,我们可以完成大部分工作。但当Python需要通过网络与其他的平台进行交互的时候,必须考虑到将这些数
据类型与其他平台或语言之间的类型进行互相转换问题。打个比方:C++写的客户端发送一个int型(4字节)变量的数据到
Python写的服务器,Python接收到表示这个整数的4个字节数据,怎么解析成Python认识的整数呢?
Python的标准模块struct就用来解决这个问题。

  struct模块的内容不多,也不是太难,下面对其中最常用的方法进行介绍:

 struct.pack

  struct.pack用于将Python的值根据格式符,转换为字符串(因为Python中没有字节(Byte)类型,可以把这里的字符串理
解为字节流,或字节数组)。其函数原型为:struct.pack(fmt, v1, v2, ...),参数fmt是格式字符串,关于格式字符串的相关信息在下面有所介绍。v1,
v2, ...表示要转换的python值。下面的例子将两个整数转换为字符串(字节流):

 

 
import
 struct  

  

a = 20
  

b = 400
  

  

str = struct.pack("ii"
, a, b)  
#转换后的str虽然是字符串类型,但相当于其他语言中的字节流(字节数组),可以在网络上传输
  

print
 
'length:'
, len(str)  

print
 str  

print
 repr(str)  

  

#---- result
  

#length: 8
  

#    ----这里是乱码
  

 

#'/x14/x00/x00/x00/x90/x01/x00/x00'
  

import struct
a = 20
b = 400
str = struct.pack("ii", a, b)
#转换后的str虽然是字符串类型,但相当于其他语言中的字节流(字节数组),可以在网络上传输
print 'length:', len(str)
print str
print repr(str)
#---- result
#length: 8
#    ----这里是乱码
#'/x14/x00/x00/x00/x90/x01/x00/x00'
 

格式符"i"表示转换为int,'ii'表示有两个int变量。进行转换后的结果长度为8个字节(int类型占用4个字节,两个int为8个字
节),可以看到输出的结果是乱码,因为结果是二进制数据,所以显示为乱码。可以使用python的内置函数repr来获取可识别的字符串,其中十六进制的
0x00000014, 0x00001009分别表示20和400。

struct.unpack

  struct.unpack做的工作刚好与
struct.pack相反,用于将字节流转换成python数据类型。它的函数原型为:struct.unpack(fmt,
string),该函数返回一个元组
。 下面是一个简单的例子:

 
str = struct.pack(
"ii"

20

400
)  

a1, a2 = struct.unpack("ii"
, str)  

print
 
'a1:'
, a1  

print
 
'a2:'
, a2  

  

#---- result:
  

#a1: 20
  

#a2: 400
  

str = struct.pack("ii", 20, 400)
a1, a2 = struct.unpack("ii", str)
print 'a1:', a1
print 'a2:', a2
#---- result:
#a1: 20
#a2: 400

 

struct.calcsize

  struct.calcsize用于计算格式字符串所对应的结果的长度,如:struct.calcsize('ii'),返回8。因为
两个int类型所占用的长度是8个字节。

struct.pack_into, struct.unpack_from

   这两个函数在Python手册中有所介绍,但没有给出如何使用的例子。其实
它们在实际应用中用的并不多。Google了很久,才找到一个例子,贴出来共享一下:

 

 
import
 struct  

from
 ctypes 
import
 create_string_buffer  

  

buf = create_string_buffer(12
)  

print
 repr(buf.raw)  

  

struct.pack_into("iii"
, buf, 
0

1

2
, -
1
)  

print
 repr(buf.raw)  

  

print
 struct.unpack_from(
'iii'
, buf, 
0
)  

  

#---- result
  

#'/x00/x00/x00/x00/x00/x00/x00/x00/x00/x00/x00/x00'
  

#'/x01/x00/x00/x00/x02/x00/x00/x00/xff/xff/xff/xff'
  

 

#(1, 2, -1)
  

import struct
from ctypes import create_string_buffer
buf = create_string_buffer(12)
print repr(buf.raw)
struct.pack_into("iii", buf, 0, 1, 2, -1)
print repr(buf.raw)
print struct.unpack_from('iii', buf, 0)
#---- result
#'/x00/x00/x00/x00/x00/x00/x00/x00/x00/x00/x00/x00'
#'/x01/x00/x00/x00/x02/x00/x00/x00/xff/xff/xff/xff'
#(1, 2, -1)
 

关于格式字符串

  在Python手册中,给出了C语言中常用类型与Python类型对应的格式
符:

 

格式符
C语言类型
Python类型

x

pad byte
no value
 
c

char

string of length 1
 
b

signed
char

integer
 
B

unsigned
char

integer
 
?

_Bool

bool
 
h

short

integer
 
H

unsigned
short

integer
 
i

int

integer
 
I

unsigned
int

integer or long
 
l

long

integer
 
L

unsigned
long

long
 
q

long
long

long
 
Q

unsigned
long
long

long
 
f

float

float
 
d

double

float
 
s

char[]

string
 
p

char[]

string
 
P

void
*

long
具体内容请参考Python手册 struct 模块
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息