您的位置：首页 > 编程语言 > Python开发

python学习总结

2015-07-27 16:49 507 查看

看到如此高质量的博文，果断收藏一下。感谢：
http://www.cnblogs.com/chgaowei/archive/2012/06/05/2537442.html
两本不错的书：
《Python参考手册》：对Python各个标准模块，特性介绍的比较详细。
《Python核心编程》：介绍的比较深入，关键是，对Python很多高级特性都有介绍。
一个开源代码：openstack，关于云计算的，用Python写的，可以重点学习一下。

套接字编程：

1、函数的功能基本和c类似，唯一不同的地方在于当发生错误时，它不是通过返回值来告知的，而是通过触发异常，所以udp中的bind, recvfrom, sendto必须要进行捕捉异常。
2、套接字在垃圾收集的时候也会关闭。
3、获取网卡的IP：
s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
return socket.inet_ntoa(fcntl.ioctl(s.fileno(), 0X8915, struct.pack('256s', ethname[:15]))[20:24])

字符串的使用：

1、 Python的字符串是不可以改变的。但是你可以操作字符串以形成新的字符串。
2、字符串中删除一个字串。没有直接提供这个方法，但是replace可以实现：
"abc def".replace(" ", "")
同样的功能还有一个方法：translate。它的原有作用是将字符串中的某个字符替换为另外一个字符，注意，不是字符串。它的第一个参数是一个转换表。第二个参数是要删除的字符串。我们可以利用第二个参数del，实现这个功能。同时，第一个参数设置为None。
translate可能更高效一点。另外，它的第二个参数可以使一个字符串，含有多个字符，这样就会删除多个。
注意：translate方法不会对这个字符串操作，而是返回一个新的字符串。
3、 strip方法：去除字符串两侧的空格，返回新的字符串。这个功能非常有用。
4、 str中有一个函数，format，非常强大，有时间一定要看一下。
5、 endswitch：检查字符串是否已某字符串结尾。startswith：检查是否已某字符串开头。
6、 partition：它将字符串按指定的字符串分为三个部分，返回一个元组。第一个是指定字符串前面内容，第二个是指定字符串，第三个是指定字符串后面的内容。用于字符串解析非常好用。
7、 split：将字符串按照某指定字符串分割成多个子字符串，返回一个分割后的列表。
8、 join：将一个字符串列表中的各个字符串连接起来，中间插入指定的字符串。
9、 find的返回值不是false和true，所以不可以直接用于if判断。需要判断if s.find(‘’) >= 0:
10、基于字典的格式化：
a) sh = '''
b) python -m compileall -fl ../src;
c) python -m compileall -fl ../src/micbase;
d) mkdir %(packname)s;
e) mdkir %(packname)s;
f) ''' % {'packname':sys.argv[1], }
g) print(sh)
h)
内建函数：

string.capitalize()	把字符串的第一个字符大写
string.center(width)	返回一个原字符串居中,并使用空格填充至长度 width 的新串
string.count(str, beg=0, end=len(string))	返回 str 在 string 里面出现的次数，如果 beg 或者 end 指返回指定范围内 str 出现的次数
string.decode(encoding='UTF-8', errors='strict')	以 encoding 指定的编码格式解码 string，如果出错默认报ValueError 的异常，除非 errors 指定的是'ignore'或'replace'
string.encode(encoding='UTF-8', errors='strict')	以 encoding 指定的编码格式编码 string，如果出错默认报ValueError的异常，除非errors指定的是'ignore'或者'repl
string.endswith(obj, beg=0, end=len(string))	检查字符串是否以 obj 结束，如果 beg 或者 end 指定则检定的范围内是否以 obj 结束，如果是，返回True,否则返回Fa
string.expandtabs(tabsize=8)	把字符串 string 中的 tab 符号转为空格，默认格数 tabsize 是 8.
string.find(str, beg=0, end=len(string))	检测 str 是否包含在 string 中，如果 beg 和 end 指定范则检查是否包含在指定范围内，如果是返回开始的索引值，返回-1
string.index(str, beg=0, end=len(string))	跟find()方法一样，只不过如果str不在string中会报一个异
string.isalnum()	a, b, c R如果string至少有一个字符并且所有字符都是字母或数字回 True,否则返回 False
string.isalpha()	a, b, c 如果string至少有一个字符并且所有字符都是字母则返回T否则返回 False
string.isdecimal()	b, c, d 如果 string 只包含十进制数字则返回 True 否则返回 False.
string.isdigit()	b, c 如果 string 只包含数字则返回 True 否则返回 False.
string.islower()	b, c 如果 string 中包含至少一个区分大小写的字符，并且所有这些(大小写的)字符都是小写，则返回 True，否则返回 False
string.isnumeric()	b, c, d 如果 string 中只包含数字字符，则返回 True，否则返回 False
string.isspace()	b, c 如果 string 中只包含空格，则返回 True，否则返回 False.
string.istitle()	b, c 如果 string 是标题化的(见 title())则返回 True，否则返回 False
string.isupper()	b, c 如果 string 中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是大写，则返回 True，否则返回 False
string.join(seq)	Merges (concatenates)以 string 作为分隔符，将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
string.ljust(width)	返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串
string.lower()	转换 string 中所有大写字符为小写.
string.lstrip()	截掉 string 左边的空格
string.partition(str)	e 有点像 find()和 split()的结合体,从 str 出现的第一个位置起,把字符串 string 分成一个 3 元素的元组 (string_pre_str,str,string_post_str),如果 string 中不包含str 则 string_pre_str == string.
string.replace(str1, str2, num=string.count(str1))	把 string 中的 str1 替换成 str2,如果 num 指定，则替换不超过 num 次.
string.rfind(str, beg=0,end=len(string))	类似于 find()函数，不过是从右边开始查找.
string.rindex( str, beg=0,end=len(string))	类似于 index()，不过是从右边开始.
string.rjust(width)	返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串
string.rpartition(str)	e 类似于 partition()函数,不过是从右边开始查找.
string.rstrip()	删除 string 字符串末尾的空格.
string.split(str="", num=string.count(str))	以 str 为分隔符切片 string，如果 num有指定值，则仅分隔 num 个子字符串
string.splitlines(num=string.count('\n'))	b, c按照行分隔，返回一个包含各行作为元素的列表，如果 num 指定则仅切片 num 个行.
string.startswith(obj, beg=0,end=len(string))	b, e检查字符串是否是以 obj 开头，是则返回 True，否则返回 False。如果beg 和 end 指定值，则在指定范围内检查.
string.strip([obj])	在 string 上执行 lstrip()和 rstrip()
string.swapcase()	翻转 string 中的大小写
string.title()	b, c 返回"标题化"的 string,就是说所有单词都是以大写开始，其余字母均为小写(见 istitle())
string.translate(str, del="")	根据str给出的表(包含256个字符)转换string的字符,要过滤掉的字符放到 del 参数中
string.upper()	转换 string 中的小写字母为大写
string.zfill(width)	返回长度为 width 的字符串，原字符串 string 右对齐，前面填充0

正则表达式

1、为什么要学习正则：主要是为了处理字符串更加方便，特别是为后面进行代码生成做储备。
2、 match是匹配字符串的开头是否匹配，而search是查看字符串任意起始位置是否满足。
3、 sub可以对字符串中模式匹配的部分进行替换
4、 split：可以对字符串进行分割，这里是根据模式分割。

函数的使用：

1、函数的作用域：函数中定义一个变量，如果和全局变量重名，则全局变量名称就会被覆盖，也就是，这里对这个变量的更改，不会更改全局变量。但是，如果直接使用的话，是会使用全局变量的。同时，如果想要修改全局变量，需要制定是全局变量：global a
2、 xrange用法和range一样，不过更为高效，因为他不会在内存中创建列表。所以，它只能用于循环。
3、如果函数没有return语句，则他的返回值为None。
4、关于函数的入参判断：如果如此为空，可能会发生异常。当异常发生后，可能会出现一种情况，一个事情做到了一半，就没有在进行下去，可能会造成内存泄露。这个问题如何解决？按照C的方式，每个入参都做判断是可以解决的，但是这样太麻烦了。而且看很多开源代码页没有这样来做。是不是有更好的方法？换一种思路，在调用之前确保不为空。在看看开源的代码是怎么做的。特别是openstack。
5、可变入参：*args, **kwargs表示可变入参。
def funtest(a, b, c):
print(a, b, c)
def fun2(*args, **kwargs):
funtest(*args, **kwargs)
fun2(1,2,3)
也可以这样定义：
fun2(a, *args, **kwargs)
如何从可变参数中解析出参数的值？
在fun2中添加打印：可以发现，其实args是一个元组，kwargs是一个字典。
分析：调用fun2(1,2,3)，会把a赋值给a，2赋值给元组args，{‘c’=3}赋值给kwargs.
args和kwargs的顺序不可颠倒。
args和kwargs可能同时都有值。这样，要获取指定的入参，首先根据看args中有没有，然后根据字符串看kwargs中是否存在。
如何建一个元组或者字典通过参数传递给一个函数？
def funtest(a, b, c):
print(a, b, c)
d = {'a':1, 'b':2,'c':3}
l = (1,2,3)
funtest(*l)
funtest(**d)
*和**在Python中可以实现这个功能。这样会很灵活的。
*和**也可以单独出现。但是，如果同时出现，*必须在**之前。
6、默认参数或者可选参数，参数顺序：调用时，可以指定默认参数中填充那个。
def funtest(a, b=1, c=2):
print(a, b, c)
funtest(1, c=5, b=6)
其实，即便定义为：def funtest(a, b, c)，也可以通过funtest(1, c=5, b=6)的形式调用。
7、参数组：*args, **kwargs就是参数组，通过元组和字典将产生携带进来。这个特性有助于更为动态的代码生成。
8、可变长度参数：
9、函数的参数中如果有一个是元组，可以这样：
def fun(a, (b, c)):
print(a, b, c)
fun(1, (1,2))
10、关于回调，可以使用闭包，生成器，以及对象的__call__属性。都可以封装状态。

闭包的使用：

1、将组成函数的语句和语句的执行环境打包在一起形成的对象，成为闭包。
2、 2.7之前的闭包不支持关键字nonlocal。3.0之后才支持。所以2.7前的闭包不可以使用nonlocal。
3、这样他就不可以对执行环境中的变量进行更改。

字典的使用：

1、字典的删除：直接使用del dict[k]可能会引发异常；首先判断k是否存在则效率有些低；使用异常使程序结构看起来不好。一个好的方法是pop(k, default v)。这个删除一个k项，并且返回。如果不存在返回默认的v。如果不加默认值，则会引发异常。
2、直接使用字典下标获取字典的值可能会引发一场。使用get方法则不会，如果不存在会返回none。另外，还可以设置不存在的默认值。
3、通过字典格式化字符串：print “value is %(key)s” % kvdict
4、 items方法返回一个列表，列表中的元素是一个元组，第一个是key，第二个是value。比较好用的方法。
5、 iteritems:返回的是一个迭代器。如果想要迭代这个字典，iteritems会比items更高效一点。
6、 iterkeys则返回的是key的迭代器。keys返回的是key的list。
7、 values返回值的列表，itervalues返回的是vlaue的迭代器
8、 popitem会随机弹出（同时删除）一个项，则对于想要处理所有的元素，并且删除所有的元素是有帮助的。但是，如果没用元素的话，会抛出异常。
9、 viewitems，viewkeys，viewvalues：这三个函数返回的是一个view对象。这个类似于视图。分别表示（key, value）pair的列表，key的列表，value的列表。一个优点是，如果字典发生变化，view会同步发生变化。在迭代过程中，字典不允许改变，否则会报异常。
10、字典的键值比较规则：如果是内置类型（int，str，tuple）,则是以他们的值作为键值；如果是自定义对象，则是以对象的地址作为键值。——这一点没有完全证实。——最新的发现：对象的比较，内置类型，是因为他们都重写了默认的object的__eq__等方法，所以可以比较内容。自定义对象，没有重写，所以，他们的比较可能会不一样。object默认的比较是什么？目前还不明确，后面再补充吧。可能就是地址（或者对象的唯一标识），而不是对象的内容。涉及到字典，它不是使用的单纯的比较，而是使用的__hash__，它返回的是一个hash值，字典就是根据这个hash只来散布对象的。

列表的使用：

1、列表的删除：不可以在遍历的过程中删除链表，这样会得到不可预知的后果。可以使用列表的过滤，来获得新的列表。
2、列表的过滤：
def filterFun(node):#这个函数做了两个事情哎。
node.cycleCount = node.cycleCount - 1
return node.cycleCount < 0
timeoutList = filter(filterFun, timerList)
对timerList中的每个节点执行函数filterFun，根据filterFun返回的结果，为真的项组成一个新的列表。

3、 map: kvlist = map(lambda x:x.strip(), kvlist)。同时，map可以接受多个列表，这个时候，函数也会接受多个参数，分别表示列表的每一个元素:

kvlist = map(lambda x,y:x+y, [1,2,3], [4,5,6])
如果函数为None，则相当于函数zip：
zip([1,2,3], [4,5,6])
[(1,4),(2,5),(3,6)]
4、生成器表达式：l = [node for node in xrange(5) if node - 3 < 0]:这个的这个方法一定程度上可以替代过滤器和map。
生成器表达式定义：
[expr for iter_var in iterable if cond_expr]
l = [2 for x in xrange(5)]#结果是生成一个含有5个2的列表
5、 print(reduce(lambda x,y: x*y, [2 for x in xrange(38)]))
上面的这个语句是计算2的38次方的值。它用到的是二元函数reduce。它第一次调用是将第一个和第二个元素做入参，后面用他们的结果做x，新的元素做y，最后返回值。
另外，在获取一个38个2的列表也可以使用：[2] * 38。这可能更可读一点。
6、 enumerate:对列表处理，返回的是列表的索引以及节点。
for index, node in enumerate(timerList):
if timerId == node.timerId and timerEvent == node.timerEvent:
del timerList[index]
7、列表的分片：[1,2,3,4]，l[1:-1]表示从索引从1到倒数第一个，不包含倒数第一个。如果要从某位置到最后，则应该：[1:]
8、 l[i:j:k]:表示切片，从i到j，步长为k。
9、 l[i:j]:表示从i到j，不包括索引j。

排序

1、 list自己提供了排序的函数：sort。
2、 sort的参数：
a) cmp是一个比较函数，输入两个元素，比较大小，返回值为-1，0，1.
b) key也是一个函数，入参为一个元素，返回这个元素的关键字。
c) reverse是一个标志位，表示升序还是降序。默认False是升序，True表示降序。
3、使用key和reverse的性能，优于cmp函数。时间是cmp函数的一半。

迭代的使用：

1、迭代比直接使用列表遍历效率根据高。比如字典的keys函数返回的列表，以及iterkeys返回的迭代器。
2、 reversed() 内建函数将返回一个反序访问的迭代器.参数必须为序列。
3、 enumerate：返回一个迭代器：有索引值。
4、 for eachLine in myFile 替换 for eachLine in myFile.readlines() :
5、注意：在迭代的过程中不可以更改序列，否则会引发问题，导致迭代出错。
6、可以自己定义一个类，可以迭代使用。不过需要定义方法：__iter__，next。
7、 filter(function, iterable)：可以对迭代使用过滤器。

生成器的使用：

1、 yield关键字可以阻塞住函数的执行，并且保存当前的执行环境，整个包被称为生成器。
2、生成器可以通过调用生成器函数来创建。生成器函数是指包含关键字yield的函数。
3、生成器可以通过.next()来执行。每调用一次，就执行代码，直到遇到yield关键字停止，并且返回yield关键字后面的表达式的值。
4、可以通过调用send()函数来发送消息到生成器中。a = yield l：表示将send的入参赋值给a。
5、 throw：允许客户端传入要抛出的任何异常。
6、和throw相同，只不过是要抛出一个特定的异常：GeneratorExit。
7、 send只接受一个参数，但是可以通过传递元组的方式传递多个参数。
8、类的方法也可以返回生成器，因为他本质上就是一个函数。
9、在生成器使用的时候，如何获取它自身的send和nex函数？通过send二次传入是有些风险的，非常可能造成交叉引用，无法垃圾回收造成内存泄露。
10、第一次，必须调用next来启动生成器。

装饰器的使用：

1、装饰器本质上来说就是函数（或者是可调用对象），他们接受函数对象。装饰器仅仅用来装饰或者修饰函数的包装，返回一个修改后的函数对象，并将其赋值原来的标示符，并永久失去对原有函数的访问。
2、什么是带参数的装饰器？其实就是一个函数，这个函数可以返回一个装饰器，同时这个函数可以接受参数。
3、不带参数的装饰器要返回一个函数，这个函数就是用来替换原有的标示符的。
def decofun(fun):
def _mydeco(*args, **kwargs):
print('before fun!')
ret = fun(*args, **kwargs)
print('after fun', ret)
return ret
return _mydeco#新的函数，用于替换原有标示符
@decofun
def funtest():#funtest被替换为decofun
print('now in funtest!')
return 1
funtest()
4、装饰器是可以重叠的，那么他们的顺序怎么样：
a) @decofun2
b) @decofun
c) def funtest():
d) print('now in funtest!')
e) return 1
f) 原理是，funtest首先被decofun包装，然后再被decofun2包装。也就是，调用的时候，首先调用的是最上面的装饰器（也就是decofun2）的函数前面部分，然后再调用decofun的函数前面部分，之后再调用funtest。funtest返回后，首先调用的是decofun的函数后面部分，再调用decofun2后面部分。类似于一个栈的结构。
5、装饰器不要滥用。如果一个装饰器只用了一次，要考虑他存在的必要了。
6、携带参数的装饰器：
7、 def decoarg(arg):
a) def decofun3(fun):
b) def _mydeco(*args, **kwargs):
c) print('decoarg before fun!', arg)
d) ret = fun(*args, **kwargs)
e) print('decoarg after fun', ret)
f) return ret
g) return _mydeco
h) return decofun3
8、装饰器用到的一个最重要的技术，就是闭包。装饰器函数返回的其实就是一个闭包。
9、装饰器也可以修饰类的__方法：
class testc:
def __init__(self):
self.i = 1

@decoarg(1)
@decofun2
@decofun
def __call__(self):
print('i is %d' % self.i)
注意：装饰器修饰类方法是无法被子类继承的（或者说子类的方法是没有被修饰的）。因为他本质上就是一个函数。
10、装饰器也可以使对象，比如：
a) class obj:
b) def __init__(self, fun):
c) self.fun = fun
d)
e) def __call__(self, *args, **kwargs):
f) print('decofun before fun!', args, kwargs)
g) ret = self.fun(*args, **kwargs)
h) print('decofun after fun', ret)
i) return ret
j) @objdeco
k) def funtest(a, b=2):
l) print('funtest1 a , b =', a, b)
a) 这种方法看起来复杂了，但是可能会在有时候会比较有用。

11、装饰器可以修饰类。这个时候装饰器接收的是一个类名，而返回的也是这个类名。它可以为这个类添加一些属性或者进行一些操作。

协程的使用：

1、协程（coroutine）是一个可以挂起，回复，并且有多个进入点的函数。
2、

XML的使用：

1、处理xml消息包比较好用的模块是xml.etree.ElementTree。
2、 Element执行xml的根节点。
3、 elem.find(path):查找根节点下面路径为path的子节点。
4、 elem.findall(path):同样的子节点可能有多个，这里会返回一个列表。
5、 elem.findtext(path):获取指定路径子节点的内容，这个我们会经常使用。
6、 elem.get(key);获取属性的值。
7、上面如果没用，则返回none
8、 elem.append:添加自节点。
9、 elem.tag：返回tag值，也就是name。
10、 elem.text:返回内容。
11、 elem.attrib:返回属性的字典。
12、 SubElement：生成一个节点，自动添加为父节点的子节点。
13、 tostring：转化为xml文本字符串。但是不包括xml头。如果编码方式为UTF-8或者GB2312,gb2312都会产生xml头；如果是utf-8,则不会产生xml头
14、 fromstring：从字符串转化为ElementTree对象。和XML同样的功能。
15、 elem.set();设置属性值

time的使用：

1、 time.sleep()函数函数具有c下sleep函数功能，单位为秒，但是可以接受浮点数。这样可以表示毫秒。
2、 ti = datetime.datetime.now()可以显示当前的时间，包括当前的微秒也可以显示出来。两个的差值可以表示时间的间隔：microsecondLong = timeLong.seconds * 1000000 + timeLong.microseconds。差值的成员是seconds和microseconds
3、

OO的使用：

1、如果不想让成员变量或者方法被外部使用（也就是private特性），可以以__双下划线开通。
2、属性不但可以定义在init中，也可以定义在任意的方法中通过self定义。不过最好在init中定义。
3、 Python也可以实现抽象基类，也就是接口
5、 __call__(魔法方法)可以将对象作为函数来调用。给它一个入参就可以。:4、 __str__属性可以将对象转换为字符串，也就是调用print(object)是会打印的字符串。
def __call__(self, protoVer):
return api.protoModules[protoVer].TimeTicks(
(time.time()-self.birthday)*100
)
它的作用：比较常用的是作为回调，因为他可以保存状态信息。它和闭包类似，可能比闭包的可读性要好一点。
6、对象实例是否可以删除？
7、 Python参考手册要好好看一下。
8、 python的static方法使用的是装饰器语法：@staticmethod.
9、对类的调用还有一个方法：CALSS.method(object)。
10、子类中，如果想调用父类的方法，可以通过：
parent.method(self).
不过还有更好的方法：
super(child, self).foo()//注意：这里是根据子类的类型获取父类的方法。它的好处是不用明显给出基类的类型。
11、 cls：类方法的第一个参数。通常表示类的类型，可以通过cls()来生成实例。
a) @classmethod
b) def spawn(cls, *args, **kwargs):
c) """Return a new :class:`Greenlet` object, scheduled to start.
d)
e) The arguments are passed to :meth:`Greenlet.__init__`.
f) """
g) g = cls(*args, **kwargs)
h) g.start()
i) return g

12、继承，如果子类定义了__init__函数，子类的init函数不会默认调用父类的init函数，需要手动调用：parent.__init__。这一点是和c++有区别的。如果子类没有定义__init__，则子类会调用父类的__init__。这里可以发现，其实，子类如果定义了init函数，是对父类的init的一个覆盖。
13、 super注意：！！！它只能用在新式的类定义中。什么是新式的？原来只是基类定义时继承object！！！。
14、继承如何继承方法：只要继承一个类，就会继承这个类所有的方法，包括__init__,__del__。但是如果子类重写某方法，就会覆盖父类的方法，不会再调用父类的方法了。如果想调用父类的方法，可以通过super的方式调用。
15、继承如何继承属性：只要不覆盖父类__init__方法，或者调用了父类的__init__方法，就会继承父类__init__属性的方法。继承后也可以更改这些属性。
16、父类如何防止被继承：方法或者属性以__开头，则可以防止被继承。
17、根据我的经验，其实可以以一种本质的方式理解Python的继承：Python的类就是一些方法的集合，继承一个类就是继承这个类的所有的方法。如果在子类中定义一个方法，其实是更改了这个类的符号。而属性，则可以在所有的方法中定义，只要调用了定义属性的方法，调用父类，则是继承父类的属性，调用子类定义属性的方法，则是定义子类的方法。
18、 property：
a) class c(object):
b) def __init__(self):
c) self._num = 1
d) @property
e) def num(self):
f) return self._num * 10
g) @num.setter
h) def num(self, v):
i) self._num = v
j) @num.deleter
k) def num(self):
l) pass
m) o = c()
n) print(o.num)
o) o.num = 20
p) print(o.num)
q) 这样的好处是，可以在操作属性时，不用显示为方法调用，更加可读。同时又可以统一入口。：注意，它也必须继承object才可以。
19、 OO中的垃圾回收：Python的垃圾回收使用的是符号引用计数。那么，如果在一个函数中申请一个对象，然后返回它的一个属性或者方法，这个时候对象的符号引用已经去掉，对象是否会释放？
a) class child(parent):
b) def __init__(self):
c) self.i = 8888
d)
e) def foo(self):
f) print('-----------------------')
g)
h) def __del__(self):
i) print('now in del child')
j) super(child, self).__del__()
第一种情况，返回的是属性
k) def refun():
l) o = child()
m) return o.i
n) I = refun()
o) 这个时候，对象o会马上释放。因为o.i其实就是一个对象的引用，和o没有关系
第二种情况，返回的是方法
a) def refun():
b) o = child()
c) return o.foo
d) foo = refun()
e) 这个时候，对象o要等到foo释放的时候再释放，因为foo中包含了o的引用（foo的入参self）
20、对于对象的属性，如果属性是可读写的，则第一步没有必要用@property修饰。可以直接使用。后面如果有需要，在进行修饰。这样既减少了工作，修改时，也不会对原有代码进行改动。

模块的使用：

1、如果不想将模块的某些函数和变量被别的模块使用，可以以单下划线开头。这样import *是没有的，但是使用import mode，然后mode._fun仍然可以调用。在class中是以双下划线开头的。
2、使用from。。。import导入的符号，应该是本地符号，更改的话，无法更改模块中的值。可以通过mode.name=来修改。
3、 __init__.py的作用：可以这样理解：包也是一个对象，这个py就是这个包的构造函数。导入这个包，就会自动的执行__init__.py。如果在这个py中导入其他符号，import 这个包并且加*也会导入这个符号。
4、 import *无法导入模块中以_开头的符号。但是，不用*是可以的。
5、 import的本质也是创建一个符号，指向一个对象的引用。这个符号和被import的模块的符号是没有关系的。和c的extern不一样。extern可以更改变量的值，但是，这在Python中是不可以的。
from srctest import itest, outitest, setitest
import srctest
# itest = 9#这个地方其实改变的是本模块中符号的引用，无法更改srctest中对应符号。
#srctest.itest = 9#这个可以更改srctest中的itest
setitest(9)#这个可以更改srctest中的itest，但是改变不了当前模块的itest，也就是，这种设置是无法同步的。
print(itest)#打印当前模块的itest
printitest()#打印srctest中的itest
Python的设计哲学：看似不方便的背后，其实有Python的设计哲学。便捷性很多时候都是模块性的大敌。在软件开发中，模块间的最短路径未必是最合理路径，而且往往是最不合理路径。它会破坏软件原有的交互原则。
Python这样设计的理由应该是，尽量将数据和对数据的操作放在一起。如果数据会扩散，那么，就将数据设计为只读的。这样有助于提高程序模块的内聚性（全局变量是内聚性的大敌），降低耦合性。降低程序的复杂性（数据只读，调试根据方便）。

srctest.itest是可以改变itest的值的，说明我们可以通过改变这个对象的属性来改变对象（模块也是对象）。
可能有一点小题大做。
6、两个模块不可以双向import。那万一两个模块都要互相调用对方怎么办？Python的设计哲学告诉你，这不是一个好的实践，所以这样不行。应该怎么弄？一个模块调用另外一个模块，如果被调用模块想调用调用模块的方法，通过回调的形式。这样可以保证，模块间的连接都是单向的。

日志的使用：

1、日志的标准模块logging基本可以满足我的工作。
2、设置log的初始化工作：
logging.basicConfig(
filename = "test.log",
format = "[%(asctime)s-%(levelname)s] %(message)s [%(filename)s,%(lineno)d]",
level = logging.INFO,
datefmt = "%F %T")
3、除此之外，一个比较强大的功能就是过滤功能：可以针对级别，文件，行号等等很多的东西进行过滤。
4、

自省的使用：

1、 type()可以查看对象的类型。这就是自省。也就是可以看看自己是什么类型。这个功能在动态语言中非常有用。
2、 getattr函数：这是个非常有用的函数，它可以根据字符串，从模块，类，对象实例中获取属性和方法的应用并且调用。这个功能非常类似于c语言的函数指针，以及c++中的成员函数的指针。
1）从模块中获取函数和成员
import testfun
tf = getattr(testfun, 'test')
tstr = getattr(testfun, 'str')
2）从类中获取属性和方法
class test():
tst = 2
def __init__(self):
self.abc = 1
def method(self):
print('in test.method', self)
def __test(self):
print('in test')
tm = getattr(test, 'method’)#获取类方法method函数指针。因为没有实例，所以调用必须用下面的方法：
t = test()
tm(t)#申请一个实例，并且作为第一个参数传进去。
tm = getattr(test, '__test’)#这里会报错，也就是无法获取私有方法。
tabc = getattr(test, 'abc’)#这是错误的。无法获取。
ttst = getattr(test, 'tst’)#这是可以的。。

3）从对象实例中获取属性和方法
t = test()
tm = getattr(t, 'method')
tm()#可以这样调用，而不用传入t实例。
tabc = getattr(test, 'abc’)#可以获取实例的属性。
3、 callable：函数表示某个对象是否可以调用。它和getattr结合起来，可以获取一个对象中的所有的method列表：
methods = [method for method in dir[object] if callable(getattr(object, method))]
4、自省也叫放射。
5、 exec(‘print “test”‘)：可以执行字符串代码。这个特性有助于动态执行代码，可以用于机器学习，自动生成代码。
exec的参数可以使一个打开的文件对象，string，code object。
code object可以通过函数
类似的方法：execfile(filename[, globals[, locals]])。
6、可以更改类的方法，将它指向一个新的方法。如下：
a) class ctest():
b) def test(self):
c) print('c test test')
d) def testfun():
e) print('test fun !')
f) c = ctest()
g) c.test = testfun
h) c.test()
对象c的方法test被替换为新的方法：testfun。这个特性有助于根据动态的代码实现，但是往往会增加代码的透明性。
类似的，setattr也可以实现这样的功能。delattr可以删除属性。
setattr(c, 'test', testfun)
delattr(c, 'test')
c.test()#这里调用的其实就是ctest的test方法。也就是说，delattr会首先删除setattr设置的属性，如果在调用一次delattr，才会删除c的test方法。但是如果多调用几次setattr，也只要调用一次delattr即可删除。所以，要删除一个方法，最多调用两次delattr。
这个特性可以用于动态更改代码。也可用于补丁。
setattr无法对Python的c扩展模块进行操作。
7、如何判断一个变量是否存在：
‘v’ in dir()
‘v’ in locals.key()

配置文件读取的使用：

1、使用模块ConfigParser。实例如下：
conf = ConfigParser()
conf.read("snmp_agent.ini")

print(conf.get("main", "log_level"))
print(conf.getint("main", "ne_agent_port"))
print(conf.get("main", "ne_agent_qip"))

异常的使用：

1、尽量少用。它会使程序难以理解，而且还会发生不可预知的情况，比如异常的发生使程序的状态变为一个未知状态。
2、可以寻找替代方案。
3、程序非常重要，不可以停止，可以在主循环包装在异常处理中运行。
4、打印出异常的信息，供后面的定位：log.error(traceback.format_exc())
5、 raise在引发异常的时候，可以传递引发一场的额外数据。形式如下：
raise Exception, 1
捕获方法：
except CallExit, e:
e就是那个额外数据1。（但是奇怪的是它的类型不是1）
6、如何捕获一个异常，进行处理，然后在把它抛出：
except :
for flet in fletList:
flet.throw()
info = sys.exc_info()
raise info[0], info[1], info[2]
7、如何使用异常才是Pythonic的做法？这个要看一下。

类型系统

1、类型也是对象。比如：inttype = int,然后，n = inttype(‘256’)，这样可以把字符串转化为int值。
2、另外，是否可以把字符串转化为关键字，或者对象？比如，一个变量，abc,是否可以通过’abc’来引用？

OS的使用

os中有很多可以直接利用的东西，比如，判断文件是否存在，删除文件等。这样可以不用再执行shell命令。
os.rremove(path):删除文件
os.system(‘ls’);执行shell命令

文件的使用

1、打开使用函数open，模式和linux c类似。有一个不同的地方时，可以选择，直接操作磁盘还是操作内存。
2、 readline可以读取一个文件的一行。
3、 readlines：返回每一个列的列表。对应writelines。
4、文件迭代器：
f = open(‘fliename’)
for line in f:
process(line)
f.close()
或者更简洁的：
for line in open(filename):
process(line)
5、文件迭代器的使用：
如果文件很大，readlines可能会占用过多的内存。所以，Python提出一种类似于惰性求值的惰性迭代。
有两种方案：fileinput和文件迭代器：
import fileinput
for line in fileinput.input(filename)
process(line)
文件迭代器：
f = open(filename)
for line in f:
process(line)
6、如何判断文件是否存在：
import os
os.path.isfile('/home/keepshell')
os.path.exists('/home/keepshell')
7、如何判断目录是否存在：
import os
os.path.isdir('/home')
os.path.exists('/home')

数据库的使用

1、数据库中的字段使用的utf8格式编码，但是读取出来却是问号。这个问题的解决可以通过在查询的时候指定编码方式来解决，只要执行sql语句：Query_Execsql(pdb, "SET NAMES 'utf8'");
注意，这个需要在连接后马上进行。并且，在其他的操作中，会一直使用这种编码。除非再次更改。
2、 fetchone()：返回一条记录。fetchall()：返回所有的记录。
3、可以使用一个简单的方法获取所有的记录：
cur.execute(sql)
for tel, name, pwd in cur:
print tel, name, pwd

FTP的使用

Python的标准模块ftplib就可以支持FTP。
几个函数：
FTP(host='', user='', passwd='', acct='', timeout=_GLOBAL_DEFAULT_TIMEOUT)：如果参数中有user，则Connect();如果同时也有user，则login()。如果没用这些参数，后要自己调用connect和login。
connect(self, host='', port=0, timeout=-999):如果端口不是标准端口，则要手动调用connect。
login(user = '', passwd = '', acct = ''):登陆。
pwd():获得当前的工作路径。
cwd(path):更改当前的工作路径。
dir(path,cb):显示目录中的内容。cb为文件的处理函数。会传递给retrlines。这个函数可以获取一个目录下的所有的内容。
retrlines(self, cmd, callback = None):下载文本文件。cmd的形式为“RETR FILENAME”，callback是一个函数，要处理文本文件的每一个行。这里一个问题，如果直接用file的write方法，则会丢失换行符。而又没有writeline函数。
retrbinary(self, cmd, callback, blocksize=8192, rest=None):下载二进制文件，cmd的形式为“RETR FILENAME”，callback是一个函数，要处理文本文件的每一个块。默认大小事8k，但是可以更改。
storlines(self, cmd, fp, callback=None):上传文本文件。cmd的形式为“STOR FILENAME”。fp是一个文件对象，必须有readline方法。callback：每传送一行，就会调用这个函数。
storbinary(self, cmd, fp, blocksize=8192, callback=None, rest=None): 上传二进制文件。cmd的形式为“STOR FILENAME”。fp是一个文件对象，必须有read(num_bytes)方法。默认大小事8k，但是可以更改。
quit():退出。

字节的使用

1、 ord：可以见字符转化为int类型的值。
2、 chr：ord的方向操作。可以见int类型值转换为字符。

字符编码的使用

1、 encode是将Unicode转化为str，decode是将字符串转化为Unicode。所以，一个字符串要转化为另一种格式可以：
s = ‘中文’
s.decode(fromcodec).encode(tocodec)
也可以直接使用：s.encode(tocodec)。这个时候，相当于默认调用了decode，并且使用的是默认的编码方式。

源码安全

1、 Python代码如果直接发布，可能会暴露源码。
2、一个方法是利用c扩展Python，来代替核心模块。
3、另一个折中的方法就是对源码进行编译，生成pyc或者pyo文件。这些事字节码文件。可能会被反编译。所以，可能需要研究一下Python的pyo生成和加载方式，来生成更安全的Python字节码。网上说可以修改Python源码的opcode。没有研究过。
4、命令：python -m compileall。
5、也可以在Python中使用：
a) import compileall
b)
c) compileall._dir('Lib/', force=True)
d)
e) # Perform same compilation, excluding files in .svn directories.
f) import re
g) compileall._dir('Lib/', rx=re.compile('/[.]svn'), force=True)
h)

GC

1、 OO中的垃圾回收：Python的垃圾回收使用的是符号引用计数。那么，如果在一个函数中申请一个对象，然后返回它的一个属性或者方法，这个时候对象的符号引用已经去掉，对象是否会释放？
a) class child(parent):
b) def __init__(self):
c) self.i = 8888
d)
e) def foo(self):
f) print('-----------------------')
g)
h) def __del__(self):
i) print('now in del child')
j) super(child, self).__del__()
第一种情况，返回的是属性
k) def refun():
l) o = child()
m) return o.i
n) I = refun()
o) 这个时候，对象o会马上释放。因为o.i其实就是一个对象的引用，和o没有关系
第二种情况，返回的是方法
f) def refun():
g) o = child()
h) return o.foo
i) foo = refun()
j) 这个时候，对象o要等到foo释放的时候再释放，因为foo中包含了o的引用（foo的入参self）
k)
2、如果两个对象交叉引用，是否会自动回收？不会。同样，如果一个对象把生成的对象赋值给它自身的一个属性，那么它也不会自动回收。
3、

c扩展

1、可以使用swig来创建c 的扩展程序，非常方便。目前没有时间研究内部机制，先暂时使用，后面在研究吧。
2、 swig使用步骤：为库的头文件建立.i文件：
%{
/* Includes the header in the wrapper code */
#include "code.h"
#include "sip.h"
%}

/* Parse the header file to generate wrappers */
%include "code.h"
%include "sip.h"
3、使用swig命令生成py脚本及对应的C文件：swig –python sip.i。
4、将生成的c源文件放到c扩展库中进行编译。
5、这里有一个要注意：生成的动态链接库，必须是_sip.so，否则无法调用。swig是写死的。_sip.so需要拷贝到： /usr/local/lib/python2.7/site-packages/路径下。
6、 Makefile文件中，对于库引用的其他的库，必须显示的指出，否则Python无法找到对应的库。
7、如何在c的扩展库中调用Python的函数：
swig是不支持直接在c的扩展库中调用Python函数的。它只支持将C的接口作为回调函数设置给c的库。
实现这个功能需要利用Python的c API和ctypes来实现。
Python c 的api包含一系列的函数：
PyCallable_Check：检查对象是否可调用；
PyArg_ParseTuple：解析参数列表，将Python参数解析为c；
PyEval_CallObject：调用对象；
Py_BuildValue：将c变量打包为Python的参数对象。
好了，有这些就足够了。
假设c库中有一个设置回调函数接口：
void set_callback_fun(void (*fun)(int, int , int))
{
}
下面是c扩展库中要添加的代码：
//全局变量，保存Python中要回调的可调用对象。
static PyObject *gCallbackFun = NULL;

//调用上面函数设置的python脚本函数
//Python可调用对象的转换函数，转化为C的调用方式
static void callbacfun(int type,int chn,int dataType)
{
PyObject* pArgs = NULL;
PyObject* pRetVal = NULL;
int nRetVal = 0;

pArgs = Py_BuildValue("(i, i, i)", type, chn, dataType);//将c的参数转化为Python的参数对象
pRetVal = PyEval_CallObject(gCallbackFun, pArgs);//调用Python的可调用对象。
Py_DECREF(pArgs);
Py_DECREF(pRetVal);
}

/// set_callback_fun函数的包装函数
static PyObject *wrap_set_callback_fun(PyObject *dummy, PyObject *args)
{
PyObject *temp = NULL;

if (PyArg_ParseTuple(args, "O:set_callback_fun", &temp)) {//获取Python对象
if (!PyCallable_Check(temp)) {//检查对象是否可以调用
PyErr_SetString(PyExc_TypeError, "parameter must be callable");
}
Py_XINCREF(temp); /* Add a reference to new callback */
Py_XDECREF(gCallbackFun); /* Dispose of previous callback */
gCallbackFun = temp; /* 保存回调对象 */
}

set_callback_fun(callbacfun);//注意，这里掉一下包，用一个C的函数注册到c库中。

return Py_BuildValue("i", (gCallbackFun == NULL) ? 0 : 1);
}

注意：如果对象不可调用，会段错误。后面要解决一下。

Python代码：
CBFUNC = CFUNCTYPE(c_int, c_int, c_int, c_int)//创建一个c函数类型的对象工厂，该函数返回值为int，有三个入参，都为int。
callbakFunc = CBFUNC(pyFun)//根据Python可调用对象生成函数。
set_callback_fun(callbakFunc)//设置回调函数
注意：pyFun必须要有返回值。否则会报异常。
另外，我发现，不用CFUNCTYPE来生产c回调函数，直接用pyFun，也是可以的。至于区别，后面在研究一下吧，要写代码了。
几个异常问题：1、一个可以使用CFUNCTYPE，但是一个一使用它就段错误。2、回调函数可以不返回值，也是可以的。但是一个不返回就不可以。
在Python中使用c扩展时向C传递数组：

8、如果一个函数的参数是一个数组（指针），Python如何传递？下面的方法是可以直接传递列表。把这个加到.i文件中。
%{
static int convert_darray(PyObject *input, int *ptr, int size) {
int i;
if (!PySequence_Check(input)) {
PyErr_SetString(PyExc_TypeError,"Expecting a sequence");
return 0;
}
if (PyObject_Length(input) != size) {
PyErr_SetString(PyExc_ValueError,"Sequence size mismatch");
return 0;
}
for (i =0; i < size; i++) {
PyObject *o = PySequence_GetItem(input,i);
if (!PyFloat_Check(o)) {
Py_XDECREF(o);
PyErr_SetString(PyExc_ValueError,"Expecting a sequence of floats");
return 0;
}
ptr[i] = PyFloat_AsDouble(o);
Py_DECREF(o);
}
return 1;
}
%}
%typemap(in) int [ANY](int temp[$1_dim0]) {
if (!convert_darray($input,temp,$1_dim0)) {
return NULL;
}
$1 = &temp[0];
}
9、如果一个结构体中有一个int类型数组，应该如何赋值？
在.i中增加下面代码：
%include "carrays.i"
%array_class(int, intArray);
在Python中申请数组：
a = intArray(10)，将A复制给数组成员即可。

代码错误检查

1、今天遇到两个问题：
a) 类中方法：class _registerEvent(notifyEvent): def _sendRegRsp(self, voiceres, reqId, result, reason,status):，调用时参数个数少一个：self._sendRegRsp(voiceres, reqId, 'success', 'normal') 。结果是没有任何提示，并且，不知道调用了什么函数。这个问题有点匪夷所思。后面好好查看一下。
b) 抽取函数后，有时忘了返回值，当时却用到了返回值：
i. def createWirelessSdp(voiceRtpPort, voiceTbcpPort):
ii. voicesdp = SIP_SDP()
iii. voicesdp.a_use = 1
iv. sdp = createWirelessSdp(1000,2000)
v. 结果也是没有任何提示，sdp为None。

2、总结：写Python代码，需要使用代码检查工具，比如，pylint等。后面引进一下。

程序运行

1、如何获取命令行参数：
a) import sys
b)
c) print(sys.argv[1])
d) sys.argv[1]就是第一个参数。0是脚本的名称。
2、

关于性能

1、 timeit：可以统计程序的运行时间。目前没有时间，抽时间好好看看。
timeit(cut1, number=10000)：cut1是函数名，number是执行次数。
2、 pypy可以将Python代码翻译为可执行程序，它的效率可以提高4倍左右。但是，内存的占用可能会很大。（没有试过。）
3、

其他：

1、脚本语言的进程名称显示为：python ，如果一个服务器上有多个进程，那么将不易发现那个进程是哪个程序。可以使用第三方开源的库来解决这个问题：setproctitle.
from setproctitle import setproctitle,getproctitle
print('当前的进程名：%s' % getproctitle())
setproctitle('proctitle')
print('设置后的的进程名：%s' % getproctitle())
2、 with语法：with open(‘file’, ‘r’) as f:
code
可以是try的另一种形式。
可以执行with操作的类型：
file
decimal.Context
thread.LockType
threading.Lock
threading.RLock
threading.Condition
threading.Semaphore
threading.BoundedSemaphore
3、产生随机数：random.randint(100000, 999999)
4、回调函数的使用：设置回调函数的时候，很多时候要使用闭包。避免闭包的一个方法是：
a) def setCancelFun(cancelFun, *args, **kwargs):
b) '''如果为None表示删除取消函数, 后面跟的是cancel函数的参数。这样可以避免上面创建闭包。'''
c) global _cancelFun,_cancelArgs,_cancelKwargs
d) _cancelFun = cancelFun
e) _cancelArgs = args
f) _cancelKwargs = kwargs
g)
h) def __execCancelFun():
i) '执行取消操作。因为在throw和kill的时候会执行此函数，所以，暂时没有看到会在外面调用此函数。屏蔽后，接口的简单性会提高'
j) global _cancelFun,_cancelArgs,_cancelKwargs
k) if callable(_cancelFun):
l) _cancelFun(*_cancelArgs, **_cancelKwargs)
m) _cancelFun = None#防止重复调用
n)
o) def test(a, b, c):
p) print('--------test:', a,b,c)
q)
r) setCancelFun(test, 1, 2, 3)
s) __execCancelFun()
也就是增加可变参数。

Python：一切皆符号？

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航