您的位置:首页 > 编程语言 > Python开发

Python, 自学小白要摸索它的String ...

2013-07-26 21:37 246 查看
这周开始接触python, 之前一直用ruby , 突然的转变 让我有窃喜的感觉.

----

先从string处理开始吧. 做字符串需要 了解

>> 有的时候 u'safkdasfj' 有的时候直接就用 'asldfjaslkf' 这是什么原因?

字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。

代码中字符串的默认编码与代码文件本身的编码一致。

如:s='中文'

如果是在utf8的文件中,该字符串就是utf8编码,如果是在gb2312的文件中,则其编码为gb2312。这种情况下,要进行编码转换,都需要先用decode方法将其转换成unicode编码,再使用encode方法将其转换成其他编码。通常,在没有指定特定的编码方式时,都是使用的系统默认编码创建的代码文件。

如何获得系统的默认编码?

#!/usr/bin/env python

#coding=utf-8

import sys

print sys.getdefaultencoding()

在我的输出为:ascii (不标头文件)

# 将一字符串指定为unicode

如果字符串是这样定义:s=u'中文'

则该字符串的编码就被指定为unicode了,即python的内部编码,而与代码文件本身的编码无关。因此,对于这种情况做编码转换,只需要直接使用encode方法将其转换成指定编码即可。

如果一个字符串已经是unicode了,再进行解码则将出错,因此通常要对其编码方式是否为unicode进行判断:

isinstance(s, unicode) #用来判断是否为unicode


用非unicode编码形式的str来encode会报错

# 好用的raw string 原生字符串

很简单 在字符串前面加上r

如 r'\t\]n\n\n\n\n\n\n' 这些 斜杠不会作为转义了. 因为前面有r的关系.
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: