Python, 自学小白要摸索它的String ...
2013-07-26 21:37
246 查看
这周开始接触python, 之前一直用ruby , 突然的转变 让我有窃喜的感觉.
----
先从string处理开始吧. 做字符串需要 了解
>> 有的时候 u'safkdasfj' 有的时候直接就用 'asldfjaslkf' 这是什么原因?
字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。
代码中字符串的默认编码与代码文件本身的编码一致。
如:s='中文'
如果是在utf8的文件中,该字符串就是utf8编码,如果是在gb2312的文件中,则其编码为gb2312。这种情况下,要进行编码转换,都需要先用decode方法将其转换成unicode编码,再使用encode方法将其转换成其他编码。通常,在没有指定特定的编码方式时,都是使用的系统默认编码创建的代码文件。
如何获得系统的默认编码?
#!/usr/bin/env python
#coding=utf-8
import sys
print sys.getdefaultencoding()
在我的输出为:ascii (不标头文件)
# 将一字符串指定为unicode
如果字符串是这样定义:s=u'中文'
则该字符串的编码就被指定为unicode了,即python的内部编码,而与代码文件本身的编码无关。因此,对于这种情况做编码转换,只需要直接使用encode方法将其转换成指定编码即可。
如果一个字符串已经是unicode了,再进行解码则将出错,因此通常要对其编码方式是否为unicode进行判断:
isinstance(s, unicode) #用来判断是否为unicode
用非unicode编码形式的str来encode会报错
# 好用的raw string 原生字符串
很简单 在字符串前面加上r
如 r'\t\]n\n\n\n\n\n\n' 这些 斜杠不会作为转义了. 因为前面有r的关系.
----
先从string处理开始吧. 做字符串需要 了解
>> 有的时候 u'safkdasfj' 有的时候直接就用 'asldfjaslkf' 这是什么原因?
字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。
代码中字符串的默认编码与代码文件本身的编码一致。
如:s='中文'
如果是在utf8的文件中,该字符串就是utf8编码,如果是在gb2312的文件中,则其编码为gb2312。这种情况下,要进行编码转换,都需要先用decode方法将其转换成unicode编码,再使用encode方法将其转换成其他编码。通常,在没有指定特定的编码方式时,都是使用的系统默认编码创建的代码文件。
如何获得系统的默认编码?
#!/usr/bin/env python
#coding=utf-8
import sys
print sys.getdefaultencoding()
在我的输出为:ascii (不标头文件)
# 将一字符串指定为unicode
如果字符串是这样定义:s=u'中文'
则该字符串的编码就被指定为unicode了,即python的内部编码,而与代码文件本身的编码无关。因此,对于这种情况做编码转换,只需要直接使用encode方法将其转换成指定编码即可。
如果一个字符串已经是unicode了,再进行解码则将出错,因此通常要对其编码方式是否为unicode进行判断:
isinstance(s, unicode) #用来判断是否为unicode
用非unicode编码形式的str来encode会报错
# 好用的raw string 原生字符串
很简单 在字符串前面加上r
如 r'\t\]n\n\n\n\n\n\n' 这些 斜杠不会作为转义了. 因为前面有r的关系.
相关文章推荐
- 【小白自学笔记】【机器学习实战】【Python代码逐行理解】CH02
- Python自学之String
- 小白自学Python3爬虫
- 一个小白的转行自学Python的经历
- Python->String->translate
- Python小白学习之路(十五)—【map()函数】【filter()函数】【reduce()函数】
- leetcode String to Integer (atoi) python
- python实现字典(dict)和字符串(string)的相互转换方法
- python_string常用函数用法小结
- python string字符串的8种连接方式
- python小白-day9 数据库操作与Paramiko模块
- python的string模板
- python中string和Unicode的区别
- Python 字符串操作(string替换、删除、截取、复制、连接、比较、查找、包含、大小写转换、分割等)
- Python中的string模块详解——string的中文API文档
- scrapy怎么设置带有密码的代理ip base64.encodestring不能用 python3.5,base64库里面的encodestring()被换成了什么?
- Python 字符串操作(string替换、删除、截取、复制、连接、比较、查找、包含、大小写转换、分割等)
- Python实现string字符串连接的方法总结【8种方式】
- Python自学之路第十三步——修改属性的值
- Python 字符串操作(string替换、删除、截取、复制、连接、比较、查找、包含、大小写转换、分割等)