您的位置：首页 > 编程语言 > Python开发

python的一个html解析器 Beautiful Soup

2014-05-22 23:00 183 查看

在python世界里，并没有像php一样，封装很好很详细的函数，比如随手可用的array_diff,strip_tags,parse_url，一切都要重新造轮子，或者新安装插件。尽管一些低级别的功能Python没有统一的实现，但一些稍显得复杂的功能，却有一大批的开源贡献者，比如这个库：

Beautiful Soup

和我之前用的htmldom一样，都是python世界常用的html解析库。今天试用了一下，感觉很不错。功能都挺完善。

在线的wiki文档为：crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.

这篇文档介绍了BeautifulSoup4中所有主要特性,并切有小例子.让我来向你展示它适合做什么,如何工作,怎样使用,如何达到你想要的效果,和处理异常情况.

文档中出现的例子在Python2.7和Python3.2中的执行结果相同

你可能在寻找 Beautiful Soup3 的文档,Beautiful Soup 3 目前已经停止开发,我们推荐在现在的项目中使用Beautiful Soup 4, 移植到BS4

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： python Beautiful Soup

相关文章推荐

新的分享

章节导航