您的位置:首页 > 编程语言 > Python开发

Create Your Own Search Engine with Python (一)

2012-08-21 12:25 645 查看

Create Your Own Search Engine with Python

用python创建你自己的搜索引擎(一)

汗,忘了贴原地址 :http://www.zackgrossbart.com/hackito/search-engine-python/

在特定的网站上搜索你需要的网页,我想,这是一个非常有用的功能。然而,搜索系统不是那么简单,提供优质的搜索性能需要多种编程语言的知识。本文将演示一个简单的搜索引擎,它包含一个可以在你自己的网站上运行的简单应用。该应用也是python编程语言很好的入门教程。

这个应用是Python, JavaScript, CSS 和 HTML的结合。它可以在任何支持CGI和 PYTHON的服务器上运行。一些配置:Python版本为 2.5.1,Apache HTTP服务器, 而JavaScript 和 格式表单已经在IE,Firefox 和 Safari 上试过,保证可用。

这个应用的代码是免费的,根据Apache 2.0 license发布。也就是说欢迎你使用、拷贝和修改代码,一切随意。如果你发现了bugs,或有什么意见和建议,代码性能得到提升,我很高兴你能和我联系。另外还需要一些其它的程序来运行这个应用。它们也是免费的,不过有些使用的是不同的license。在使用这些产品之前,你应该阅读下这些license。

Setup

安装

Get the

SOURCE CODE

获取源代码(这部电影貌似挺赞的)

首先,你要下载源代码。下载地址here。下载好了,肯定就是解压什么的了,这个不用我解释了吧?

别的程序

这个搜索引擎程序是用python 解释器来运行的。所以,没有python?装个呗!安装了python才能使用这个这个程序。

本程序还可以在本地运行进行测试,只要个HTTP服务器就可以运行了。这个HTTP服务器支持CGI就可以运行程序,测试的话,就只能是Apache HTTP server

运行示例程序

只要你已经安装好python 和 Apache HTTP server,你可以根据以下步骤来运行了。过程中,会生成一个HTML文件,里面包含搜索的结果。你可以使用管道将这些输出到另一个文件,再用你的浏览器打开它。你可能需要把可执行的python添加到你的路径中,或是根据你的系统设置,给可执行的python指明完整的路径。

1
解压文件到某个目录。

2 打开一个命令行终端,改到你解压的目录下。

3 你可以运行这个命令python search.py > searchoutput.html 用于在本地测试。

这个应用程序已经配置好了,通过命令行接口运行可以很轻松地控制和测试。在web服务器上的配置会在后文中讲解。

核心技术

本程序的核心技术有:

§ Python

§ JavaScript

§ Cascading Style Sheets

§ HTML

这个应用程序是个有用的网站搜索引擎示例。也是python,CSS,javascript和html等内容很好的入门教程。它完整地展示了如何使用这三种技术(三种?)来创建一个有价值、可配置的用户接口,用于搜索你的应用程序。(原文直译成这样,好像不太通)

为什么是Python(让我想起了豆瓣上,为什么是python而不是ruby\php……的争论)

现在存在很多web脚本语言和工具。perl和ruby是最先映入脑海中的,但是还有很多很多可供选择。python是一种动态类型、面向对象的语言。和java相比,python可以改变对象的类型。python不同于java,它不需要把所有的代码都放到对象(或类)里面。如果不使用面向对象编程的话,python看上去更像个传统的脚本语言。

PERL有着独特的语法,比较难学,而ruby多半依赖于RAILS框架。它们都很流行,也可以轻松地用它们来实现这个应用程序。使用perl,ruby,python的争论一直在持续,我可不打算在这里介绍一遍。这个应用程序可以用任一种语言来实现。而python正好是我在写这个代码时最感兴趣的语言,所以 你懂的(豆瓣也差不多吧,一切都是巧合而成,而不是真的纠结于语言的那一点特性。)

下部分介绍工作原理和搜索算法的大致介绍。

http://www.zackgrossbart.com/hackito/search-engine-python/
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: