python中BaseHTTPServer.py代码阅读分析
2014-10-11 10:50
363 查看
SocketServer.py中发生的事:
从tcp套接字讲起,在SocketServer中使用select.select去轮询server端口,timeout默认的是0.5s.如果发现该端口可读了,说明有请求到来了,不然就一直循环,直到按下“”终止组合键“”
接着:在TCPServer中调用accept,返回响应套接字,从此,request对象的“根”产生了!
拿到这个request,首先去调用verify_request函数验证ip是否符合要求(可以加一个黑白名单什么滴。。)
如果验证通过--》调用process_request函数去处理请求。
process_request函数,对于ThreadingTCPServer或者ForkingTCPServer(混入ThreadingMixin或者ForkingMixin)来说,就是去建立新的线程或者进程,在新的线程或者进程中去执行finish_request完成这个请求
TCPServer本身没有实现这个方法,因为TCPServer本来就是Server,为什么要去实现呢,那是handler需要做的。
接着finish_request函数:
生成一个(TCPHandler)对象,参数就是这个响应套接字地址,address,和self,这个self就是本server对象嘛。
然后就可以去分析TCPHandler了
SocketServer.py中有一个StreamRequestHandler,给了一个模板。这个StreamRequestHandler继承了BaseRequetHandler。
BaseRequestHandler其实没做什么事,在__init__方法中简单的把参数记录到这个handler实例中去,然后setup--》handle--》finish
在StreamRequestHandler中关掉了nagle(TCP默认会开启拥塞控制,减少通讯量,关闭后,每个产生的包会被发送),调用makefile,建立socket的读写文件描述符(rfile和wfile)。在mimetools.Message中,要直接用fp来做参数。。
handle就是要需要被继续覆盖下去的方法,为什么呢,谁也不知道要返回什么东西。
下面是BaseHttpServer中发生的事。
BaseHttpServer主要两个类,HTTPServer和BaseHTTPRequestHandler。
HTTPServer没做什么重要事,继承一下,改名换姓,TCPServer就成了HTTPServer,因为Server的任务不就是一直等Request对象么。。(傻瓜一样的每秒两次select...)
重点是BaseHTTPRequestHandler..因为继承了StreamRequestHandler,所以关于接口的事就是去覆盖handle方法:
对于HTTP协议来说,常见的版本是1.1,不常见的是1.0,很不常见的有0.9,奇葩的是大于1.1的。碰到大于1.1,不应该是正常的浏览器会产生的行为吧。。
HTTP0.9很简单:请求 command path,返回status msg 。
1.0和1.1主要区别在于1.0是会对于url发送一次tcp请求,1.1会在一个tcp链接中传送多个HTTP请求,增加了效率。
继续覆盖handle方法:
BaseHTTPRequestHandler方法主要做的事就是分析请求行中的HTTP协议版本号返回414,400,505.错误。
并调用"do_"+command方法
值得提一下的是这个类提供了send_response,send_hander,end_header,方法。如果想要覆盖掉自带的Server的话,覆盖version_string函数。
从tcp套接字讲起,在SocketServer中使用select.select去轮询server端口,timeout默认的是0.5s.如果发现该端口可读了,说明有请求到来了,不然就一直循环,直到按下“”终止组合键“”
接着:在TCPServer中调用accept,返回响应套接字,从此,request对象的“根”产生了!
拿到这个request,首先去调用verify_request函数验证ip是否符合要求(可以加一个黑白名单什么滴。。)
如果验证通过--》调用process_request函数去处理请求。
process_request函数,对于ThreadingTCPServer或者ForkingTCPServer(混入ThreadingMixin或者ForkingMixin)来说,就是去建立新的线程或者进程,在新的线程或者进程中去执行finish_request完成这个请求
TCPServer本身没有实现这个方法,因为TCPServer本来就是Server,为什么要去实现呢,那是handler需要做的。
接着finish_request函数:
生成一个(TCPHandler)对象,参数就是这个响应套接字地址,address,和self,这个self就是本server对象嘛。
然后就可以去分析TCPHandler了
SocketServer.py中有一个StreamRequestHandler,给了一个模板。这个StreamRequestHandler继承了BaseRequetHandler。
BaseRequestHandler其实没做什么事,在__init__方法中简单的把参数记录到这个handler实例中去,然后setup--》handle--》finish
在StreamRequestHandler中关掉了nagle(TCP默认会开启拥塞控制,减少通讯量,关闭后,每个产生的包会被发送),调用makefile,建立socket的读写文件描述符(rfile和wfile)。在mimetools.Message中,要直接用fp来做参数。。
handle就是要需要被继续覆盖下去的方法,为什么呢,谁也不知道要返回什么东西。
下面是BaseHttpServer中发生的事。
BaseHttpServer主要两个类,HTTPServer和BaseHTTPRequestHandler。
HTTPServer没做什么重要事,继承一下,改名换姓,TCPServer就成了HTTPServer,因为Server的任务不就是一直等Request对象么。。(傻瓜一样的每秒两次select...)
重点是BaseHTTPRequestHandler..因为继承了StreamRequestHandler,所以关于接口的事就是去覆盖handle方法:
对于HTTP协议来说,常见的版本是1.1,不常见的是1.0,很不常见的有0.9,奇葩的是大于1.1的。碰到大于1.1,不应该是正常的浏览器会产生的行为吧。。
HTTP0.9很简单:请求 command path,返回status msg 。
1.0和1.1主要区别在于1.0是会对于url发送一次tcp请求,1.1会在一个tcp链接中传送多个HTTP请求,增加了效率。
继续覆盖handle方法:
BaseHTTPRequestHandler方法主要做的事就是分析请求行中的HTTP协议版本号返回414,400,505.错误。
并调用"do_"+command方法
值得提一下的是这个类提供了send_response,send_hander,end_header,方法。如果想要覆盖掉自带的Server的话,覆盖version_string函数。
相关文章推荐
- 代码阅读 - BaseHTTPServer.py
- Python标准库源码分析:BaseHTTPServer.py
- 代码阅读 - BaseHTTPServer.py
- python BaseHTTPServer.py
- chrome代码中base::JSONReader类的阅读分析(一)
- Python标准库源码分析:SocketServer.py**********************8
- Windows 10上修改Python 3.5的server.py,使得其http server脚本可以正确处理中文目录文件名
- 代码阅读 - SocketServer.py
- python 简单网站 以及sqlite 操作 BaseHTTPServer
- dumpheaders_http_threading_server.py脚本的Python 3.5迁移版
- 代码阅读 SocketServer.py
- Python Base HTTP Server
- UDPClient.py&UDPServer.py——我的第一行Python代码
- python client使用http post 到server端的代码
- 基于Python SimpleHTTPServer.py的修改脚本:HTTP文件服务器,修正中文目录列表,支持视频文件在线播放
- python源码分析阅读理解chapter01~05 (纯阅读书籍,代码未看)
- BaseHTTPServer与CGIHTTPServer源码分析 - 技术手札
- python client使用http post 到server端的代码
- socketserver.py代码阅读笔记