您的位置:首页 > 理论基础 > 计算机网络

HTTP协议

2015-08-17 16:54 337 查看
HTTP是一个客户端终端(用户)和服务器端(网站)请求和应答的标准(TCP)。通过使用Web浏览器、网络爬虫或者其它的工具,客户端发起一个HTTP请求到服务器上指定端口(默认端口为80)。我们称这个客户端为用户代理程序(user
agent)。应答的服务器上存储着一些资源,比如HTML文件和图像。我们称这个应答服务器为源服务器(origin server)。在用户代理和源服务器中间可能存在多个“中间层”,比如代理网关或者隧道(tunnel)。

尽管TCP/IP协议是互联网上最流行的应用,HTTP协议中,并没有规定必须使用它或它支持的层。事实上,HTTP可以在任何互联网协议上,或其他网络上实现。HTTP假定其下层协议提供可靠的传输。因此,任何能够提供这种保证的协议都可以被其使用。因此也就是其在TCP/IP协议族使用TCP作为其传输层。

通常,由HTTP客户端发起一个请求,创建一个到服务器指定端口(默认是80端口)的TCP连接。HTTP服务器则在那个端口监听客户端的请求。一旦收到请求,服务器会向客户端返回一个状态,比如"HTTP/1.1 200 OK",以及返回的内容,如请求的文件、错误消息、或者其它信息。

当访问者点击一个超链接的时候,将会给浏览器提交一个URL地址。通过这个URL地址,浏览器便知道去链接那个网站并去取得具体的页面文件(也可能是一张图片,一个pdf文件)。

最基本的过程是:

1 客户端请求连接服务器

2 服务器接收连接

3 客户端请求一个文件

4 服务器发送一个应答

下面我们以访问www.google.com为例来进行说明:

--------------------------------------------------------------------------
以下为Request Headers

GET http://www.google.com/ HTTP/1.1

Host: www.google.com

Proxy-Connection: keep-alive

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8

User-Agent: Mozilla/5.0 Chrome/44.0.2403.89

Accept-Encoding: gzip, deflate, sdch

Accept-Language: zh-CN,zh;q=0.8

Cookie: HSID=As649wYCc4kbatwHi;

我省略了Cookie的部分内容,我们可以看到

我们用HTTP1.1的协议获得http://www.google.com/ 的资源

主机是www.google.com

保持连接

接收到的资源有text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
客户端使用的chrome浏览器
浏览器能解释的编码格式有gzip, deflate, sdch
浏览器能解释的语言有zh-CN,zh;q=0.8
Cookie信息,用来记住用户

--------------------------------------------------------

以下为Response Headers

HTTP/1.1 302 Moved Temporarily

Location: https://www.google.com/?gws_rd=ssl
Cache-Control: private

Content-Type: text/html;

charset=UTF-8

Date: Mon, 17 Aug 2015 08:28:01 GMT

Server: gws

Content-Length: 231

Connection: close

------------------------------------------------------

HTTP的版本 返回状态 以及状态说明
资源转移后新的的URL
缓存不进行共享
资源的类型为文本类型的html
字符集为utf-8
时间
服务器为Google Web Serve
内容长度为231字节
最后一行连接状态为不保持连接,因为URL已经转移,所以没必要保持连接
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: