了解WWW服务与HTTP协议 【入门与应用】
2012-03-11 12:37
417 查看
轻松认识HTTP协议的概念和工作原理
当我们想浏览一个网站的时候,只要在浏览器的地址栏里输入网站的地址就可以了,例如:www.microsoft.com,但是在浏览器的地址栏里面出现的却是:http://www.microsoft.com,你知道为什么会多出一个“http”吗?
一、HTTP协议是什么
我们在浏览器的地址栏里输入的网站地址叫做URL(UniformResourceLocator,统一资源定位符)。就像每家每户都有一个门牌地址一样,每个网页也都有一个Internet地址。当你在浏览器的地址框中输入一个URL或是单击一个超级链接时,URL就确定了要浏览的地址。浏览器通过超文本传输协议(HTTP),将Web服务器上站点的网页代码提取出来,并翻译成漂亮的网页。因此,在我们认识HTTP之前,有必要先弄清楚URL的组成,例如:http://www.microsoft.com/china/index.htm。它的含义如下:
1.http://:代表超文本传输协议,通知microsoft.com服务器显示Web页,通常不用输入;
2.www:代表一个Web(万维网)服务器;
3.Microsoft.com/:这是装有网页的服务器的域名,或站点服务器的名称;
4.China/:为该服务器上的子目录,就好像我们的文件夹;
5.Index.htm:index.htm是文件夹中的一个HTML文件(网页)。
我们知道,Internet的基本协议是TCP/IP协议,然而在TCP/IP模型最上层的是应用层(Applicationlayer),它包含所有高层的协议。高层协议有:文件传输协议FTP、电子邮件传输协议SMTP、域名系统服务DNS、网络新闻传输协议NNTP和HTTP协议等。
HTTP协议(HypertextTransferProtocol,超文本传输协议)是用于从WWW服务器传输超文本到本地浏览器的传送协议。它可以使浏览器更加高效,使网络传输减少。它不仅保证计算机正确快速地传输超文本文档,还确定传输文档中的哪一部分,以及哪部分内容首先显示(如文本先于图形)等。这就是你为什么在浏览器中看到的网页地址都是以“http://”开头的原因。
自WWW诞生以来,一个多姿多彩的资讯和虚拟的世界便出现在我们眼前,可是我们怎么能够更加容易地找到我们需要的资讯呢?当决定使用超文本作为WWW文档的标准格式后,于是在1990年,科学家们立即制定了能够快速查找这些超文本文档的协议,即HTTP协议。经过几年的使用与发展,得到不断的完善和扩展,目前在WWW中使用的是HTTP/1.0的第六版。
二、HTTP是怎样工作的
既然我们明白了URL的构成,那么HTTP是怎么工作呢?我们接下来就要讨论这个问题。
由于HTTP协议是基于请求/响应范式的(相当于客户机/服务器)。一个客户机与服务器建立连接后,发送一个请求给服务器,请求方式的格式为:统一资源标识符(URL)、协议版本号,后边是MIME信息包括请求修饰符、客户机信息和可能的内容。服务器接到请求后,给予相应的响应信息,其格式为一个状态行,包括信息的协议版本号、一个成功或错误的代码,后边是MIME信息包括服务器信息、实体信息和可能的内容。
许多HTTP通讯是由一个用户代理初始化的并且包括一个申请在源服务器上资源的请求。最简单的情况可能是在用户代理和服务器之间通过一个单独的连接来完成。在Internet上,HTTP通讯通常发生在TCP/IP连接之上。缺省端口是TCP80,但其它的端口也是可用的。但这并不预示着HTTP协议在Internet或其它网络的其它协议之上才能完成。HTTP只预示着一个可靠的传输。
这个过程就好像我们打电话订货一样,我们可以打电话给商家,告诉他我们需要什么规格的商品,然后商家再告诉我们什么商品有货,什么商品缺货。这些,我们是通过电话线用电话联系(HTTP是通过TCP/IP),当然我们也可以通过传真,只要商家那边也有传真。
以上简要介绍了HTTP协议的宏观运作方式,下面介绍一下HTTP协议的内部操作过程。
在WWW中,“客户”与“服务器”是一个相对的概念,只存在于一个特定的连接期间,即在某个连接中的客户在另一个连接中可能作为服务器。基于HTTP协议的客户/服务器模式的信息交换过程,它分四个过程:建立连接、发送请求信息、发送响应信息、关闭连接。这就好像上面的例子,我们电话订货的全过程。
其实简单说就是任何服务器除了包括HTML文件以外,还有一个HTTP驻留程序,用于响应用户请求。你的浏览器是HTTP客户,向服务器发送请求,当浏览器中输入了一个开始文件或点击了一个超级链接时,浏览器就向服务器发送了HTTP请求,此请求被送往由IP地址指定的URL。驻留程序接收到请求,在进行必要的操作后回送所要求的文件。在这一过程中,在网络上发送和接收的数据已经被分成一个或多个数据包(packet),每个数据包包括:要传送的数据;控制信息,即告诉网络怎样处理数据包。TCP/IP决定了每个数据包的格式。如果事先不告诉你,你可能不会知道信息被分成用于传输和再重新组合起来的许多小块。
也就是说商家除了拥有商品之外,它也有一个职员在接听你的电话,当你打电话的时候,你的声音转换成各种复杂的数据,通过电话线传输到对方的电话机,对方的电话机又把各种复杂的数据转换成声音,使得对方商家的职员能够明白你的请求。这个过程你不需要明白声音是怎么转换成复杂的数据的。
了解WWW服务与HTTP协议
当我们想浏览一个网站的时候,只要在浏览器的地址栏里输入网站的地址就可以了,例如:www.microsoft.com,但是在浏览器的地址栏里面出现的却是:http://www.microsoft.com,你知道为什么会多出一个“http”吗?
一、HTTP协议是什么
我们在浏览器的地址栏里输入的网站地址叫做URL(UniformResourceLocator,统一资源定位符)。就像每家每户都有一个门牌地址一样,每个网页也都有一个Internet地址。当你在浏览器的地址框中输入一个URL或是单击一个超级链接时,URL就确定了要浏览的地址。浏览器通过超文本传输协议(HTTP),将Web服务器上站点的网页代码提取出来,并翻译成漂亮的网页。因此,在我们认识HTTP之前,有必要先弄清楚URL的组成,例如:http://www.microsoft.com/china/index.htm。它的含义如下:
1.http://:代表超文本传输协议,通知microsoft.com服务器显示Web页,通常不用输入;
2.www:代表一个Web(万维网)服务器;
3.Microsoft.com/:这是装有网页的服务器的域名,或站点服务器的名称;
4.China/:为该服务器上的子目录,就好像我们的文件夹;
5.Index.htm:index.htm是文件夹中的一个HTML文件(网页)。
我们知道,Internet的基本协议是TCP/IP协议,然而在TCP/IP模型最上层的是应用层(Applicationlayer),它包含所有高层的协议。高层协议有:文件传输协议FTP、电子邮件传输协议SMTP、域名系统服务DNS、网络新闻传输协议NNTP和HTTP协议等。
HTTP协议(HypertextTransferProtocol,超文本传输协议)是用于从WWW服务器传输超文本到本地浏览器的传送协议。它可以使浏览器更加高效,使网络传输减少。它不仅保证计算机正确快速地传输超文本文档,还确定传输文档中的哪一部分,以及哪部分内容首先显示(如文本先于图形)等。这就是你为什么在浏览器中看到的网页地址都是以“http://”开头的原因。
自WWW诞生以来,一个多姿多彩的资讯和虚拟的世界便出现在我们眼前,可是我们怎么能够更加容易地找到我们需要的资讯呢?当决定使用超文本作为WWW文档的标准格式后,于是在1990年,科学家们立即制定了能够快速查找这些超文本文档的协议,即HTTP协议。经过几年的使用与发展,得到不断的完善和扩展,目前在WWW中使用的是HTTP/1.0的第六版。
二、HTTP是怎样工作的
既然我们明白了URL的构成,那么HTTP是怎么工作呢?我们接下来就要讨论这个问题。
由于HTTP协议是基于请求/响应范式的(相当于客户机/服务器)。一个客户机与服务器建立连接后,发送一个请求给服务器,请求方式的格式为:统一资源标识符(URL)、协议版本号,后边是MIME信息包括请求修饰符、客户机信息和可能的内容。服务器接到请求后,给予相应的响应信息,其格式为一个状态行,包括信息的协议版本号、一个成功或错误的代码,后边是MIME信息包括服务器信息、实体信息和可能的内容。
许多HTTP通讯是由一个用户代理初始化的并且包括一个申请在源服务器上资源的请求。最简单的情况可能是在用户代理和服务器之间通过一个单独的连接来完成。在Internet上,HTTP通讯通常发生在TCP/IP连接之上。缺省端口是TCP80,但其它的端口也是可用的。但这并不预示着HTTP协议在Internet或其它网络的其它协议之上才能完成。HTTP只预示着一个可靠的传输。
这个过程就好像我们打电话订货一样,我们可以打电话给商家,告诉他我们需要什么规格的商品,然后商家再告诉我们什么商品有货,什么商品缺货。这些,我们是通过电话线用电话联系(HTTP是通过TCP/IP),当然我们也可以通过传真,只要商家那边也有传真。
以上简要介绍了HTTP协议的宏观运作方式,下面介绍一下HTTP协议的内部操作过程。
在WWW中,“客户”与“服务器”是一个相对的概念,只存在于一个特定的连接期间,即在某个连接中的客户在另一个连接中可能作为服务器。基于HTTP协议的客户/服务器模式的信息交换过程,它分四个过程:建立连接、发送请求信息、发送响应信息、关闭连接。这就好像上面的例子,我们电话订货的全过程。
其实简单说就是任何服务器除了包括HTML文件以外,还有一个HTTP驻留程序,用于响应用户请求。你的浏览器是HTTP客户,向服务器发送请求,当浏览器中输入了一个开始文件或点击了一个超级链接时,浏览器就向服务器发送了HTTP请求,此请求被送往由IP地址指定的URL。驻留程序接收到请求,在进行必要的操作后回送所要求的文件。在这一过程中,在网络上发送和接收的数据已经被分成一个或多个数据包(packet),每个数据包包括:要传送的数据;控制信息,即告诉网络怎样处理数据包。TCP/IP决定了每个数据包的格式。如果事先不告诉你,你可能不会知道信息被分成用于传输和再重新组合起来的许多小块。
也就是说商家除了拥有商品之外,它也有一个职员在接听你的电话,当你打电话的时候,你的声音转换成各种复杂的数据,通过电话线传输到对方的电话机,对方的电话机又把各种复杂的数据转换成声音,使得对方商家的职员能够明白你的请求。这个过程你不需要明白声音是怎么转换成复杂的数据的。
了解WWW服务与HTTP协议
| |
用Socket类实现HTTP协议客户端应用 Http客户端程序已集成在Java语言中,可以通过URLConnection类调用。遗憾的 是,由于SUN没有公布Http客户程序的源码,它实现的细节仍是一个谜。本文根据HTTP 协议规范,用Java.net.Socket类实现一个HTTP协议客户端程序。 1.Socket类: 了解TCP/IP协议集通信的读者知道,协议间的通信是通过Socket完成的。在 Java.net包中,Socket类就是对Socket的具体实现。它通过连接到主机后,返回一个 I/O流,实现协议间的信息交换。 2 . HTTP协议 HTTP协议同其它TCP/IP协议集中的协议一样,是遵循客户/服务器模型工作的。客 户端发往服务端的信息格式如下: ------------------------------ 请求方法 URL HTTP协议的版本号 提交的元信息 **空行** 实体 ------------------------------ 请求方法是对这次连接工作的说明,目前HTTP协议已经发展到1.1版,它包括GET、 HEAD、POST、DELETE、OPTIONS、TRACE、PUT七种。元信息是关于当前请求的信息。通 过分析元信息,可以检查实体数据是否完整,接收过程是否出错,类型是否匹配等。元 信息的引入使HTTP协议通信更加稳妥可靠。实体是请求的具体内容。 将上述报文发往Web服务器,如果成功,应答格式如下: -------------------------------- HTTP协议的版本号 应答状态码 应答状态码说明 接收的元信息 **空行** 实体 -------------------------------- 以上报文发向客户端,并且接收成功,彼此间关闭连接,完成一次握手。 下面用最常用的GET方法,来说明具体的报文应用 ---------------------------------- GET http://www.youhost.com HTTP/1.0 accept: www/source; text/html; image/gif; image/jpeg; */* User_Agent: myAgent **空行** ----------------------------------- 这个报文是向www.youhost.com主机请求一个缺省HTML文档。客户端HTTP协议版本 号是1.0版,元信息包括可接收的文件格式,用户代理,每一段之间用回车换行符分 隔,最后以一个空行结束。发向服务器后,如果执行过程正常,服务器返回以下代码: ------------------------------------ HTTP/1.1 200 OK Date: Tue, 14 Sep 1999 02:19:57 GMT Server: Apache/1.2.6 Connection: close Content-Type: text/html **空行** ...... ------------------------------------ HTTP/1.1表示这个HTTP服务器是1.1版,200是服务器对客户请求的应答状态码,OK 是对应答状态码的解释,之后是这个文档的元信息和文档正文。(相关应答状态码和元 信息的解释请参阅Inetrnet标准草案:RFC2616)。 3. HTTP客户端程序: import java.net.*; import java.io.*; import java.util.Properties; import java.util.Enumeration; public class Http { protected Socket client; protected BufferedOutputStream sender; protected BufferedInputStream receiver; protected ByteArrayInputStream byteStream; protected URL target; private int responseCode=-1; private String responseMessage=""; private String serverVersion=""; private Properties header = new Properties(); public Http() { } public Http(String url) { GET(url) ; } /* GET方法根据URL,会请求文件、数据库查询结果、程序运行结果等多种内容 */ public void GET(String url) { try { checkHTTP(url); openServer(target.getHost(),target.getPort() ); String cmd = "GET "+ getURLFormat(target) +" HTTP/1.0/r/n" + getBaseHeads()+"/r/n"; sendMessage(cmd); receiveMessage(); }catch(ProtocolException p) { p.printStackTrace(); return; }catch(UnknownHostException e) { e.printStackTrace(); return; }catch(IOException i) i.printStackTrace(); return; } } /* * HEAD方法只请求URL的元信息,不包括URL本身。若怀疑本机和服务器上的 * 文件相同,用这个方法检查最快捷有效。 */ public void HEAD(String url) { try { checkHTTP(url); openServer(target.getHost(),target.getPort() ); String cmd = "HEAD "+getURLFormat(target)+" HTTP/1.0/r/n" +getBaseHeads()+"/r/n"; sendMessage(cmd); receiveMessage(); }catch(ProtocolException p) { p.printStackTrace(); return; }catch(UnknownHostException e) { e.printStackTrace(); return; }catch(IOException i) i.printStackTrace(); return; } } /* * POST方法是向服务器传送数据,以便服务器做出相应的处理。例如网页上常用的 * 提交表格。 */ public void POST(String url,String content) { try { checkHTTP(url); openServer(target.getHost(),target.getPort() ); String cmd = "POST "+ getURLFormat(target) +" HTTP/1.0/r/n"+getBaseHeads(); cmd += "Content-type: application/x-www-form-urlencoded/r/n"; cmd += "Content-length: " + content.length() + "/r/n/r/n"; cmd += content+"/r/n"; sendMessage(cmd); receiveMessage(); }catch(ProtocolException p) { p.printStackTrace(); return; }catch(UnknownHostException e) { e.printStackTrace(); return; }catch(IOException i) i.printStackTrace(); return; } } protected void checkHTTP(String url) throws ProtocolException { try { URL target = new URL(url); if(target==null || !target.getProtocol().toUpperCase().equals("HTTP") ) throw new ProtocolException("这不是HTTP协议"); this.target = target; }catch(MalformedURLException m) { throw new ProtocolException("协议格式错误"); } } /* * 与Web服务器连接。若找不到Web服务器,InetAddress会引发UnknownHostException * 异常。若Socket连接失败,会引发IOException异常。 */ protected void openServer(String host,int port) throws UnknownHostException,IOException { header.clear(); responseMessage=""; responseCode=-1; try { if(client!=null) closeServer(); if(byteStream != null) { byteStream.close(); byteStream=null; } InetAddress address = InetAddress.getByName(host); client = new Socket(address,port==-1?80:port); sender = new BufferedOutputStream(client.getOutputStream()); receiver = new BufferedInputStream(client.getInputStream()); }catch(UnknownHostException u) { throw u; }catch(IOException i) { throw i; } } /* 关闭与Web服务器的连接 */ protected void closeServer() throws IOException { if(client==null) return; try { client.close(); sender.close(); receiver.close(); }catch(IOException i) { throw i; } client=null; sender=null; receiver=null; } protected String getURLFormat(URL target) { String spec = "http://"+target.getHost(); if(target.getPort()!=-1) spec+=":"+target.getPort(); return spec+=target.getFile(); } /* 向Web服务器传送数据 */ protected void sendMessage(String data) throws IOException{ sender.write(data.getBytes(),0,data.length()); sender.flush(); } /* 接收来自Web服务器的数据 */ protected void receiveMessage() throws IOException{ byte data[] = new byte[1024]; int count=0; int word=-1; // 解析第一行 while( (word=receiver.read())!=-1 ) { if(word=='/r'||word=='/n') { word=receiver.read(); if(word=='/n') word=receiver.read(); break; } if(count == data.length) data = addCapacity(data); data[count++]=(byte)word; } String message = new String(data,0,count); int mark = message.indexOf(32); serverVersion = message.substring(0,mark); while( mark responseCode = Integer.parseInt(message.substring(mark+1,mark+=4)); responseMessage = message.substring(mark,message.length()).trim(); // 应答状态码和处理请读者添加 switch(responseCode) { case 400: throw new IOException("错误请求"); case 404: throw new FileNotFoundException( getURLFormat(target) ); case 503: throw new IOException("服务器不可用" ); } if(word==-1) throw new ProtocolException("信息接收异常终止"); int symbol=-1; count=0; // 解析元信息 while( word!='/r' && word!='/n' && word>-1) { if(word=='/t') word=32; if(count==data.length) data = addCapacity(data); data[count++] = (byte)word; parseLine: { while( (symbol=receiver.read()) >-1 ) { switch(symbol) { case '/t': symbol=32; break; case '/r': case '/n': word = receiver.read(); if( symbol=='/r' && word=='/n') { word=receiver.read(); if(word=='/r') word=receiver.read(); } if( word=='/r' || word=='/n' || word>32) break parseLine; symbol=32; break; } if(count==data.length) data = addCapacity(data); data[count++] = (byte)symbol; } word=-1; } message = new String(data,0,count); mark = message.indexOf(':'); String key = null; if(mark>0) key = message.substring(0,mark); mark++; while( mark String value = message.substring(mark,message.length() ); header.put(key,value); count=0; } // 获得正文数据 while( (word=receiver.read())!=-1) { if(count == data.length) data = addCapacity(data); data[count++] = (byte)word; } if(count>0) byteStream = new ByteArrayInputStream(data,0,count); data=null; closeServer(); } public String getResponseMessage() { return responseMessage; } public int getResponseCode() { return responseCode; } public String getServerVersion() { return serverVersion; } public InputStream getInputStream() { return byteStream; } public synchronized String getHeaderKey(int i) { if(i>=header.size()) return null; Enumeration enum = header.propertyNames(); String key = null; for(int j=0; j<=i; j++) key = (String)enum.nextElement(); return key; } public synchronized String getHeaderValue(int i) { if(i>=header.size()) return null; return header.getProperty(getHeaderKey(i)); } public synchronized String getHeaderValue(String key) { return header.getProperty(key); } protected String getBaseHeads() { String inf = "User-Agent: myselfHttp/1.0/r/n"+ "Accept: www/source; text/html; image/gif; */*/r/n"; return inf; } private byte[] addCapacity(byte rece[]){ byte temp[] = new byte[rece.length+1024]; System.arraycopy(rece,0,temp,0,rece.length); return temp; } } 注: 程序中只实现GET、HEAD、POST三种方法。其他几种因不常使用,暂且忽略。 |
HTTP:超文本传输协议 |
HTTP:Hypertext Transfer Protocol |
超文本传输协议(HTTP)是应用层协议,由于其简捷、快速的方式,适用于分布式和合作式超媒体信息系统。自 1990 年起, HTTP 就已经被应用于 WWW 全球信息服务系统。 HTTP 允许使用自由答复的方法表明请求目的,它建立在统一资源识别器(URI)提供的参考原则下,作为一个地址(URL)或名字(URN),用以标志采用哪种方法,它用类似于网络邮件和多用途网际邮件扩充协议(MIME)的格式传递消息。 HTTP 也可用作普通协议,实现用户代理与连接其它 Internet 服务(如 SMTP 、 NNTP 、 FTP 、 GOPHER 及 WAIS )的代理服务器或网关之间的通信,允许基本的超媒体访问各种应用提供的资源,同时简化了用户代理系统的实施。 HTTP 是一种请求 / 响应式的协议。一个客户机与服务器建立连接后,发送一个请求给服务器,请求的格式是:统一资源标识符(URI)、协议版本号,后面是类似 MIME 的信息,包括请求修饰符、客户机信息和可能的内容。服务器接到请求后,给予相应的响应信息,其格式是:一个状态行包括信息的协议版本号、一个成功或错误的代码,后面也是类似 MIME 的信息,包括服务器信息、实体信息和可能的内容。 HTTP 的第一版本 HTTP/0.9 是一种简单的用于网络间原始数据传输的协议。而由 RFC 1945 定义的 HTTP/1.0 ,在原 HTTP/0.9 的基础上,有了进一步的改进,允许消息以类 MIME 信息格式存在,包括请求 / 响应范式中的已传输数据和修饰符等方面的信息。但是, HTTP/1.0 没有充分考虑到分层代理服务器、高速缓冲存储器、持久连接需求或虚拟主机等方面的效能。相比之下, HTTP/1.1 要求更加严格以确保服务的可靠性。关于安全增强版的 HTTP (即S-HTTP),将在相关文件中再作介绍。 |
协议结构 |
HTTP报文由从客户机到服务器的请求和从服务器到客户机的响应构成。 请求报文格式如下: |
请求行 | 通用信息头 | 请求头 | 实体头 | 报文主体 |
请求行以方法字段开始,后面分别是 URL 字段和 HTTP 协议版本字段,并以 CRLF 结尾。SP 是分隔符。除了在最后的 CRLF 序列中 CF 和 LF 是必需的之外,其他都可以不要。有关通用信息头,请求头和实体头方面的具体内容可以参照相关文件。 应报文格式如下: |
状态行 | 通用信息头 | 响应头 | 实体头 | 报文主体 |
状态码元由3位数字组成,表示请求是否被理解或被满足。原因分析是对原文的状态码作简短的描述,状态码用来支持自动操作,而原因分析用来供用户使用。客户机无需用来检查或显示语法。有关通用信息头,响应头和实体头方面的具体内容可以参照相关文件。 |
相关协议 | WWW、FTP、STMP、NNTP、Gopher、WAIS、DNS、S-HTTP |
组织来源 | HTTP 定义在 IETF (http://www.ietf.org) 的 RFC 1945和2616中。 |
相关链接 | http://www.javvin.com/protocol/rfc1945.pdf :Hypertext Transfer Protocol – HTTP 1.0 http://www.javvin.com/protocol/rfc2616.pdf :Hypertext Transfer Protocol – HTTP 1.1 |
相关文章推荐
- 了解WWW服务与HTTP协议 【入门与应用】
- 新手入门:了解WWW服务与HTTP协议
- 新手入门:了解WWW服务与HTTP协议6
- 新手入门:了解WWW服务与HTTP协议5
- 新手入门:了解WWW服务与HTTP协议1
- 新手入门:了解网络应用与网络协议
- 新手入门:了解网络应用与网络协议
- 新手入门:了解网络应用与网络协议
- 新手入门:了解网络应用与网络协议
- 新手入门:了解网络应用与网络协议
- 新手入门:了解网络应用与网络协议
- 新手入门:了解网络应用与网络协议
- 了解WWW服务与HTTP协议
- javaweb入门(4)-- 详细了解http协议2
- 新手入门:了解网络应用与网络协议
- 新手入门:了解网络应用与网络协议
- 新手入门:了解网络应用与网络协议
- 新手入门:了解网络应用与网络协议
- 新手入门:了解网络应用与网络协议
- 新手入门:了解网络应用与网络协议1