您的位置:首页 > 运维架构 > Tomcat

Tomcat学习之Tomcat架构

2013-08-28 10:02 225 查看
前段时间想学习下tomcat,在网上找了一些资料,放在这里以备忘:
1,tomcat架构:
Server: 
其实就是BackGroud程序, 在Tomcat里面的Server的用处是启动和监听服务端事件(诸如重启、关闭等命令。 在tomcat的标准配置文件:server.xml里面, 我们可以看到“”这里的"SHUTDOWN"就是server在监听服务端事件的时候所使用的命令字)
Service:
在tomcat里面, service是指一类问题的解决方案。 通常我们会默认使用tomcat提供的:Tomcat-Standalone 模式的service。 在这种方式下的service既给我们提供解析jsp和servlet的服务, 同时也提供给我们解析静态文本的服务
Connector:
Tomcat都是在容器里面处理问题的, 而容器又到哪里去取得输入信息呢?

  Connector就是专干这个的。 他会把从socket传递过来的数据, 封装成Request, 传递给容器来处理。

  通常我们会用到两种Connector,一种叫http connectoer, 用来传递http需求的。 另一种叫AJP, 在我们整合apache与tomcat工作的时候, apache与tomcat之间就是通过这个协议来互动的。 (说到apache与tomcat的整合工作, 通常我们的目的是为了让apache 获取静态资源, 而让tomcat来解析动态的jsp或者servlet。)

Container:
当http connector把需求传递给顶级的container:
Engin的时候, 我们的视线就应该移动到Container这个层面来了。

在Container这个层, 我们包含了3种容器Engin,
Host, Context.

Engin:收到service传递过来的需求, 处理后, 将结果返回给service(
service 是通过 connector 这个媒介来和Engin互动的 ).

Host:Engin收到service传递过来的需求后,不会自己处理, 而是交给合适的Host来处理。Host在这里就是虚拟主机的意思, 通常我们都只会使用一个主机,既“localhost”本地机来处理。

Context:Host接到了从Host传过来的需求后, 也不会自己处理, 而是交给合适的Context来处理。
context就是一个webapp,比如我们在tomcat里部署两个web项目,一个叫做baidu,一个叫做google,在tomcat启动后就可以说tomcat有两个context。
这个context容器,就是用来干我们该干的事儿的地方的。

Compenent:接下来, 我们继续讲讲component是干什么用的。

我们得先理解一下容器和组件的关系。

需求被传递到了容器里面, 在合适的时候, 会传递给下一个容器处理。

而容器里面又盛装着各种各样的组件, 我们可以理解为提供各种各样的增值服务

manager:当一个容器里面装了manager组件后,这个容器就支持session管理了, 事实上在tomcat里面的session管理, 就是靠的在context里面装的manager
component.

logger:当一个容器里面装了logger组件后, 这个容器里所发生的事情, 就被该组件记录下来啦! 我们通常会在logs/ 这个目录下看见 catalina_log.time.txt 以及 localhost.time.txt 和localhost_examples_log.time.txt。 这就是因为我们分别为:engin,
host以及context(examples)这三个容器安装了logger组件, 这也是默认安装, 又叫做标配 :)

loader:loader这个组件通常只会给我们的context容器使用, loader是用来启动context以及管理这个context的classloader用的。

pipline:pipeline是这样一个东西, 当一个容器决定了要把从上级传递过来的需求交给子容器的时候, 他就把这个需求放进容器的管道(pipeline)里面去。 而需求傻呼呼得在管道里面流动的时候, 就会被管道里面的各个阀门拦截下来。 比如管道里面放了两个阀门。 第一个阀门叫做“access_allow_vavle”, 也就是说需求流过来的时候,它会看这个需求是哪个IP过来的, 如果这个IP已经在黑名单里面了, sure, 杀! 第二个阀门叫做“defaul_access_valve”它会做例行的检查, 如果通过的话,OK, 把需求传递给当前容器的子容器。 就是通过这种方式, 需求就在各个容器里面传递,流动, 最后抵达目的地的了。

valve:就是上面所说的阀门啦。

org.apache.catalina.Server:
是一个接口,规定了Server需要做的上述的基本事情:
org.apache.catalina.core.StandardServer:
是Server接口的默认实现;我们最熟悉的starup.bat和shutdown.bat两个命令本至少就是调用该类的start()和stop()方法。

Tomcat学习之Tomcat启动过程

tomcat的启动会分成两大部分第一步是装配工作。 第二步是启动工作。

装配工作就是为父容器装上子容器, 为各个容器安插进组件的工作。 这个地方我们会用到digester模式, 至于digester模式什么, 有什么用, 怎么工作的. 请参考

启动工作是在装配工作之后, 一旦装配成功了, 我们就只需要点燃最上面的一根导线, 整个tomcat就会被激活起来。 这就好比我们要开一辆已经装配好了的汽车的时候一样,我们只要把钥匙插进钥匙孔,一拧,汽车的引擎就会发动起来,空调就会开起来, 安全装置就会生效, 如此一来,汽车整个就发动起来了。(这个过程确实和TOMCAT的启动过程不谋而和, 让我们不得不怀疑 TOMCAT的设计者是在GE做JAVA开发的)。

2.1 一些有意思的名称:

Catalina

Tomcat

Bootstrap

Engin

Host

Context

他们的意思很有意思:

Catalina: 远程轰炸机

Tomcat: 熊猫轰炸机 -- 轰炸机的一种(这让我想起了让国人引以为豪的熊猫手机,是不是英文可以叫做tomcat??? , 又让我想起了另一则广告: 波导-手机中的战斗机、波音-客机中的战斗机 )

Bootstap: 引导

Engin: 发动机

Host: 主机,领土

Context: 内容, 目标, 上下文

2.2 tomcat的启动就是从org.apache.catalina.startup.Bootstrap这个类悍然启动的!

在Bootstrap里做了两件事:

1. 指定了3种类型classloader:

commonLoader: common/classes、common/lib、common/endorsed

catalinaLoader: server/classes、server/lib、commonLoader

sharedLoader: shared/classes、shared/lib、commonLoader

2. 引导Catalina的启动。

用Reflection技术调用org.apache.catalina.startup.Catalina的process方法, 并传递参数过去。

2.3 Catalina.java

Catalina完成了几个重要的任务:

1. 使用Digester技术装配tomcat各个容器与组件。

1.1 装配工作的主要内容是安装各个大件。 比如server下有什么样的servcie。 Host会容纳多少个context。 Context都会使用到哪些组件等等。

1.2 同时呢, 在装配工作这一步, 还完成了mbeans的配置工作。 在这里,我简单地但不十分精确地描述一下mbean是什么,干什么用的。

我们自己生成的对象, 自己管理, 天经地义! 但是如果我们创建了对象了, 想让别人来管, 怎么办呢? 我想至少得告诉别人我们都有什么, 以及通过什么方法可以找到 吧! JMX技术给我们提供了一种手段。 JMX里面主要有3种东西。Mbean,
agent, connector.

Mbean: 用来映射我们的对象。也许mbean就是我们创建的对象, 也许不是, 但有了它, 就可以引用到我们的对象了。

Agent: 通过它, 就可以找到mbean了。

Connector: 连接Agent的方式。 可以是http的, 也可以是rmi的,还可以直接通过socket。

发生在tomcat 装配过程中的事情: GlobalResourcesLifecycleListener 类的初始化会被触发:

protected static Registry registry = MBeanUtils.createRegistry(); 会运行

MBeanUtils.createRegistry() 会依据/org/apache/catalina/mbeans/mbeans-descriptors.xml这个配置文件创建 mbeans.
Ok, 外界就有了条途径访问tomcat中的各个组件了。(有点像后门儿)

2. 为top level 的server 做初始化工作。 实际上就是做通常会配置给service的两条connector.(http,
ajp)

3. 从server这个容器开始启动, 点燃整个tomcat.

4. 为server做一个hook程序, 检测当server
shutdown的时候, 关闭tomcat的各个容器用。

5. 监听8005端口, 如果发送"SHUTDOWN"(默认培植下字符串)过来, 关闭8005serverSocket。

2.4 启动各个容器

1. Server

触发Server容器启动前(before_start), 启动中(start), 启动后(after_start)3个事件, 并运行相应的事件处理器。

启动Server的子容器:Servcie.

2. Service

启动Service的子容器:Engin

启动Connector

3. Engin

到了Engin这个层次,以及以下级别的容器, Tomcat就使用了比较一致的启动方式了。

首先, 运行各个容器自己特有一些任务

随后, 触发启动前事件

立即, 设置标签,就表示该容器已经启动

接着, 启动容器中的各个组件: loader, logger,
manager等等

再接着,启动mapping组件。(注1)

紧跟着,启动子容器。

接下来,启动该容器的管道(pipline)

然后, 触发启动中事件

最后, 触发启动后事件。

Engin大致会这么做, Host大致也会这么做, Context大致还是会这么做。 那么很显然地, 我们需要在这里使用到代码复用的技术。 tomcat在处理这个问题的时候, 漂亮地使用了抽象类来处理。 ContainerBase. 最后使得这部分完成复杂功能的代码显得干净利落, 干练爽快, 实在是令人觉得叹为观止, 细细品来, 直觉如享佳珍, 另人齿颊留香, 留恋往返啊!

Engin的触发启动前事件里, 会激活绑定在Engin上的唯一一个Listener:EnginConfig。

这个EnginConfig类基本上没有做什么事情, 就是把EnginConfig的调试级别设置为和Engin相当。 另外就是输出几行文本, 表示Engin已经配置完毕, 并没有做什么实质性的工作。

注1: mapping组件的用处是, 当一个需求将要从父容器传递到子容器的时候, 而父容器又有多个子容器的话, 那么应该选择哪个子容器来处理需求呢? 这个由mapping 组件来定夺。

4. Host

同Engin一样, 也是调用ContainerBase里面的start()方法, 不过之前做了些自个儿的任务,就是往Host这个容器的通道(pipline)里面, 安装了一个叫做

“org.apache.catalina.valves.ErrorReportValve”的阀门。

这个阀门的用处是这样的: 需求在被Engin传递给Host后, 会继续传递给Context做具体的处理。 这里需求其实就是作为参数传递的Request,
Response。 所以在context把需求处理完后, 通常会改动response。 而这个org.apache.catalina.valves.ErrorReportValve的作用就是检察response是否包含错误, 如果有就做相应的处理。

5. Context

到了这里, 就终于轮到了tomcat启动中真正的重头戏,启动Context了。

StandardContext.start() 这个启动Context容器的方法被StandardHost调用.

5.1 webappResources 该context所指向的具体目录

5.2 安装defaultContex, DefaultContext 就是默认Context。 如果我们在一个Host下面安装了DefaultContext,而且defaultContext里面又安装了一个数据库连接池资源的话。 那么其他所有的在该Host下的Context, 都可以直接使用这个数据库连接池, 而不用格外做配置了。

5.3 指定Loader. 通常用默认的org.apache.catalina.loader.WebappLoader这个类。
Loader就是用来指定这个context会用到哪些类啊, 哪些jar包啊这些什么的。

5.4 指定 Manager. 通常使用默认的org.apache.catalina.session.
StandardManager 。 Manager是用来管理session的。

其实session的管理也很好实现。 以一种简单的session管理为例。 当需求传递过来的时候, 在Request对象里面有一个sessionId 属性。 OK, 得到这个sessionId后, 我们就可以把它作为map的key,而value我们可以放置一个HashMap.
HashMap里边儿, 再放我们想放的东西。

5.5 postWorkDirectory (). Tomcat下面有一个work目录。 我们把临时文件都扔在那儿去。 这个步骤就是在那里创建一个目录。 一般说来会在%CATALINA_HOME%/work/Standalone\localhost\ 这个地方生成一个目录。

5.6 Binding thread。到了这里, 就应该发生 class Loader 互换了。 之前是看得见tomcat下面所有的class和lib. 接下来需要看得见当前context下的class。 所以要设置contextClassLoader, 同时还要把旧的ClassLoader记录下来,因为以后还要用的。

5.7 启动 Loader. 指定这个Context具体要使用哪些classes, 用到哪些jar文件。 如果reloadable设置成了true, 就会启动一个线程来监视classes的变化, 如果有变化就重新启动Context。

5.8 启动logger

5.9 触发安装在它身上的一个监听器。

lifecycle.fireLifecycleEvent(START_EVENT, null);

作为监听器之一,ContextConfig会被启动. ContextConfig就是用来配置web.xml的。 比如这个Context有多少Servlet, 又有多少Filter, 就是在这里给Context装上去的。

5.9.1 defaultConfig. 每个context都得配置 tomcat/conf/web.xml 这个文件。

5.9.2 applicationConfig 配置自己的 WEB-INF/web.xml 文件

5.9.3 validateSecurityRoles 权限验证。 通常我们在访问/admin 或者/manager的时候,需要用户要么是admin的要么是manager的, 才能访问。 而且我们还可以限制那些资源可以访问, 而哪些不能。 都是在这里实现的。

5.9.4 tldScan: 扫描一下, 需要用到哪些标签(tag lab)

5.10 启动 manager

5.11 postWelcomeFiles() 我们通常会用到的3个启动文件的名称:

index.html、index.htm、index.jsp 就被默认地绑在了这个context上

5.12 listenerStart 配置listener

5.13 filterStart 配置 filter

5.14 启动带有<load-on-startup>;1</load-on-startup>;的Servlet.

顺序是从小到大: 1,2,3… 最后是0

默认情况下, 至少会启动如下3个的Servlet:

org.apache.catalina.servlets.DefaultServlet

处理静态资源的Servlet. 什么图片啊, html啊, css啊, js啊都找他

org.apache.catalina.servlets.InvokerServlet

处理没有做Servlet Mapping的那些Servlet.

org.apache.jasper.servlet.JspServlet

处理JSP文件的.

5.15 标识context已经启动完毕。

走了多少个步骤啊, Context总算是启动完毕喽。

OK! 走到了这里, 每个容器以及组件都启动完毕。 Tomcat终于不辞辛劳地为人民服务了!

4. 后记

这篇文章是讲解tomcat启动框架的,还有篇文章是讲解TOMCAT里面的消息处理流程的细节的。 文章内容已经写好了, 现在正在整理阶段。 相信很快就可以做出来, 大家共同研究共同进步。

这篇文章是独自分析TOMCAT源码所写的, 所以一定有地方是带有个人主观色彩, 难免会有片面之处。若有不当之处敬请批评指教,这样不仅可以使刚开始研究TOMCAT的兄弟们少走弯路, 我也可以学到东西。

5. tomcat源码分析(消息处理)

Tomcat学习之tomcat处理请求过程

1. 我们以一个具体的例子,来跟踪TOMCAT, 看看它是如何把Request一层一层地递交给下一个容器, 并最后交给Wrapper来处理的。

http://localhost:8080/web/login.jsp为例子

(以下例子, 都是以tomcat4 源码为参考)

这篇心得主要分为3个部分: 前期, 中期, 和末期。

前期:讲解了在浏览器里面输入一个URL,是怎么被tomcat抓住的。

中期:讲解了被tomcat抓住后,又是怎么在各个容器里面穿梭, 最后到达最后的处理地点。

末期:讲解到达最后的处理地点后,又是怎么具体处理的。

2、 前期 Request的born.

在这里我先简单讲一下request这个东西。

我们先看着这个URL:http://localhost:8080/web/login.jsp 它是动用了8080端口来进行socket通讯的。

我们知道, 通过

InputStream in = socket.getInputStream() 和

OutputStream out = socket.getOutputStream()

就可以实现消息的来来往往了。

但是如果把Stream给应用层看,显然操作起来不方便。

所以,在tomcat 的Connector里面, socket被封装成了Request和Response这两个对象。

我们可以简单地把Request看成管发到服务器来的数据,把Response看成想发出服务器的数据。

但是这样又有其他问题了啊? Request这个对象是把socket封装起来了, 但是他提供的又东西太多了。

诸如Request.getAuthorization(), Request.getSocket()。 像Authorization这种东西开发人员拿来基本上用不太着,而像socket这种东西,暴露给开发人员又有潜在的危险。 而且啊, 在Servlet
Specification里面标准的通信类是ServletRequest和HttpServletRequest,而非这个Request类。 So,
So, So. Tomcat必须得捣持捣持Request才行。 最后tomcat选择了使用捣持模式(应该叫适配器模式)来解决这个问题。它把org.apache.catalina.Request 捣持成了 org.apache.coyote.tomcat4.CoyoteRequest。 而CoyoteRequest又实现了ServletRequest和HttpServletRequest 这两种接口。 这样就提供给开发人员需要且刚刚需要的方法了。

ok, 让我们在 tomcat的顶层容器 -
StandardEngin 的invoke()方法这里设置一个断点, 然后访问

http://localhost:8080/web/login.jsp, 我们来看看在前期都会路过哪些地方:

1. run(): 536, java.lang.Thread, Thread.java

CurrentThread

2. run():666, org.apache.tomcat.util.threads.ThreadPool$ControlRunnable, ThreadPool.java

ThreadPool

3. runIt():589, org.apache.tomcat.util.net.TcpWorkerThread, PoolTcpEndpoint.java

ThreadWorker

4. processConnection(): 549

org.apache.coyote.http11.Http11Protocol$Http11ConnectionHandler, Http11Protocol.java

http protocol parser

5. Process(): 781, org.apache.coyote.http11.Http11Processor, Http11Processor.java

http request processor

6. service(): 193, org.apache.coyote.tomcat4.CoyoteAdapter,CoyoteAdapter.java

adapter

7. invoke(): 995, org.apache.catalina.core.ContainerBase, ContainerBase.java

StandardEngin

1. 主线程

2. 启动线程池.

3. 调出线程池里面空闲的工作线程。

4. 把8080端口传过来由httpd协议封装的数据,解析成Request和Response对象。

5. 使用Http11Processor来处理request

6. 在Http11Processor里面, 又会call
CoyoteAdapter来进行适配处理,把Request适配成实现了ServletRequest和HttpServletRequest接口的CoyoteRequest.

7. 到了这里,前期的去毛拔皮工作就基本上搞定,可以交给StandardEngin 做核心的处理工作了。

3. 中期。 在各个容器间的穿梭。

Request在各个容器里面的穿梭大致是这样一种方式:

每个容器里面都有一个管道(pipline), 专门用来传送Request用的。

管道里面又有好几个阀门(valve), 专门用来过滤Request用的。

在管道的低部通常都会放上一个默认的阀们。 这个阀们至少会做一件事情,就是把Request交给子容器。

让我们来想象一下:

当一个Request进入一个容器后, 它就在管道里面流动,波罗~ 波罗~ 波罗~ 地穿过各个阀门。在流到最后一个阀门的时候,吧唧~ 那个该死的阀门就把它扔给了子容器。 然后又开始 波罗~ 波罗~ 波罗~
... 吧唧~.... 波罗~ 波罗~ 波罗~
....吧唧~....

就是通过这种方式, Request 走完了所有的容器。( 感觉有点像消化系统,最后一个地方有点像那里~ )

OK, 让我们具体看看都有些什么容器, 各个容器里面又都有些什么阀门,这些阀们都对我们的Request做了些什么吧:

3.1 StandardEngin 的pipeline里面放的是:StandardEnginValve

在这里,VALVE做了三件事:

1. 验证传递过来的request是不是httpservletRequest.

2 验证传递过来的 request 是否携带了host
header信息.

3 选择相应的host去处理它。(一般我们都只有一个host:localhost,也就是127.0.0.1)。

到了这个地方, 我们的request就已经完成了在Engin这个部分的历史使命, 通向前途未卜的下一站: host了。

3.2 StandardHost 的pipline里面放的是: StandardHostValve

1. 验证传递过来的request是不是httpservletRequest.

2. 根据Request来确定哪个Context来处理。

Context其实就是webapp, 比如http://localhost:8080/web/login.jsp

这里web就是Context罗!

3. 既然确定了是哪个Context了,那么就应该把那个Context的classloader付给当前线程了。

Thread.currentThread().setContextClassLoader(context.getLoader().getClassLoader());

这样request就只看得见指定的context下面的classes啊, jar啊这些, 而看不见tomcat本身的类, 什么Engin啊, Valve啊。 不然还得了啊!

4. 既然request到了这里了,看来用户是准备访问web这个web
app了,咋们得更新一下这个用户的session不是! Ok , 就由manager更新一下用户的session信息

5. 交给具体的Context 容器去继续处理Request.

6. Context处理完毕了,把classloader还回来。

3.3 StandardContext 的pipline里面放的是: StandardContextValve

1. 验证传递过来的request是不是httpservletRequest.

2. 如果request意图不轨,想要访问/meta-inf,
/web-inf这些目录下的东西,呵呵,没有用D!

3. 这个时候就会根据Request到底是Servlet,还是jsp,还是静态资源来决定到底用哪种Wrapper来处理这个Reqeust了。

4. 一旦决定了到底用哪种Wrapper,OK,交给那个Wrapper处理。

4. 末期。 不同的需求是怎么处理的.

StandardWrapper

之前对Wrapper没有做过讲解,其实它是这样一种东西。

我们在处理Request的时候,可以分成3种。

处理静态的: org.apache.catalina.servlets.DefaultServlet

处理jsp的: org.apache.jasper.servlet.JspServlet

处理servlet的: org.apache.catalina.servlets.InvokerServlet

不同的request就用这3种不同的servlet去处理。

Wrapper就是对它们的一种简单的封装,有了Wrapper后,我们就可以轻松地拦截每次的Request。也可以容易地调用servlet的init()和destroy()方法, 便于管理嘛!

具体情况是这么滴:

如果request是找jsp文件,StandardWrapper里面就会封装一个org.apache.jasper.servlet.JspServlet去处理它。

如果request是找 静态资源 ,StandardWrapper里面就会封装一个org.apache.jasper.servlet.DefaultServlet 去处理它。

如果request是找servlet ,StandardWrapper里面就会封装一个org.apache.jasper.servlet.InvokerServlet 去处理它。

StandardWrapper同样也是容器,既然是容器, 那么里面一定留了一个管道给request去穿,管道低部肯定也有一个阀门(注1),用来做最后一道拦截工作.

在这最底部的阀门里,其实就主要做了两件事:

一是启动过滤器,让request在N个过滤器里面筛一通,如果OK! 那就PASS。 否则就跳到其他地方去了。

二是servlet.service((HttpServletRequest) request,(HttpServletResponse) response); 这个方法.

如果是 JspServlet, 那么先把jsp文件编译成servlet_xxx, 再invoke
servlet_xxx的servie()方法。

如果是 DefaultServlet, 就直接找到静态资源,取出内容, 发送出去。

如果是 InvokerServlet, 就调用那个具体的servlet的service()方法。

ok! 完毕。

注1: StandardWrapper 里面的阀门是最后一道关口了。 如果这个阀门欲意把request交给StandardWrapper 的子容器处理。 对不起, 在设计考虑的时候, Wrapper就被考虑成最末的一个容器, 压根儿就不会给Wrapper添加子容器的机会! 如果硬是要调用addChild(), 立马抛出IllegalArgumentException!迅龙提供
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: