写在前面 ApacheTomcat是JavaServlet,JavaServerPages(JSP),Java表达式语言和Java的WebSocket技术的一个开源实现,通常我们将Tomcat称为Web容器或者Servlet容器。 今天,我们就来手写tomcat,但是说明一下:咱们不是为了装逼才来写tomcat,而是希望大家能更多的理解和掌握tomcat。 废话不多说了,直接开干。基本结构tomcat架构图 我们可以把上面这张架构图做简化,简化后为: 什么是http协议 Http是一种网络应用层协议,规定了浏览器与web服务器之间如何通信以及数据包的结构。 通信大致可以分为四步:先建立连接。发送请求数据包。发送响应数据包。关闭连接。 优点web服务器可以利用有限的连接为尽可能多的客户请求服务。tomcat中Servlet的运作方式在浏览器地址栏输入http:ip:portservletday01hello浏览器依据IP、port建立连接(即与web服务器之间建立网络连接)。浏览器需要将相关数据打包(即按照http协议要求,制作一个请求数据包,包含了一些数据,比如请求资源路径),并且将请求数据包发送出去。web服务器会将请求数据包中数据解析出来,并且将这些数据添加到request对象,同时,还会创建一个response对象。web服务器创建Servlet对象,然后调用该对象的service方法(会将request和response作为参数)。注:在service方法里面,通过使用request获得请求相关的数据,比如请求参数值,然后将处理结果写到response。web服务器将response中的数据取出来,制作响应数据包,然后发送给浏览器。浏览器解析响应数据包,然后展现。 可以总结唯一张图: 什么是Servlet呢? Servlet是JavaEE规范的一种,主要是为了扩展Java作为Web服务的功能,统一接口。由其他内部厂商如tomcat,jetty内部实现web的功能。如一个http请求到来:容器将请求封装为servlet中的HttpServletRequest对象,调用init(),service()等方法输出response,由容器包装为httpresponse返回给客户端的过程。 什么是Servlet规范?从Jar包上来说,Servlet规范就是两个Jar文件。servletapi。jar和jspapi。jar,Jsp也是一种Servlet。从package上来说,就是javax。servlet和javax。servlet。http两个包。从接口来说,就是规范了Servlet接口、Filter接口、Listener接口、ServletRequest接口、ServletResponse接口等。类图如下: 第一版:Socket版 使用Socket编程,实现简单的客户端和服务端的聊天。 服务端代码如下:packagecom。tian。v1;importjava。io。;importjava。net。;publicclassServer{publicstaticStringreadlinenull;publicstaticStringinTempnull;publicstaticStringturnLine;publicstaticfinalStringclient客户端:;publicstaticfinalStringserver服务端:;publicstaticfinalintPORT8090;publicstaticvoidmain(String〔〕args)throwsException{ServerSocketserverSocketnewServerSocket(PORT);System。out。println(服务端已经准备好了);SocketsocketserverSocket。accept();BufferedReadersystemInnewBufferedReader(newInputStreamReader(System。in));BufferedReadersocketInnewBufferedReader(newInputStreamReader(socket。getInputStream()));PrintWritersocketOutnewPrintWriter(socket。getOutputStream());while(true){inTempsocketIn。readLine();if(inTemp!nullinTemp。contains(over)){systemIn。close();socketIn。close();socketOut。close();socket。close();serverSocket。close();}System。out。println(clientinTemp);System。out。print(server);readlinesystemIn。readLine();socketOut。println(readline);socketOut。flush();}}} 客户端代码如下:packagecom。tian。v1;importjava。io。;importjava。net。;publicclassClient{publicstaticvoidmain(String〔〕args)throwsException{Stringreadline;StringinTemp;finalStringclient客户端说:;finalStringserver服务端回复:;intport8090;byte〔〕ipAddressTemp{127,0,0,1};InetAddressipAddressInetAddress。getByAddress(ipAddressTemp);首先直接创建socket,端口号11023为系统保存,一般设在1023之外SocketsocketnewSocket(ipAddress,port);BufferedReadersystemInnewBufferedReader(newInputStreamReader(System。in));BufferedReadersocketInnewBufferedReader(newInputStreamReader(socket。getInputStream()));PrintWritersocketOutnewPrintWriter(socket。getOutputStream());while(true){System。out。print(client);readlinesystemIn。readLine();socketOut。println(readline);socketOut。flush();处理inTempsocketIn。readLine();if(inTemp!nullinTemp。contains(over)){systemIn。close();socketIn。close();socketOut。close();socket。close();}System。out。println(serverinTemp);}}} 过程如下: ,时长00:44第二版:我们直接请求http:localhost:8090 实现代码如下:packagecom。tian。v2;importjava。io。IOException;importjava。io。OutputStream;importjava。net。ServerSocket;importjava。net。Socket;publicclassMyTomcat{设定启动和监听端口privateintport8090;启动函数throwsIOExceptionpublicvoidstart()throwsIOException{System。out。println(mytomcatstarting。。。);StringresponseData6666666;ServerSocketsocketnewServerSocket(port);while(true){Socketacceptsocket。accept();OutputStreamoutputStreamaccept。getOutputStream();StringresponseTextHttpProtocolUtil。getHttpHeader200(responseData。length())responseData;outputStream。write(responseText。getBytes());accept。close();}}启动入口publicstaticvoidmain(String〔〕args)throwsIOException{MyTomcattomcatnewMyTomcat();tomcat。start();}} 再写一个工具类,内容如下;ackagecom。tian。v2;publicclassHttpProtocolUtil{200状态码,头信息paramcontentLength响应信息长度return200headerinfopublicstaticStringgetHttpHeader200(longcontentLength){returnHTTP1。1200OKContentType:texthtmlContentLength:contentLengthr;}为响应码404提供请求头信息(此处也包含了数据内容)return404headerinfopublicstaticStringgetHttpHeader404(){Stringstr404h1404notfoundh1;returnHTTP1。1404NOTFoundContentType:texthtmlContentLength:str404。getBytes()。lengthrstr404;}} 启动main方法: 使用IDEA访问: 在浏览器访问: 自此,我们的第二版本搞定。下面继续第三个版本;第三版:封装请求信息和响应信息 一个http协议的请求包含三部分:方法URI协议版本请求的头部主体内容 比如POSTindex。htmlHTTP1。1Accept:textplain;texthtmlAcceptLanguage:engbConnection:KeepAliveHost:localhostUserAgent:Mozilla4。0(compatible;MSIE4。01;Windows98)ContentLength:33ContentType:applicationxwwwformurlencodedAcceptEncoding:gzip,deflatelastNametianfirstNameJohnTian 简单的解释数据的第一行包括:方法、URI、协议和版本。在这个例子里,方法为POST,URI为index。html,协议为HTTP1。1,协议版本号为1。1。他们之间通过空格来分离。请求头部从第二行开始,使用英文冒号(:)来分离键和值。请求头部和主体内容之间通过空行来分离,例子中的请求体为表单数据。 类似于http协议的请求,响应也包含三个部分。协议状态状态描述响应的头部主体内容 比如:HTTP1。1200OKServer:MicrosoftIIS4。0Date:Mon,5Jan200413:13:33GMTContentType:texthtmlLastModified:Mon,5Jan200413:13:12GMTContentLength:112htmlheadtitleHTTPResponseExampletitleheadbodyWelcometoBrainySoftwarebodyhtml 简单解释第一行,HTTP1。1200OK表示协议、状态和状态描述。之后表示响应头部。响应头部和主体内容之间使用空行来分离。 代码实现 创建一个工具类,用来获取静态资源信息。packagecom。tian。v3;importcom。tian。v2。HttpProtocolUtil;importjava。io。IOException;importjava。io。InputStream;importjava。io。OutputStream;提取了一些共用类和函数publicclassResourceUtil{根据请求url获取完整绝对路径publicstaticStringgetPath(Stringurl){StringpathResourceUtil。class。getResource()。getPath();returnpath。replaceAll(,)url;}输出静态资源信息publicstaticvoidoutputResource(InputStreaminput,OutputStreamoutput)throwsIOException{intcount0;while(count0){countinput。available();}intresourceSizecount;output。write(HttpProtocolUtil。getHttpHeader200(resourceSize)。getBytes());longwritten0;intbyteSize1024;byte〔〕bytesnewbyte〔byteSize〕;while(writtenresourceSize){if(writtenbyteSizeresourceSize){byteSize(int)(resourceSizewritten);bytesnewbyte〔byteSize〕;}input。read(bytes);output。write(bytes);output。flush();writtenbyteSize;}}} 另外HttpProtocolUtil照样用第二版本中。 再创建Request类,用来解析并存放请求相关参数。packagecom。tian。v3;importjava。io。IOException;importjava。io。InputStream;publicclassRequest{请求方式,eg:GET、POSTprivateStringmethod;请求路径,eg:index。htmlprivateStringurl;请求信息输入流 示例preGETHTTP1。1Host:localhostConnection:keepalivePragma:nocacheCacheControl:nocacheUpgradeInsecureRequests:1UserAgent:Mozilla5。0(Macintosh;IntelMacOSX10156)AppleWebKit537。36(KHTML,likeGecko)Chrome85。0。4183。83Safari537。36preprivateInputStreaminputStream;publicRequest(){}publicRequest(InputStreaminputStream)throwsIOException{this。inputStreaminputStream;intcount0;while(count0){countinputStream。available();}byte〔〕bytesnewbyte〔count〕;inputStream。read(bytes);requestString参考:this。inputStream示例StringrequestStringnewString(bytes);按换行分隔String〔〕requestStringArrayrequestString。split(n);读取第一行数据,即:GETHTTP1。1StringfirstLinerequestStringArray〔0〕;遍历第一行数据按空格分隔String〔〕firstLineArrayfirstLine。split();this。methodfirstLineArray〔0〕;this。urlfirstLineArray〔1〕;}publicStringgetMethod(){returnmethod;}publicvoidsetMethod(Stringmethod){this。methodmethod;}publicStringgetUrl(){returnurl;}publicvoidsetUrl(Stringurl){this。urlurl;}publicInputStreamgetInputStream(){returninputStream;}publicvoidsetInputStream(InputStreaminputStream){this。inputStreaminputStream;}} 把第二版的MyTomcat进行小小调整:packagecom。tian。v3;importjava。io。IOException;importjava。io。OutputStream;importjava。net。ServerSocket;importjava。net。Socket;publicclassMyTomcat{privatestaticfinalintPORT8090;publicvoidstart()throwsIOException{System。out。println(mytomcatstarting。。。);ServerSocketsocketnewServerSocket(PORT);while(true){Socketacceptsocket。accept();OutputStreamoutputStreamaccept。getOutputStream();分别封装Request和ResponseRequestrequestnewRequest(accept。getInputStream());ResponseresponsenewResponse(outputStream);根据request中的url,输出response。outputHtml(request。getUrl());accept。close();}}publicstaticvoidmain(String〔〕args)throwsIOException{MyTomcattomcatnewMyTomcat();tomcat。start();}} 然后再创建一个index。html,内容很简单:!DOCTYPEhtmlhtmllangenheadmetacharsetUTF8titlehelloworldtitleheadbodyh2youalreadysucceed!h2bodyhtml 这一需要注意,index。html文件的存放路径不放错了,视本地路径来定哈,放在classes文件夹下的。你可以debug试试,看看你应该放在那个目录下。 启动MyTomcat。 访问http:localhost:8090index。html 自此,我们针对于Http请求参数和相应参数做了一个简单的解析以及封装。 尽管其中还有很多问题,但是字少看起来有那点像样了。我们继续第四版,第四版:实现动态请求资源 用过servlet的同学都知道,Servlet中有三个很重要的方法init、destroy、service。其中还记得我们自己写LoginServlet的时候,还会重写HttpServlet中的doGet()和doPost()方法。下面们就自己来搞一个: Servlet类代码如下:publicinterfaceServlet{voidinit()throwsException;voiddestroy()throwsException;voidservice(Requestrequest,Responseresponse)throwsException;} 然后再写一个HttpServlet来实现Servlet。 代码实现如下:packagecom。tian。v4;publicabstractclassHttpServletimplementsServlet{Overridepublicvoidinit()throwsException{}Overridepublicvoiddestroy()throwsException{}Overridepublicvoidservice(Requestrequest,Responseresponse)throwsException{Stringmethodrequest。getMethod();if(GET。equalsIgnoreCase(method)){doGet(request,response);}else{doPost(request,response);}}publicabstractvoiddoGet(Requestrequest,Responseresponse)throwsException;publicabstractvoiddoPost(Requestrequest,Responseresponse)throwsException;} 下面我们就来写一个自己的Servlet,比如LoginServlet。packagecom。tian。v4;publicclassLoginServletextendsHttpServlet{OverridepublicvoiddoGet(Requestrequest,Responseresponse)throwsException{StringrepTexth1LoginServletbyGETmethodh1;response。output(HttpProtocolUtil。getHttpHeader200(repText。length())repText);}OverridepublicvoiddoPost(Requestrequest,Responseresponse)throwsException{StringrepTexth1LoginServletbyPOSTmethodh1;response。output(HttpProtocolUtil。getHttpHeader200(repText。length())repText);}Overridepublicvoidinit()throwsException{}Overridepublicvoiddestroy()throwsException{}} 大家是否还记得,我们在学习Servlet的时候,在resources目录下面有个web。xml。我们这个版本也把这个xml文件给引入。lt;?xmlversion1。0encodingutf8?webappservletservletnameloginservletnameservletclasscom。tian。v4。LoginServletservletclassservletservletmappingservletnameloginservletnameurlpatternloginurlpatternservletmappingwebapp 既然引入了xml文件,那我们就需要去读取这个xml文件,并解析器内容。所以这里我们需要引入两个jar包。dependenciesdependencygroupIddom4jgroupIddom4jartifactIdversion1。6。1versiondependencydependencygroupIdjaxengroupIdjaxenartifactIdversion1。1。6versiondependencydependencies 万事俱备,只欠东风了。这时候我们来吧MyTomcat这个类做一些调整即可。 下面有个很重要的initServlet()方法,刚刚是对应下面这张图中的Listservlets,但是我们代码里使用的是Map来存储Servlet的,意思就那么个意思,把Servlet放在集合里。 这也就是为什么大家都把Tomcat叫做Servlet容器的原因,其实真正的容器还是java集合。packagecom。tian。v4;importcom。tian。v3。RequestV3;importcom。tian。v3。ResponseV3;importorg。dom4j。Document;importorg。dom4j。Element;importorg。dom4j。io。SAXReader;importjava。io。IOException;importjava。io。InputStream;importjava。io。OutputStream;importjava。net。ServerSocket;importjava。net。Socket;importjava。util。HashMap;importjava。util。List;importjava。util。Map;publicclassMyTomcat{设定启动和监听端口privatestaticfinalintPORT8090;存放Servlet信息,url:Servlet实例privateMapString,HttpServletservletMapnewHashMap();publicvoidstart()throwsException{System。out。println(mytomcatstarting。。。);initServlet();ServerSocketsocketnewServerSocket(PORT);while(true){Socketacceptsocket。accept();OutputStreamoutputStreamaccept。getOutputStream();分别封装RequestV3和ResponseV3RequestV4requestV3newRequestV4(accept。getInputStream());ResponseV4responseV3newResponseV4(outputStream);根据url来获取ServletHttpServlethttpServletservletMap。get(requestV3。getUrl());如果Servlet为空,说明是静态资源,不为空即为动态资源,需要执行Servlet里的方法if(httpServletnull){responseV3。outputHtml(requestV3。getUrl());}else{httpServlet。service(requestV3,responseV3);}accept。close();}}publicstaticvoidmain(String〔〕args)throwsException{MyTomcattomcatnewMyTomcat();tomcat。start();}解析web。xml文件,把url和servlet解析出来,并保存到一个java集合里(Map)publicvoidinitServlet()throwsException{InputStreamresourceAsStreamthis。getClass()。getClassLoader()。getResourceAsStream(web。xml);SAXReadersaxReadernewSAXReader();DocumentdocumentsaxReader。read(resourceAsStream);ElementrootElementdocument。getRootElement();ListElementlistrootElement。selectNodes(servlet);for(Elementelement:list){servletnameshowservletnameElementservletnameElement(Element)element。selectSingleNode(servletname);StringservletNameservletnameElement。getStringValue();servletclassserver。ShowServletservletclassElementservletclassElement(Element)element。selectSingleNode(servletclass);StringservletClassservletclassElement。getStringValue();根据servletname的值找到urlpatternElementservletMapping(Element)rootElement。selectSingleNode(webappservletmapping〔servletnameservletName〕);showStringurlPatternservletMapping。selectSingleNode(urlpattern)。getStringValue();servletMap。put(urlPattern,(HttpServlet)Class。forName(servletClass)。getDeclaredConstructor()。newInstance());}}} 启动,再次访问http:localhost:8090index。html 同时,我们可以访问http:localhost:8090login 到此,第四个版本也搞定了。 但是前面四个版本都有一个共同的问题,全部使用的是BIO。 BIO:同步并阻塞,服务器实现模式为一个连接一个线程,即客户端有连接请求时服务器端就需要启动一个线程进行处理,如果这个连接不做任何事情会造成不必要的线程开销,当然可以通过线程池机制改善。 所以,大家在网上看到的手写tomcat的,也有使用线程池来做的,这里希望大家能get到为什么使用线程池来实现。另外,其实在tomcat高版本中已经没有使用BIO了。 而HTTP1。1默认使用的就是NIO了。 但这个只是通信方式,重点是我们要理解和掌握tomcat的整体实现。总结 另外,发现上面都是讲配置文件解析,并将对应数据保存起来。熟悉这个套路后,大家是不是想到,我们很多配置项都是在server。xml中,还记得否?也是可以通过解析某个目录下的server。xml文件,并把内容赋给java中相应的变量罢了。 比如: 1。server。xml中的端口配置,我们是在代码里写死的而已,改成MyTomcat启动的时候去解析并获取不久得了吗? 2。我们通常是将我们项目的打成war,然后解压到某个目录下,最后还不是可以通过读取这个解压后的某个目录中找到web。xml,然后用回到上面的web。xml解析了。 本文主要是分享如何从一个塑料版到黄金版、然后铂金版,最后到砖石版。可以把加入线程池的版本称之为星耀版,最后把相关server。xml解析,以及读取我们放入到tomcat中项目解析可以称之为王者版。