Tomcat 系列-简易版 tomcat 实现

老马啸西风2020年3月27日大约 8 分钟

背景

Tomcat 作为Web服务器深受市场欢迎，有必要对其进行深入的研究。

在工作中，我们经常会把写好的代码打包放在Tomcat里并启动，然后在浏览器里就能愉快的调用我们写的代码来实现相应的功能了，那么Tomcat是如何工作的？

个人

个人主要是觉得 tomcat 过于冗余（或者说功能强大），有时候我只需要一个非常简单的功能即可。

所以想实现一个最简单的 tomcat。

Tomcat工作原理

我们启动Tomcat时双击的startup.bat文件的主要作用是找到catalina.bat，并且把参数传递给它，而 catalina.bat 中有这样一段话：

set MAINCLASS=org.apache.catalina.startup.Bootstrap

ps: 此处以我本地的 apache-tomcat-7.0.6-1 为例。

Bootstrap 引导类

我们可以直接在 catalina.bat 文件当前目录看到 bootstrap.jar，其中 Bootstrap.class 的代码就可以在这里查看。

Bootstrap.class 是整个Tomcat 的入口，我们在Tomcat源码里找到这个类，其中就有我们经常使用的main方法：

main()

public static void main(String[] args) {
    if (daemon == null) {
        Bootstrap bootstrap = new Bootstrap();
        try {
            bootstrap.init();
        } catch (Throwable var4) {
            handleThrowable(var4);
            var4.printStackTrace();
            return;
        }
        daemon = bootstrap;
    }
    try {
        String command = "start";
        if (args.length > 0) {
            command = args[args.length - 1];
        }
        if (command.equals("startd")) {
            args[args.length - 1] = "start";
            daemon.load(args);
            daemon.start();
        } else if (command.equals("stopd")) {
            args[args.length - 1] = "stop";
            daemon.stop();
        } else if (command.equals("start")) {
            daemon.setAwait(true);
            daemon.load(args);
            daemon.start();
        } else if (command.equals("stop")) {
            daemon.stopServer(args);
        } else if (command.equals("configtest")) {
            daemon.load(args);
            if (null == daemon.getServer()) {
                System.exit(1);
            }
            System.exit(0);
        } else {
            log.warn("Bootstrap: command \"" + command + "\" does not exist.");
        }
    } catch (Throwable var3) {
        handleThrowable(var3);
        var3.printStackTrace();
        System.exit(1);
    }
}

作用

这个类有两个作用：

初始化一个守护进程变量、加载类和相应参数。
解析命令，并执行。

server.xml

源码不过多赘述，我们在这里只需要把握整体架构，有兴趣的同学可以自己研究下源码。

Tomcat的server.xml配置文件中可以对应构架图中位置，多层的表示可以配置多个：

其实整体也不难理解。

组成

即一个由 Server->Service->Engine->Host->Context 组成的结构，从里层向外层分别是：

Server：

服务器Tomcat的顶级元素，它包含了所有东西。

Service：

一组 Engine(引擎) 的集合，包括线程池 Executor 和连接器 Connector 的定义。

Engine(引擎)：
一个 Engine代表一个完整的 Servlet 引擎，它接收来自Connector的请求，并决定传给哪个Host来处理。
Container(容器)：

Host、Context、Engine和Wraper都继承自Container接口，它们都是容器。

Connector(连接器)：

将Service和Container连接起来，注册到一个Service，把来自客户端的请求转发到Container。

Host：

即虚拟主机，所谓的”一个虚拟主机”可简单理解为”一个网站”。

Context(上下文 )：

即 Web 应用程序，一个 Context 即对于一个 Web 应用程序。

Context容器直接管理Servlet的运行，Servlet会被其给包装成一个StandardWrapper类去运行。

Wrapper负责管理一个Servlet的装载、初始化、执行以及资源回收，它是最底层容器。

梳理自己的 Tomcat 实现思路

整体思路

效果整体思路如下：

ServerSocket占用8080端口，用while（true）循环等待用户发请求。
拿到浏览器的请求，解析并返回URL地址，用I/O输入流读取本地磁盘上相应文件。
读取文件，不存在构建响应报文头、HTML正文内容，存在则写到浏览器端。

代码结构

├─bs
│      ColaBs.java
│
├─constant
│      ColaConst.java
│
├─domain
│      Request.java
│      Response.java
│
└─exception
        ColaException.java

其中常量和异常类可以不做关心。

代码

ColaBs.java

package com.github.houbb.cola.bs;

import com.github.houbb.cola.domain.Request;
import com.github.houbb.cola.domain.Response;
import com.github.houbb.cola.exception.ColaException;

import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.net.InetAddress;
import java.net.ServerSocket;
import java.net.Socket;
import java.net.UnknownHostException;

/**
 * @author binbin.hou
 * @since 0.0.1
 */
public final class ColaBs {

    /**
     * 用于判断是否需要关闭容器
     *
     * @since 0.0.1
     */
    private static volatile boolean shutdown = false;

    /**
     * 接受信息等待
     *
     * @since 0.0.1
     */
    private static void acceptWait() throws UnknownHostException {
        final int port = 8080;
        final InetAddress inetAddress = InetAddress.getByName("127.0.0.1");
        try(ServerSocket serverSocket = new ServerSocket(port, 1, inetAddress)) {
            System.out.println("Server start and listen on " + port);
            // 等待用户发请求
            while (!shutdown) {
                Socket socket = serverSocket.accept();
                InputStream is = socket.getInputStream();
                OutputStream os = socket.getOutputStream();

                // 接受请求参数
                Request request = new Request(is);

                // 创建用于返回浏览器的对象
                Response response = new Response(request, os);
                response.flush();

                //关闭一次请求的socket,因为http请求就是采用短连接的方式
                socket.close();

                //如果请求地址是/shutdown  则关闭容器
                shutdown = request.getUrl().equals("/shutdown");
            }

            System.out.println("Server shut down!");
        } catch (IOException e) {
            throw new ColaException(e);
        }
    }

    public static void main(String[] args) {
        try {
            ColaBs.acceptWait();
        } catch (UnknownHostException e) {
            e.printStackTrace();
        }
    }

}

Request.java

package com.github.houbb.cola.domain;

import com.github.houbb.cola.constant.ColaConst;
import com.github.houbb.cola.exception.ColaException;
import com.github.houbb.heaven.util.lang.StringUtil;

import java.io.IOException;
import java.io.InputStream;
import java.io.UnsupportedEncodingException;
import java.net.URLDecoder;
import java.nio.charset.StandardCharsets;

/**
 * 请求入参
 * @author binbin.hou
 * @since 0.0.1
 */
public class Request {

    /**
     * 输入流
     * @since 0.0.1
     */
    private String url;

    /**
     * 新建请求对象
     * @param is 输入流
     * @since 0.0.1
     */
    public Request(InputStream is) {
        try {
            // 只读取固定长度的内容。
            byte[] bytes = new byte[ColaConst.BUFFER_SIZE];
            int readSize = is.read(bytes);
            final String requestString = new String(bytes, StandardCharsets.UTF_8);

            System.out.println("[Request] received request " + requestString);
            // 处理请求头信息
            this.url = parseUrL(requestString);
        } catch (IOException e) {
            throw new ColaException(e);
        }
    }

    /**
     * 获取 url 信息
     * @since 0.0.1
     */
    public String getUrl() {
        return this.url;
    }

    /**
     * 转换 url
     *
     * 1. 直接根据 http 请求头进行截取。
     * @param requestString 请求字符串
     * @return 结果
     * @since 0.0.1
     */
    private String parseUrL(String requestString) {
        try {
            int index1, index2;
            //看socket获取请求头是否有值
            index1 = requestString.indexOf(' ');
            if (index1 != -1) {
                // 截取 GET 之后的内容
                index2 = requestString.indexOf(' ', index1 + 1);
                if (index2 > index1) {
                    String url = requestString.substring(index1 + 1, index2);
                    // 进行一次反转义，避免中文等被处理
                    return URLDecoder.decode(url, "UTF-8");
                }
            }

            return StringUtil.EMPTY;
        } catch (UnsupportedEncodingException e) {
            throw new ColaException(e);
        }
    }

}

Response.java

package com.github.houbb.cola.domain;

import java.io.IOException;
import java.io.OutputStream;
import java.nio.charset.StandardCharsets;

/**
 * 请求出参
 * @author binbin.hou
 * @since 0.0.1
 */
public class Response {

    /**
     * 请求信息
     *
     * @since 0.0.1
     */
    private Request request;

    /**
     * 输出流
     *
     * @since 0.0.1
     */
    private OutputStream outputStream;

    public Response(Request request, OutputStream outputStream) {
        this.request = request;
        this.outputStream = outputStream;
    }

    /**
     * 刷回文件内容到页面
     *
     * @throws IOException 浏览器
     * @since 0.0.1
     */
    public void flush() throws IOException {
        final String url = request.getUrl();
        //返回给浏览器响应提示,这里可以拼接HTML任何元素
        String returnMessage = "HTTP/1.1 200\r\n" +
                "Content-Type: text/html;charset=UTF-8\r\n" +
                "Content-Length: " + url.length() + "\r\n" +
                "\r\n" +
                url;
        outputStream.write(returnMessage.getBytes(StandardCharsets.UTF_8));
    }

}

入门例子

启动服务端

直接运行 ColaBs.main() 方法启动应用

页面访问

浏览器访问 http://127.0.0.1:8080/dd

页面返回

/dd

后台日志

其实每次页面请求，对应的都是一个 Http 请求如下：

[Request] received request 
GET /dd HTTP/1.1
Host: 127.0.0.1:8080
Connection: keep-alive
Cache-Control: max-age=0
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36
Sec-Fetch-Dest: document
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9
Sec-Fetch-Site: none
Sec-Fetch-Mode: navigate
Sec-Fetch-User: ?1
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8