06 最佳实践：如何在生产中编写最优 Dockerfile？在介绍 Dockerfile 最佳实践前，这里再强调一下，生产实践中一定优先使用 Dockerfile 的方式构建镜像。 因为使用 Dockerfile 构建镜像可以带来很多好处：

易于版本化管理，Dockerfile 本身是一个文本文件，方便存放在代码仓库做版本管理，可以很方便地找到各个版本之间的变更历史；
过程可追溯，Dockerfile 的每一行指令代表一个镜像层，根据 Dockerfile 的内容即可很明确地查看镜像的完整构建过程；
屏蔽构建环境异构，使用 Dockerfile 构建镜像无须考虑构建环境，基于相同 Dockerfile 无论在哪里运行，构建结果都一致。

虽然有这么多好处，但是如果你 Dockerfile 使用不当也会引发很多问题。比如镜像构建时间过长，甚至镜像构建失败；镜像层数过多，导致镜像文件过大。所以，这一课时我就教你如何在生产环境中编写最优的 Dockerfile。

在介绍 Dockerfile 最佳实践前，我们再聊一下我们平时书写 Dockerfile 应该尽量遵循的原则。

Dockerfile 书写原则

遵循以下 Dockerfile 书写原则，不仅可以使得我们的 Dockerfile 简洁明了，让协作者清楚地了解镜像的完整构建流程，还可以帮助我们减少镜像的体积，加快镜像构建的速度和分发速度。

（1）单一职责

由于容器的本质是进程，一个容器代表一个进程，因此不同功能的应用应该尽量拆分为不同的容器，每个容器只负责单一业务进程。

（2）提供注释信息

Dockerfile 也是一种代码，我们应该保持良好的代码编写习惯，晦涩难懂的代码尽量添加注释，让协作者可以一目了然地知道每一行代码的作用，并且方便扩展和使用。

（3）保持容器最小化

应该避免安装无用的软件包，比如在一个 nginx 镜像中，我并不需要安装 vim 、gcc 等开发编译工具。这样不仅可以加快容器构建速度，而且可以避免镜像体积过大。

（4）合理选择基础镜像

容器的核心是应用，因此只要基础镜像能够满足应用的运行环境即可。例如一个

Java 类型的应用运行时只需要

JRE ，并不需要

JDK ，因此我们的基础镜像只需要安装

JRE 环境即可。

（5）使用 .dockerignore 文件

在使用

git 时，我们可以使用

.gitignore 文件忽略一些不需要做版本管理的文件。同理，使用

.dockerignore 文件允许我们在构建时，忽略一些不需要参与构建的文件，从而提升构建效率。

.dockerignore 的定义类似于

.gitignore 。

.dockerignore 的本质是文本文件，Docker 构建时可以使用换行符来解析文件定义，每一行可以忽略一些文件或者文件夹。具体使用方式如下：规则含义 /# /# 开头的表示注释，/# 后面所有内容将会被忽略 /tmp 匹配当前目录下任何以 tmp 开头的文件或者文件夹 /.md 匹配以 .md 为后缀的任意文件 tem? 匹配以 tem 开头并且以任意字符结尾的文件，？代表任意一个字符 !README.md ! 表示排除忽略。例如 .dockerignore 定义如下： /.md !README.md 表示除了 README.md 文件外所有以 .md 结尾的文件。

（6）尽量使用构建缓存

Docker 构建过程中，每一条 Dockerfile 指令都会提交为一个镜像层，下一条指令都是基于上一条指令构建的。如果构建时发现要构建的镜像层的父镜像层已经存在，并且下一条命令使用了相同的指令，即可命中构建缓存。

Docker 构建时判断是否需要使用缓存的规则如下：

从当前构建层开始，比较所有的子镜像，检查所有的构建指令是否与当前完全一致，如果不一致，则不使用缓存；
一般情况下，只需要比较构建指令即可判断是否需要使用缓存，但是有些指令除外（例如

ADD 和

COPY ）；

对于

ADD 和

COPY 指令不仅要校验命令是否一致，还要为即将拷贝到容器的文件计算校验和（根据文件内容计算出的一个数值，如果两个文件计算的数值一致，表示两个文件内容一致），命令和校验和完全一致，才认为命中缓存。

因此，基于 Docker 构建时的缓存特性，我们可以把不轻易改变的指令放到 Dockerfile 前面（例如安装软件包），而可能经常发生改变的指令放在 Dockerfile 末尾（例如编译应用程序）。

例如，我们想要定义一些环境变量并且安装一些软件包，可以按照如下顺序编写 Dockerfile： FROM centos:7 /# 设置环境变量指令放前面 ENV PATH /usr/local/bin:$PATH /# 安装软件指令放前面 RUN yum install -y make /# 把业务软件的配置,版本等经常变动的步骤放最后 …

按照上面原则编写的 Dockerfile 在构建镜像时，前面步骤命中缓存的概率会增加，可以大大缩短镜像构建时间。

（7）正确设置时区

我们从 Docker Hub 拉取的官方操作系统镜像大多数都是 UTC 时间（世界标准时间）。如果你想要在容器中使用中国区标准时间（东八区），请根据使用的操作系统修改相应的时区信息，下面我介绍几种常用操作系统的修改方式：

Ubuntu 和Debian 系统

Ubuntu 和Debian 系统可以向 Dockerfile 中添加以下指令： RUN ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime RUN echo “Asia/Shanghai” » /etc/timezone

CentOS系统

CentOS 系统则向 Dockerfile 中添加以下指令： RUN ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime

（8）使用国内软件源加快镜像构建速度

由于我们常用的官方操作系统镜像基本都是国外的，软件服务器大部分也在国外，所以我们构建镜像的时候想要安装一些软件包可能会非常慢。

这里我以 CentOS 7 为例，介绍一下如何使用 163 软件源（国内有很多大厂，例如阿里、腾讯、网易等公司都免费提供的软件加速源）加快镜像构建。

首先在容器构建目录创建文件 CentOS7-Base-163.repo，文件内容如下： /# CentOS-Base.repo /# /# The mirror system uses the connecting IP address of the client and the /# update status of each mirror to pick mirrors that are updated to and /# geographically close to the client. You should use this for CentOS updates /# unless you are manually picking other mirrors. /# /# If the mirrorlist= does not work for you, as a fall back you can try the /# remarked out baseurl= line instead. /# /# [base] name=CentOS-$releasever - Base - 163.com /#mirrorlist=http://mirrorlist.centos.org/?release=$releasever&arch=$basearch&repo=os baseurl=http://mirrors.163.com/centos/$releasever/os/$basearch/ gpgcheck=1 gpgkey=http://mirrors.163.com/centos/RPM-GPG-KEY-CentOS-7 /#released updates [updates] name=CentOS-$releasever - Updates - 163.com /#mirrorlist=http://mirrorlist.centos.org/?release=$releasever&arch=$basearch&repo=updates baseurl=http://mirrors.163.com/centos/$releasever/updates/$basearch/ gpgcheck=1 gpgkey=http://mirrors.163.com/centos/RPM-GPG-KEY-CentOS-7 /#additional packages that may be useful [extras] name=CentOS-$releasever - Extras - 163.com /#mirrorlist=http://mirrorlist.centos.org/?release=$releasever&arch=$basearch&repo=extras baseurl=http://mirrors.163.com/centos/$releasever/extras/$basearch/ gpgcheck=1 gpgkey=http://mirrors.163.com/centos/RPM-GPG-KEY-CentOS-7 /#additional packages that extend functionality of existing packages [centosplus] name=CentOS-$releasever - Plus - 163.com baseurl=http://mirrors.163.com/centos/$releasever/centosplus/$basearch/ gpgcheck=1 enabled=0 gpgkey=http://mirrors.163.com/centos/RPM-GPG-KEY-CentOS-7

然后在 Dockerfile 中添加如下指令：

COPY CentOS7-Base-163.repo /etc/yum.repos.d/CentOS7-Base.repo

执行完上述步骤后，再使用

yum install 命令安装软件时就会默认从 163 获取软件包，这样可以大大提升构建速度。

（9）最小化镜像层数

在构建镜像时尽可能地减少 Dockerfile 指令行数。例如我们要在 CentOS 系统中安装

make 和

net-tools 两个软件包，应该在 Dockerfile 中使用以下指令： RUN yum install -y make net-tools

而不应该写成这样：

RUN yum install -y make RUN yum install -y make

了解完 Dockerfile 的书写原则后，我们再来具体了解下这些原则落实到具体的 Dockerfile 指令应该如何书写。

Dockerfile 指令书写建议

下面是我们常用的一些指令，这些指令对于刚接触 Docker 的人来说会非常容易出错，下面我对这些指令的书写建议详细讲解一下。

（1）RUN

RUN 指令在构建时将会生成一个新的镜像层并且执行

RUN 指令后面的内容。

使用

RUN 指令时应该尽量遵循以下原则：

RUN 指令后面跟的内容比较复杂时，建议使用反斜杠（\）结尾并且换行；

RUN 指令后面的内容尽量按照字母顺序排序，提高可读性。

例如，我想在官方的 CentOS 镜像下安装一些软件，一个建议的 Dockerfile 指令如下： FROM centos:7 RUN yum install -y automake \ curl \ python \ vim

（2）CMD 和 ENTRYPOINT

CMD 和

ENTRYPOINT 指令都是容器运行的命令入口，这两个指令使用中有很多相似的地方，但是也有一些区别。

这两个指令的相同之处，

CMD 和

ENTRYPOINT 的基本使用格式分为两种。

第一种为

CMD /

ENTRYPOINT [“command” , “param”]。这种格式是使用 Linux 的

exec 实现的，一般称为

exec 模式，这种书写格式为

CMD /

ENTRYPOINT 后面跟 json 数组，也是Docker 推荐的使用格式。

另外一种格式为

CMD /

ENTRYPOINT command param ，这种格式是基于 shell 实现的，通常称为

shell 模式。当使用

shell 模式时，Docker 会以 /bin/sh -c command 的方式执行命令。

这两个指令的区别：

Dockerfile 中如果使用了

ENTRYPOINT 指令，启动 Docker 容器时需要使用 –entrypoint 参数才能覆盖 Dockerfile 中的

ENTRYPOINT 指令，而使用

CMD 设置的命令则可以被

docker run 后面的参数直接覆盖。

ENTRYPOINT 指令可以结合

CMD 指令使用，也可以单独使用，而

CMD 指令只能单独使用。

看到这里你也许会问，我什么时候应该使用

ENTRYPOINT ,什么时候使用

CMD 呢？

如果你希望你的镜像足够灵活，推荐使用

CMD 指令。如果你的镜像只执行单一的具体程序，并且不希望用户在执行

docker run 时覆盖默认程序，建议使用

ENTRYPOINT 。

最后再强调一下，无论使用

CMD 还是

ENTRYPOINT ，都尽量使用

exec 模式。

（3）ADD 和 COPY

ADD 和

COPY 指令功能类似，都是从外部往容器内添加文件。但是

COPY 指令只支持基本的文件和文件夹拷贝功能，

ADD 则支持更多文件来源类型，比如自动提取 tar 包，并且可以支持源文件为 URL 格式。

那么在日常应用中，我们应该使用哪个命令向容器里添加文件呢？你可能在想，既然

ADD 指令支持的功能更多，当然应该使用

ADD 指令了。然而事实恰恰相反，我更推荐你使用

COPY 指令，因为

COPY 指令更加透明，仅支持本地文件向容器拷贝，而且使用

COPY 指令可以更好地利用构建缓存，有效减小镜像体积。

当你想要使用

ADD 向容器中添加 URL 文件时，请尽量考虑使用其他方式替代。例如你想要在容器中安装 memtester（一种内存压测工具），你应该避免使用以下格式： ADD http://pyropus.ca/software/memtester/old-versions/memtester-4.3.0.tar.gz /tmp/ RUN tar -xvf /tmp/memtester-4.3.0.tar.gz -C /tmp RUN make -C /tmp/memtester-4.3.0 && make -C /tmp/memtester-4.3.0 install

下面是推荐写法：

RUN wget -O /tmp/memtester-4.3.0.tar.gz http://pyropus.ca/software/memtester/old-versions/memtester-4.3.0.tar.gz \ && tar -xvf /tmp/memtester-4.3.0.tar.gz -C /tmp \ && make -C /tmp/memtester-4.3.0 && make -C /tmp/memtester-4.3.0 install

（4）WORKDIR

为了使构建过程更加清晰明了，推荐使用 WORKDIR 来指定容器的工作路径，应该尽量避免使用 RUN cd /work/path && do some work 这样的指令。

最后给出几个常用软件的官方 Dockerfile 示例链接，希望可以对你有所帮助。

结语

好了，到此为止，相信你已经对 Dockerfile 的书写原则和一些重要指令有了较深的认识。

当你需要编写编译型语言（例如 Golang、Java）的 Dockerfile 时，如何分离编译环境和运行环境，使得镜像体积尽可能小呢？思考后，可以把你的想法写在留言区。

参考资料

https://learn.lianglianglee.com/%e4%b8%93%e6%a0%8f/%e7%94%b1%e6%b5%85%e5%85%a5%e6%b7%b1%e5%90%83%e9%80%8f%20Docker-%e5%ae%8c/06%20%20%e6%9c%80%e4%bd%b3%e5%ae%9e%e8%b7%b5%ef%bc%9a%e5%a6%82%e4%bd%95%e5%9c%a8%e7%94%9f%e4%ba%a7%e4%b8%ad%e7%bc%96%e5%86%99%e6%9c%80%e4%bc%98%20Dockerfile%ef%bc%9f.md

Dockerfile 书写原则
（1）单一职责
（2）提供注释信息
（3）保持容器最小化
（4）合理选择基础镜像
（5）使用 .dockerignore 文件
（6）尽量使用构建缓存
（7）正确设置时区
（8）使用国内软件源加快镜像构建速度
（9）最小化镜像层数
Dockerfile 指令书写建议
（1）RUN
（2）CMD 和 ENTRYPOINT
（3）ADD 和 COPY
（4）WORKDIR
结语
参考资料

由浅入深吃透Docker~完-06最佳实践：如何在生产中编写最优Dockerfile？

Dockerfile 书写原则

（1）单一职责

（2）提供注释信息

（3）保持容器最小化

（4）合理选择基础镜像

（5）使用 .dockerignore 文件

（6）尽量使用构建缓存

（7）正确设置时区

（8）使用国内软件源加快镜像构建速度

（9）最小化镜像层数

Dockerfile 指令书写建议

（1）RUN

（2）CMD 和 ENTRYPOINT

（3）ADD 和 COPY

（4）WORKDIR

结语

参考资料

更多学习