Go语言项目开发实战-29控制流（下）：iam~apiserver服务核心功能实现讲解

29 控制流（下）：iam-apiserver服务核心功能实现讲解你好，我是孔令飞。

上一讲，我介绍了 iam-apiserver 是如何构建 Web 服务的。这一讲，我们再来看下 iam-apiserver 中的核心功能实现。在对这些核心功能的讲解中，我会向你传达我的程序设计思路。

iam-apiserver 中包含了很多优秀的设计思想和实现，这些点可能比较零碎，但我觉得很值得分享给你。我将这些关键代码设计分为 3 类，分别是应用框架相关的特性、编程规范相关的特性和其他特性。接下来，我们就来详细看看这些设计点，以及它们背后的设计思想。

应用框架相关的特性

应用框架相关的特性包括三个，分别是优雅关停、健康检查和插件化加载中间件。

优雅关停

在讲优雅关停之前，先来看看不优雅的停止服务方式是什么样的。

当我们需要重启服务时，首先需要停止服务，这时可以通过两种方式来停止我们的服务：

在 Linux 终端键入 Ctrl + C（其实是发送 SIGINT 信号）。
发送 SIGTERM 信号，例如

kill 或者

systemctl stop 等。

当我们使用以上两种方式停止服务时，都会产生下面两个问题：

有些请求正在处理，如果服务端直接退出，会造成客户端连接中断，请求失败。
我们的程序可能需要做一些清理工作，比如等待进程内任务队列的任务执行完成，或者拒绝接受新的消息等。

这些问题都会对业务造成影响，所以我们需要一种优雅的方式来关停我们的应用。在 Go 开发中，通常通过拦截

SIGINT 和

SIGTERM 信号，来实现优雅关停。当收到这两个信号时，应用进程会做一些清理工作，然后结束阻塞状态，继续执行余下的代码，最后自然退出进程。

先来看一个简单的优雅关停的示例代码： package main import ( “context” “log” “net/http” “os” “os/signal” “time” “github.com/gin-gonic/gin” ) func main() { router := gin.Default() router.GET(“/”, func(c /gin.Context) { time.Sleep(5 / time.Second) c.String(http.StatusOK, “Welcome Gin Server”) }) srv := &http.Server{ Addr: “:8080”, Handler: router, } go func() { // 将服务在 goroutine 中启动 if err := srv.ListenAndServe(); err != nil && err != http.ErrServerClosed { log.Fatalf(“listen: %s\n”, err) } }() quit := make(chan os.Signal) signal.Notify(quit, os.Interrupt) <-quit // 阻塞等待接收 channel 数据 log.Println(“Shutdown Server …”) ctx, cancel := context.WithTimeout(context.Background(), 5/*time.Second) // 5s 缓冲时间处理已有请求 defer cancel() if err := srv.Shutdown(ctx); err != nil { // 调用 net/http 包提供的优雅关闭函数：Shutdown log.Fatal(“Server Shutdown:”, err) } log.Println(“Server exiting”) }

上面的代码实现优雅关停的思路如下：

将 HTTP 服务放在 goroutine 中运行，程序不阻塞，继续执行。
创建一个无缓冲的 channel

quit ，调用

signal.Notify(quit, os.Interrupt) 。通过 signal.Notify 函数调用，可以将进程收到的 os.Interrupt（SIGINT）信号，发送给 channel

quit 。

<-quit 阻塞当前 goroutine（也就是 main 函数所在的 goroutine），等待从 channel

quit 接收关停信号。通过以上步骤，我们成功启动了 HTTP 服务，并且 main 函数阻塞，防止启动 HTTP 服务的 goroutine 退出。当我们键入

Ctrl + C 时，进程会收到 SIGINT 信号，并将该信号发送到 channel

quit 中，这时候

<-quit 收到了 channel 另一端传来的数据，结束阻塞状态，程序继续执行。这里，

<-quit 唯一目的是阻塞当前的 goroutine，所以对收到的数据直接丢弃。

打印退出消息，提示准备退出当前服务。
调用

net/http 包提供的 Shutdown 方法，Shutdown 方法会在指定的时间内处理完现有请求，并返回。

最后，程序执行完

log.Println(“Server exiting”) 代码后，退出 main 函数。

iam-apiserver 也实现了优雅关停，优雅关停思路跟上面的代码类似。具体可以分为三个步骤，流程如下：

第一步，创建 channel 用来接收 os.Interrupt（SIGINT）和 syscall.SIGTERM（SIGKILL）信号。

代码见 internal/pkg/server/signal.go 。 var onlyOneSignalHandler = make(chan struct{}) var shutdownHandler chan os.Signal func SetupSignalHandler() <-chan struct{} { close(onlyOneSignalHandler) // panics when called twice shutdownHandler = make(chan os.Signal, 2) stop := make(chan struct{}) signal.Notify(shutdownHandler, shutdownSignals…) go func() { <-shutdownHandler close(stop) <-shutdownHandler os.Exit(1) // second signal. Exit directly. }() return stop }

SetupSignalHandler 函数中，通过

close(onlyOneSignalHandler) 来确保 iam-apiserver 组件的代码只调用一次 SetupSignalHandler 函数。否则，可能会因为信号传给了不同的 shutdownHandler，而造成信号丢失。

SetupSignalHandler 函数还实现了一个功能：收到一次 SIGINT/ SIGTERM 信号，程序优雅关闭。收到两次 SIGINT/ SIGTERM 信号，程序强制关闭。实现代码如下： go func() { <-shutdownHandler close(stop) <-shutdownHandler os.Exit(1) // second signal. Exit directly. }()

这里要注意：

signal.Notify(c chan<- os.Signal, sig …os.Signal) 函数不会为了向

c 发送信息而阻塞。也就是说，如果发送时

c 阻塞了，signal 包会直接丢弃信号。为了不丢失信号，我们创建了有缓冲的 channel

shutdownHandler 。

最后，SetupSignalHandler 函数会返回

stop ，后面的代码可以通过关闭

stop 来结束代码的阻塞状态。

第二步，将 channel

stop 传递给启动 HTTP（S）、gRPC 服务的函数，在函数中以 goroutine 的方式启动 HTTP（S）、gRPC 服务，然后执行

<-stop 阻塞 goroutine。

第三步，当 iam-apiserver 进程收到 SIGINT/SIGTERM 信号后，关闭

stop channel，继续执行

<-stop 后的代码，在后面的代码中，我们可以执行一些清理逻辑，或者调用

google.golang.org/grpc 和

net/http 包提供的优雅关停函数 GracefulStop 和 Shutdown。例如下面这个代码（位于 internal/apiserver/grpc.go 文件中）： func (s /*grpcAPIServer) Run(stopCh <-chan struct{}) { listen, err := net.Listen(“tcp”, s.address) if err != nil { log.Fatalf(“failed to listen: %s”, err.Error()) } log.Infof(“Start grpc server at %s”, s.address) go func() { if err := s.Serve(listen); err != nil { log.Fatalf(“failed to start grpc server: %s”, err.Error()) } }() <-stopCh log.Infof(“Grpc server on %s stopped”, s.address) s.GracefulStop() }

除了上面说的方法，iam-apiserver 还通过 github.com/marmotedu/iam/pkg/shutdown 包，实现了另外一种优雅关停方法，这个方法更加友好、更加灵活。实现代码见 PrepareRun 函数。

github.com/marmotedu/iam/pkg/shutdown 包的使用方法如下： package main import ( “fmt” “time” “github.com/marmotedu/iam/pkg/shutdown” “github.com/marmotedu/iam/pkg/shutdown/shutdownmanagers/posixsignal” ) func main() { // initialize shutdown gs := shutdown.New() // add posix shutdown manager gs.AddShutdownManager(posixsignal.NewPosixSignalManager()) // add your tasks that implement ShutdownCallback gs.AddShutdownCallback(shutdown.ShutdownFunc(func(string) error { fmt.Println(“Shutdown callback start”) time.Sleep(time.Second) fmt.Println(“Shutdown callback finished”) return nil })) // start shutdown managers if err := gs.Start(); err != nil { fmt.Println(“Start:”, err) return } // do other stuff time.Sleep(time.Hour) }

上面的代码中，通过

gs := shutdown.New() 创建 shutdown 实例；通过

AddShutdownManager 方法添加监听的信号；通过

AddShutdownCallback 方法设置监听到指定信号时，需要执行的回调函数。这些回调函数可以执行一些清理工作。最后，通过

Start 方法启动 shutdown 实例。

健康检查

通常，我们会根据进程是否存在来判定 iam-apiserver 是否健康，例如执行

ps -ef|grep iam-apiserver 。在实际开发中，我发现有时候服务进程仍然存在，但是 HTTP 服务却不能接收和处理请求，所以更加靠谱的检查方法是，直接请求 iam-apiserver 的健康检查接口。

我们可以在启动 iam-apiserver 进程后，手动调用 iam-apiserver 健康检查接口进行检查。但还有更方便的方法：启动服务后自动调用健康检查接口。这个方法的具体实现，你可以查看 GenericAPIServer 提供的 ping 方法。在 ping 方法中，你需要注意函数中的如下代码： url := fmt.Sprintf(“http://%s/healthz”, s.InsecureServingInfo.Address) if strings.Contains(s.InsecureServingInfo.Address, “0.0.0.0”) { url = fmt.Sprintf(“http://127.0.0.1:%s/healthz”, strings.Split(s.InsecureServingInfo.Address, “:”)[1]) }

当 HTTP 服务监听在所有网卡时，请求 IP 为

127.0.0.1 ；当 HTTP 服务监听在指定网卡时，我们需要请求该网卡的 IP 地址。

插件化加载中间件

iam-apiserver 支持插件化地加载 Gin 中间件，通过这种插件机制，我们可以根据需要选择中间件。

那么，为什么要将中间件做成一种插件化的机制呢？一方面，每个中间件都完成某种功能，这些功能不是所有情况下都需要的；另一方面，中间件是追加在 HTTP 请求链路上的一个处理函数，会影响 API 接口的性能。为了保证 API 接口的性能，我们也需要选择性地加载中间件。

例如，在测试环境中为了方便 Debug，可以选择加载 dump 中间件。dump 中间件可以打印请求包和返回包信息，这些信息可以协助我们 Debug。但是在现网环境中，我们不需要 dump 中间件来协助 Debug，而且如果加载了 dump 中间件，请求时会打印大量的请求信息，严重影响 API 接口的性能。这时候，我们就期望中间件能够按需加载。

iam-apiserver 通过 InstallMiddlewares 函数来安装 Gin 中间件，函数代码如下： func (s /*GenericAPIServer) InstallMiddlewares() { // necessary middlewares s.Use(middleware.RequestID()) s.Use(middleware.Context()) // install custom middlewares for _, m := range s.middlewares { mw, ok := middleware.Middlewares[m] if !ok { log.Warnf(“can not find middleware: %s”, m) continue } log.Infof(“install middleware: %s”, m) s.Use(mw) } }

可以看到，安装中间件时，我们不仅安装了一些必备的中间件，还安装了一些可配置的中间件。

上述代码安装了两个默认的中间件： RequestID 和 Context 。

RequestID 中间件，主要用来在 HTTP 请求头和返回头中设置

X-Request-ID Header。如果 HTTP 请求头中没有

X-Request-ID HTTP 头，则创建 64 位的 UUID，如果有就复用。UUID 是调用

github.com/satori/go.uuid 包提供的

NewV4().String() 方法来生成的： rid = uuid.NewV4().String()

另外，这里有个 Go 常量的设计规范需要你注意：常量要跟该常量相关的功能包放在一起，不要将一个项目的常量都集中放在 const 这类包中。例如， requestid.go 文件中，我们定义了

XRequestIDKey = “X-Request-ID” 常量，其他地方如果需要使用

XRequestIDKey ，只需要引入

XRequestIDKey 所在的包，并使用即可。

Context 中间件，用来在 gin.Context 中设置

requestID 和

username 键，在打印日志时，将 gin.Context 类型的变量传递给

log.L() 函数，

log.L() 函数会在日志输出中输出

requestID 和

username 域： 2021-07-09 13:33:21.362 DEBUG apiserver v1/user.go:106 get 2 users from backend storage. {“requestID”: “f8477cf5-4592-4e47-bdcf-82f7bde2e2d0”, “username”: “admin”}

requestID 和

username 字段可以方便我们后期过滤并查看日志。

除了默认的中间件，iam-apiserver 还支持一些可配置的中间件，我们可以通过配置 iam-apiserver 配置文件中的 server.middlewares 配置项，来配置这些这些中间件。

可配置以下中间件：

recovery：捕获任何 panic，并恢复。
secure：添加一些安全和资源访问相关的 HTTP 头。
nocache：禁止客户端缓存 HTTP 请求的返回结果。
cors：HTTP 请求跨域中间件。
dump：打印出 HTTP 请求包和返回包的内容，方便 debug。注意，生产环境禁止加载该中间件。

当然，你还可以根据需要，添加更多的中间件。方法很简单，只需要编写中间件，并将中间件添加到一个

map[string]gin.HandlerFunc 类型的变量中即可： func defaultMiddlewares() map[string]gin.HandlerFunc { return map[string]gin.HandlerFunc{ “recovery”: gin.Recovery(), “secure”: Secure, “options”: Options, “nocache”: NoCache, “cors”: Cors(), “requestid”: RequestID(), “logger”: Logger(), “dump”: gindump.Dump(), } }

上述代码位于 internal/pkg/middleware/middleware.go 文件中。

编程规范相关的特性

编程规范相关的特性有四个，分别是 API 版本、统一的资源元数据、统一的返回、并发处理模板。

API 版本

RESTful API 为了方便以后扩展，都需要支持 API 版本。在 12 讲中，我们介绍了 API 版本号的 3 种标识方法，iam-apiserver 选择了将 API 版本号放在 URL 中，例如

/v1/secrets 。放在 URL 中的好处是很直观，看 API 路径就知道版本号。另外，API 的路径也可以很好地跟控制层、业务层、模型层的代码路径相映射。例如，密钥资源相关的代码存放位置如下： internal/apiserver/controller/v1/secret/ /# 控制几层代码存放位置 internal/apiserver/service/v1/secret.go /# 业务层代码存放位置 github.com/marmotedu/api/apiserver/v1/secret.go /# 模型层代码存放位置

关于代码存放路径，我还有一些地方想跟你分享。对于 Secret 资源，通常我们需要提供 CRUD 接口。

C：Create（创建 Secret）。
R：Get（获取详情）、List（获取 Secret 资源列表）。
U：Update（更新 Secret）。
D：Delete（删除指定的 Secret）、DeleteCollection（批量删除 Secret）。

每个接口相互独立，为了减少更新 A 接口代码时因为误操作影响到 B 接口代码的情况，这里建议 CRUD 接口每个接口一个文件，从物理上将不同接口的代码隔离开。这种接口还可以方便我们查找 A 接口的代码所在位置。例如，Secret 控制层相关代码的存放方式如下： $ ls internal/apiserver/controller/v1/secret/ create.go delete_collection.go delete.go doc.go get.go list.go secret.go update.go

业务层和模型层的代码也可以这么组织。iam-apiserver 中，因为 Secret 的业务层和模型层代码比较少，所以我放在了

internal/apiserver/service/v1/secret.go 和

github.com/marmotedu/api/apiserver/v1/secret.go 文件中。如果后期 Secret 业务代码增多，我们也可以修改成下面这种方式：

$ ls internal/apiserver/service/v1/secret/ create.go delete_collection.go delete.go doc.go get.go list.go secret.go update.go

这里再说个题外话：

/v1/secret/ 和

/secret/v1/ 这两种目录组织方式都可以，你选择一个自己喜欢的就行。

当我们需要升级 API 版本时，相关代码可以直接放在

v2 目录下，例如： internal/apiserver/controller/v2/secret/ /# v2 版本控制几层代码存放位置 internal/apiserver/service/v2/secret.go /# v2 版本业务层代码存放位置 github.com/marmotedu/api/apiserver/v2/secret.go /# v2 版本模型层代码存放位置

这样既能够跟 v1 版本的代码物理隔离开，互不影响，又方便查找 v2 版本的代码。

统一的资源元数据

iam-apiserver 设计的一大亮点是，像Kubernetes REST 资源一样，支持统一的资源元数据。

iam-apiserver 中所有的资源都是 REST 资源，iam-apiserver 将 REST 资源的属性也进一步规范化了，这里的规范化是指所有的 REST 资源均支持两种属性：

公共属性。
资源自有的属性。

例如，Secret 资源的定义方式如下： type Secret struct { // May add TypeMeta in the future. // metav1.TypeMeta json:",inline" // Standard object’s metadata. metav1.ObjectMeta ` json:”metadata,omitempty” Username string json:”username” gorm:”column:username” validate:”omitempty” SecretID string json:”secretID” gorm:”column:secretID” validate:”omitempty” SecretKey string json:”secretKey” gorm:”column:secretKey” validate:”omitempty” // Required: true Expires int64 json:”expires” gorm:”column:expires” validate:”omitempty” Description string json:”description” gorm:”column:description” validate:”description”` }

资源自有的属性，会因资源不同而不同。这里，我们来重点看一下公共属性 ObjectMeta ，它的定义如下：

type ObjectMeta struct { ID uint64 json:"id,omitempty" gorm:"primary_key;AUTO_INCREMENT;column:id" InstanceID string json:"instanceID,omitempty" gorm:"unique;column:instanceID;type:varchar(32);not null" Name string json:"name,omitempty" gorm:"column:name;type:varchar(64);not null" validate:"name" Extend Extend json:"extend,omitempty" gorm:"-" validate:"omitempty" ExtendShadow string json:"-" gorm:"column:extendShadow" validate:"omitempty" CreatedAt time.Time json:"createdAt,omitempty" gorm:"column:createdAt" UpdatedAt time.Time json:"updatedAt,omitempty" gorm:"column:updatedAt" }

接下来，我来详细介绍公共属性中每个字段的含义及作用。

这里的 ID，映射为 MariaDB 数据库中的

id 字段。

id 字段在一些应用中，会作为资源的唯一标识。但 iam-apiserver 中没有使用 ID 作为资源的唯一标识，而是使用了 InstanceID。iam-apiserver 中 ID 唯一的作用是跟数据库

id 字段进行映射，代码中并没有使用到

ID 。

InstanceID

InstanceID 是资源的唯一标识，格式为

-xxxxxx 。其中，是资源的英文标识符号， xxxxxx 是随机字符串。字符集合为 abcdefghijklmnopqrstuvwxyz1234567890 ，长度>=6，例如 secret-yj8m30 、 user-j4lz3g 、 policy-3v18jq 。腾讯云、阿里云、华为云也都是采用这种格式的字符串作为资源唯一标识的。 InstanceID 的生成和更新都是自动化的，通过 gorm 提供的 AfterCreate Hooks 在记录插入数据库之后，生成并更新到数据库的 instanceID 字段： func (s /*Secret) AfterCreate(tx /*gorm.DB) (err error) { s.InstanceID = idutil.GetInstanceID(s.ID, "secret-") return tx.Save(s).Error } 上面的代码，在 Secret 记录插入到 iam 数据库的 secret 表之后，调用 idutil.GetInstanceID 生成 InstanceID，并通过 tx.Save(s) 更新到数据库 secret 表的 instanceID 字段。因为通常情况下，应用中的 REST 资源只会保存到数据库中的一张表里，这样就能保证应用中每个资源的数据库 ID 是唯一的。所以 GetInstanceID(uid uint64, prefix string) string 函数使用 github.com/speps/go-hashids 包提供的方法，对这个数据库 ID 进行哈希，最终得到一个数据库级别的唯一的字符串（例如： 3v18jq ），并根据传入的 prefix，得到资源的 InstanceID。使用这种方式生成资源的唯一标识，有下面这两个优点： * 数据库级别唯一。 * InstanceID 是长度可控的字符串，长度最小是 6 个字符，但会根据表中的记录个数动态变长。根据我的测试，2176782336 条记录以内生成的 InstanceID 长度都在 6 个字符以内。长度可控的另外一个好处是方便记忆和传播。这里需要你注意：如果同一个资源分别存放在不同的表中，那在使用这种方式时，生成的 InstanceID 可能相同，不过概率很小，几乎为零。这时候，我们就需要使用分布式 ID 生成技术。这又是另外一个话题了，这里不再扩展讲解。在实际的开发中，不少开发者会使用数据库数字段 ID（例如 121 ）和 36⁄64 位的 UUID（例如 20cd59d4-08c6-4e86-a9d4-a0e51c420a04 ）来作为资源的唯一标识。相较于这两种资源标识方式，使用 -xxxxxx 这种标识方式具有以下优点： * 看标识名就知道是什么类型的资源，例如： secret-yj8m30 说明该资源是 secret 类型的资源。在实际的排障过程中，能够有效减少误操作。 * 长度可控，占用数据库空间小。iam-apiserver 的资源标识长度基本可以认为是 12 个字符（secret/policy 是 6 个字符，再加 6 位随机字符）。 * 如果使用 121 这类数值作为资源唯一标识，相当于间接向友商透漏系统的规模，是一定要禁止的。另外，还有一些系统如 Kubernetes 中，使用资源名作为资源唯一标识。这种方式有个弊端，就是当系统中同类资源太多时，创建资源很容易重名，你自己想要的名字往往填不了，所以 iam-apiserver 不采用这种设计方式。我们使用 instanceID 来作为资源的唯一标识，在代码中，就经常需要根据 instanceID 来查询资源。所以，在数据库中要设置该字段为唯一索引，一方面可以防止 instanceID 不唯一，另一方面也能加快查询速度。 * Name Name 即资源的名字，我们可以通过名字很容易地辨别一个资源。 * Extend、ExtendShadow Extend 和 ExtendShadow 是 iam-apiserver 设计的又一大亮点。在实际开发中，我们经常会遇到这个问题：随着业务发展，某个资源需要增加一些属性，这时，我们可能会选择在数据库中新增一个数据库字段。但是，随着业务系统的演进，数据库中的字段越来越多，我们的 Code 也要做适配，最后就会越来越难维护。我们还可能遇到这种情况：我们将上面说的字段保存在数据库中叫 meta 的字段中，数据库中 meta 字段的数据格式是 {"disable":true,"tag":"colin"} 。但是，我们如果想在代码中使用这些字段，需要 Unmarshal 到一个结构体中，例如： metaData := `{"disable":true,"tag":"colin"}` meta := make(map[string]interface{}) if err := json.Unmarshal([]byte(metaData), &meta); err != nil { return err } 再存入数据中时，又要 Marshal 成 JSON 格式的字符串，例如： meta := map[string]interface{}{"disable": true, "tag": "colin"} data, err := json.Marshal(meta) if err != nil { return err } 你可以看到，这种 Unmarshal 和 Marshal 操作有点繁琐。因为每个资源都可能需要用到扩展字段，那么有没有一种通用的解决方案呢？iam-apiserver 就通过 Extend 和 ExtendShadow 解决了这个问题。 Extend 是 Extend 类型的字段，Extend 类型其实是 map[string]interface{} 的类型别名。在程序中，我们可以很方便地引用 Extend 包含的属性，也就是 map 的 key。Extend 字段在保存到数据库中时，会自动 Marshal 成字符串，保存在 ExtendShadow 字段中。 ExtendShadow 是 Extend 在数据库中的影子。同样，当从数据库查询数据时，ExtendShadow 的值会自动 Unmarshal 到 Extend 类型的变量中，供程序使用。具体实现方式如下： * 借助 gorm 提供的 BeforeCreate 、 BeforeUpdate Hooks，在插入记录、更新记录时，将 Extend 的值转换成字符串，保存在 ExtendShadow 字段中，并最终保存在数据库的 ExtendShadow 字段中。 * 借助 gorm 提供的 AfterFind Hooks，在查询数据后，将 ExtendShadow 的值 Unmarshal 到 Extend 字段中，之后程序就可以通过 Extend 字段来使用其中的属性。 * CreatedAt 资源的创建时间。每个资源在创建时，我们都应该记录资源的创建时间，可以帮助后期进行排障、分析等。 * UpdatedAt 资源的更新时间。每个资源在更新时，我们都应该记录资源的更新时间。资源更新时，该字段由 gorm 自动更新。可以看到，ObjectMeta 结构体包含了很多字段，每个字段都完成了很酷的功能。那么，如果把 ObjectMeta 作为所有资源的公共属性，这些资源就会自带这些能力。当然，有些开发者可能会说，User 资源其实是不需要 user-xxxxxx 这种资源标识的，所以 InstanceID 这个字段其实是无用的字段。但是在我看来，和功能冗余相比，功能规范化、不重复造轮子，以及 ObjectMeta 的其他功能更加重要。所以，也建议所有的 REST 资源都使用统一的资源元数据。 ### 统一的返回在[18 讲](https://time.geekbang.org/column/article/391895) 中，我们介绍过 API 的接口返回格式应该是统一的。要想返回一个固定格式的消息，最好的方式就是使用同一个返回函数。因为 API 接口都是通过同一个函数来返回的，其返回格式自然是统一的。 IAM 项目通过 [github.com/marmotedu/component-base/pkg/core](https://github.com/marmotedu/component-base/tree/master/pkg/core) 包提供的 [WriteResponse](https://github.com/marmotedu/component-base/blob/master/pkg/core/core.go#L33) 函数来返回结果。WriteResponse 函数定义如下： func WriteResponse(c /*gin.Context, err error, data interface{}) { if err != nil { log.Errorf("%/#+v", err) coder := errors.ParseCoder(err) c.JSON(coder.HTTPStatus(), ErrResponse{ Code: coder.Code(), Message: coder.String(), Reference: coder.Reference(), }) return } c.JSON(http.StatusOK, data) } 可以看到，WriteResponse 函数会判断 err 是否为 nil。如果不为 nil，则将 err 解析为 github.com/marmotedu/errors 包中定义的 Coder 类型的错误，并调用 Coder 接口提供的 Code() 、 String() 、 Reference() 方法，获取该错误的业务码、对外展示的错误信息和排障文档。如果 err 为 nil，则调用 c.JSON 返回 JSON 格式的数据。 ### 并发处理模板在 Go 项目开发中，经常会遇到这样一种场景：查询列表接口时，查询出了多条记录，但是需要针对每一条记录做一些其他逻辑处理。因为是多条记录，比如 100 条，处理每条记录延时如果为 X 毫秒，串行处理完 100 条记录，整体延时就是 100 /* X 毫秒。如果 X 比较大，那整体处理完的延时是非常高的，会严重影响 API 接口的性能。这时候，我们自然就会想到利用 CPU 的多核能力，并发来处理这 100 条记录。这种场景我们在实际开发中经常遇到，有必要抽象成一个并发处理模板，这样以后在查询时，就可以使用这个模板了。例如，iam-apiserver 中，查询用户列表接口 [List](https://github.com/marmotedu/iam/blob/v1.0.4/internal/apiserver/service/v1/user.go#L43) ，还需要返回每个用户所拥有的策略个数。这就用到了并发处理。这里，我试着将其抽象成一个模板，模板如下： func (u /*userService) List(ctx context.Context, opts metav1.ListOptions) (/*v1.UserList, error) { users, err := u.store.Users().List(ctx, opts) if err != nil { log.L(ctx).Errorf("list users from storage failed: %s", err.Error()) return nil, errors.WithCode(code.ErrDatabase, err.Error()) } wg := sync.WaitGroup{} errChan := make(chan error, 1) finished := make(chan bool, 1) var m sync.Map // Improve query efficiency in parallel for _, user := range users.Items { wg.Add(1) go func(user /*v1.User) { defer wg.Done() // some cost time process policies, err := u.store.Policies().List(ctx, user.Name, metav1.ListOptions{}) if err != nil { errChan <- errors.WithCode(code.ErrDatabase, err.Error()) return } m.Store(user.ID, &v1.User{ ... Phone: user.Phone, TotalPolicy: policies.TotalCount, }) }(user) } go func() { wg.Wait() close(finished) }() select { case <-finished: case err := <-errChan: return nil, err } // infos := make([]/*v1.User, 0) infos := make([]/*v1.User, 0, len(users.Items)) for _, user := range users.Items { info, _ := m.Load(user.ID) infos = append(infos, info.(/*v1.User)) } log.L(ctx).Debugf("get %d users from backend storage.", len(infos)) return &v1.UserList{ListMeta: users.ListMeta, Items: infos}, nil } 在上面的并发模板中，我实现了并发处理查询结果中的三个功能： **第一个功能，goroutine 报错即返回。**goroutine 中代码段报错时，会将错误信息写入 errChan 中。我们通过 List 函数中的 select 语句，实现只要有一个 goroutine 发生错误，即返回： select { case <-finished: case err := <-errChan: return nil, err } **第二个功能，保持查询顺序。**我们从数据库查询出的列表是有顺序的，比如默认按数据库 ID 字段升序排列，或者我们指定的其他排序方法。在并发处理中，这些顺序会被打断。但为了确保最终返回的结果跟我们预期的排序效果一样，在并发模板中，我们还需要保证最终返回结果跟查询结果保持一致的排序。上面的模板中，我们将处理后的记录保存在 map 中，map 的 key 为数据库 ID。并且，在最后按照查询的 ID 顺序，依次从 map 中取出 ID 的记录，例如： var m sync.Map for _, user := range users.Items { ... go func(user /*v1.User) { ... m.Store(user.ID, &v1.User{}) }(user) } ... infos := make([]/*v1.User, 0, len(users.Items)) for _, user := range users.Items { info, _ := m.Load(user.ID) infos = append(infos, info.(/*v1.User)) } 通过上面这种方式，可以确保最终返回的结果跟从数据库中查询的结果保持一致的排序。 **第三个功能，并发安全。**Go 语言中的 map 不是并发安全的，要想实现并发安全，需要自己实现（如加锁），或者使用 sync.Map。上面的模板使用了 sync.Map。当然了，如果期望 List 接口能在期望时间内返回，还可以添加超时机制，例如： select { case <-finished: case err := <-errChan: return nil, err case <-time.After(time.Duration(30 /* time.Second)): return nil, fmt.Errorf("list users timeout after 30 seconds") } goroutine 虽然很轻量，但还是会消耗资源，如果我们需要处理几百上千的并发，就需要用协程池来复用协程，达到节省资源的目的。有很多优秀的协程包可供我们直接使用，比如 [ants](https://github.com/panjf2000/ants) 、 [tunny](https://github.com/Jeffail/tunny) 等。 ## 其他特性除了上面那两大类，这里我还想给你介绍下关键代码设计中的其他特性，包括插件化选择 JSON 库、调用链实现、数据一致性。 ### 插件化选择 JSON 库 Golang 提供的标准 JSON 解析库 encoding/json，在开发高性能、高并发的网络服务时会产生性能问题。所以很多开发者在实际的开发中，往往会选用第三方的高性能 JSON 解析库，例如 [jsoniter](https://github.com/json-iterator/go) 、 [easyjson](https://github.com/mailru/easyjson) 、 [jsonparser](https://github.com/buger/jsonparser) 等。我见过的很多开发者选择了 jsoniter，也有一些开发者使用了 easyjson。jsoniter 的性能略高于 encoding/json。但随着 go 版本的迭代，encoding/json 库的性能也越来越高，jsoniter 的性能优势也越来越有限。所以，IAM 项目使用了 jsoniter 库，并准备随时切回 encoding/json 库。为了方便切换不同的 JSON 包，iam-apiserver 采用了一种插件化的机制来使用不同的 JSON 包。具体是通过使用 go 的标签编译选择运行的解析库来实现的。标签编译就是在源代码里添加标注，通常称之为编译标签（build tag）。编译标签通过注释的方式在靠近源代码文件顶部的地方添加。go build 在构建一个包的时候，会读取这个包里的每个源文件并且分析编译便签，这些标签决定了这个源文件是否参与本次编译。例如： // +build jsoniter package json import jsoniter "github.com/json-iterator/go" +build jsoniter 就是编译标签。这里要注意，一个源文件可以有多个编译标签，多个编译标签之间是逻辑“与”的关系；一个编译标签可以包括由空格分割的多个标签，这些标签是逻辑“或”的关系。例如： // +build linux darwin // +build 386 这里要注意，编译标签和包的声明之间应该使用空行隔开，否则编译标签会被当作包声明的注释，而不是编译标签。那具体来说，我们是如何实现插件化选择 JSON 库的呢？首先，我自定义了一个 [github.com/marmotedu/component-base/pkg/json](https://github.com/marmotedu/component-base/tree/master/pkg/json) json 包，来适配 encoding/json 和 json-iterator。 github.com/marmotedu/component-base/pkg/json 包中有两个文件： * **json.go：**映射了 encoding/json 包的 Marshal、Unmarshal、MarshalIndent、NewDecoder、NewEncoder 方法。 * **jsoniter.go：**映射了 github.com/json-iterator/go 包的 Marshal、Unmarshal、MarshalIndent、NewDecoder、NewEncoder。 json.go 和 jsoniter.go 通过编译标签，让 Go 编译器在构建代码时选择使用哪一个 json 文件。接着，通过在执行 go build 时指定 [-tags](https://github.com/marmotedu/iam/blob/master/scripts/make-rules/golang.mk#L19) 参数，来选择编译哪个 json 文件。 json/json.go、json/jsoniter.go 这两个 Go 文件的顶部，都有一行注释： // +build !jsoniter // +build jsoniter // +build !jsoniter 表示，tags 不是 jsoniter 的时候编译这个 Go 文件。 // +build jsoniter 表示，tags 是 jsoniter 的时候编译这个 Go 文件。也就是说，这两种条件是互斥的，只有当 tags=jsoniter 的时候，才会使用 json-iterator，其他情况使用 encoding/json。例如，如果我们想使用包，可以这么编译项目： $ go build -tags=jsoniter 在实际开发中，**我们需要根据场景来选择合适的JSON 库。**这里我给你一些建议。场景一：结构体序列化和反序列化场景在这个场景中，我个人首推的是官方的 JSON 库。可能你会比较意外，那我就来说说我的理由：首先，虽然 easyjson 的性能压倒了其他所有开源项目，但它有一个最大的缺陷，那就是需要额外使用工具来生成这段代码，而对额外工具的版本控制就增加了运维成本。当然，如果你的团队已经能够很好地处理 protobuf 了，也是可以用同样的思路来管理 easyjson 的。其次，虽然 Go 1.8 之前，官方 JSON 库的性能总是被大家吐槽，但现在（1.16.3）官方 JSON 库的性能已不可同日而语。此外，作为使用最为广泛，而且没有之一的 JSON 库，官方库的 bug 是最少的，兼容性也是最好的最后，jsoniter 的性能虽然依然优于官方，但没有达到逆天的程度。如果你追求的是极致的性能，那么你应该选择 easyjson 而不是 jsoniter。jsoniter 近年已经不活跃了，比如说，我前段时间提了一个 issue 没人回复，于是就上去看了下 issue 列表，发现居然还遗留着一些 2018 年的 issue。场景二：非结构化数据的序列化和反序列化场景这个场景下，我们要分高数据利用率和低数据利用率两种情况来看。你可能对数据利用率的高低没啥概念，那我举个例子：JSON 数据的正文中，如果说超过四分之一的数据都是业务需要关注和处理的，那就算是高数据利用率。在高数据利用率的情况下，我推荐使用 jsonvalue。至于低数据利用率的情况，还可以根据 **JSON 数据是否需要重新序列化，**分成两种情况。如果无需重新序列化，这个时候选择 jsonparser 就行了，因为它的性能实在是耀眼。如果需要重新序列化，这种情况下你有两种选择：如果对性能要求相对较低，可以使用 jsonvalue；如果对性能的要求高，并且只需要往二进制序列中插入一条数据，那么可以采用 jsoniter 的 Set 方法。实际操作中，超大 JSON 数据量，并且同时需要重新序列化的情况非常少，往往是在代理服务器、网关、overlay 中继服务等，同时又需要往原数据中注入额外信息的时候。换句话说，jsoniter 的适用场景比较有限。下面是从 10%到 60%数据覆盖率下，不同库的操作效率对比（纵坐标单位：μs/op）： ![图片](https://learn.lianglianglee.com/%e4%b8%93%e6%a0%8f/Go%20%e8%af%ad%e8%a8%80%e9%a1%b9%e7%9b%ae%e5%bc%80%e5%8f%91%e5%ae%9e%e6%88%98/assets/47bf5efcc2ec4ec699d98f27e12106d3.jpg) 可以看到，当 jsoniter 的数据利用率达到 25% 时，和 jsonvalue、jsonparser 相比就已经没有任何优势；至于 jsonvalue，由于对数据做了一次性的全解析，因此解析后的数据存取耗时极少，因此在不同数据覆盖率下的耗时都很稳定。 ### 调用链实现调用链对查日志、排障帮助非常大。所以，在 iam-apiserver 中也实现了调用链，通过 requestID 来串联整个调用链。具体是通过以下两步来实现的：第一步，将 ctx context.Context 类型的变量作为函数的第一个参数，在函数调用时传递。第二步，不同函数中，通过 log.L(ctx context.Context) 来记录日志。在请求到来时，请求会通过 [Context](https://github.com/marmotedu/iam/blob/v1.0.4/internal/pkg/middleware/context.go#L17) 中间件处理： func Context() gin.HandlerFunc { return func(c /*gin.Context) { c.Set(log.KeyRequestID, c.GetString(XRequestIDKey)) c.Set(log.KeyUsername, c.GetString(UsernameKey)) c.Next() } } 在 Context 中间件中，会在 gin.Context 类型的变量中设置 log.KeyRequestID 键，其值为 36 位的 UUID。UUID 通过 [RequestID](https://github.com/marmotedu/iam/blob/v1.0.4/internal/pkg/middleware/requestid.go#L22) 中间件来生成，并设置在 gin 请求的 Context 中。 RequestID 中间件在 Context 中间件之前被加载，所以在 Context 中间件被执行时，能够获取到 RequestID 生成的 UUID。 log.L(ctx context.Context) 函数在记录日志时，会从头 ctx 中获取到 log.KeyRequestID ，并作为一个附加字段随日志打印。通过以上方式，我们最终可以形成 iam-apiserver 的请求调用链，日志示例如下： 2021-07-19 19:41:33.472 INFO apiserver apiserver/auth.go:205 user `admin` is authenticated. {"requestID": "b6c56cd3-d095-4fd5-a928-291a2e33077f", "username": "admin"} 2021-07-19 19:41:33.472 INFO apiserver policy/create.go:22 create policy function called. {"requestID": "b6c56cd3-d095-4fd5-a928-291a2e33077f", "username": "admin"} ... 另外， ctx context.Context 作为函数/方法的第一个参数，还有一个好处是方便后期扩展。例如，如果我们有以下调用关系： package main import "fmt" func B(name, address string) string { return fmt.Sprintf("name: %s, address: %s", name, address) } func A() string { return B("colin", "sz") } func main() { fmt.Println(A()) } 上面的代码最终调用 B 函数打印出用户名及其地址。如果随着业务的发展，希望 A 调用 B 时，传入用户的电话，B 中打印出用户的电话号码。这时候，我们可能会考虑给 B 函数增加一个电话号参数，例如： func B(name, address, phone string) string { return fmt.Sprintf("name: %s, address: %s, phone: %s", name, address) } 如果我们后面还要增加年龄、性别等属性呢？按这种方式不断增加 B 函数的参数，不仅麻烦，而且还要改动所有调用 B 的函数，工作量也很大。这时候，可以考虑通过 ctx context.Context 来传递这些扩展参数，实现如下： package main import ( "context" "fmt" ) func B(ctx context.Context, name, address string) string { return fmt.Sprintf("name: %s, address: %s, phone: %v", name, address, ctx.Value("phone")) } func A() string { ctx := context.WithValue(context.TODO(), "phone", "1812884xxxx") return B(ctx, "colin", "sz") } func main() { fmt.Println(A()) } 这样，我们下次需要新增参数的话，只需要调用 context 的 WithValue 方法： ctx = context.WithValue(ctx, "sex", "male") 在 B 函数中，通过 context.Context 类型的变量提供的 Value 方法，从 context 中获取 sex key 即可： return fmt.Sprintf("name: %s, address: %s, phone: %v, sex: %v", name, address, ctx.Value("phone"), ctx.Value("sex")) ### 数据一致性为了提高 iam-authz-server 的响应性能，我将密钥和授权策略信息缓存在 iam-authz-server 部署机器的内存中。同时，为了实现高可用，我们需要保证 iam-authz-server 启动的实例个数至少为两个。这时候，我们会面临数据一致性的问题：所有 iam-authz-server 缓存的数据要一致，并且跟 iam-apiserver 数据库中保存的一致。iam-apiserver 通过如下方式来实现数据一致性： ![](https://learn.lianglianglee.com/%e4%b8%93%e6%a0%8f/Go%20%e8%af%ad%e8%a8%80%e9%a1%b9%e7%9b%ae%e5%bc%80%e5%8f%91%e5%ae%9e%e6%88%98/assets/ed859882c5e84b57a1f2f225ec4fca54.jpg) 具体流程如下：第一步，iam-authz-server 启动时，会通过 grpc 调用 iam-apiserver 的 GetSecrets 和 GetPolicies 接口，获取所有的密钥和授权策略信息。第二步，当我们通过控制台调用 iam-apiserver 密钥/授权策略的写接口（POST、PUT、DELETE）时，会向 Redis 的 iam.cluster.notifications 通道发送 SecretChanged/PolicyChanged 消息。第三步，iam-authz-server 会订阅 iam.cluster.notifications 通道，当监听到有 SecretChanged/PolicyChanged 消息时，会请求 iam-apiserver 拉取所有的密钥/授权策略。通过 Redis 的 Sub/Pub 机制，保证每个 iam-authz-server 节点的缓存数据跟 iam-apiserver 数据库中保存的数据一致。所有节点都调用 iam-apiserver 的同一个接口来拉取数据，通过这种方式保证所有 iam-authz-server 节点的数据是一致的。 ## 总结今天，我和你分享了 iam-apiserver 的一些关键功能实现，并介绍了我的设计思路。这里我再简要梳理下。 * 为了保证进程关停时，HTTP 请求执行完后再断开连接，进程中的任务正常完成，iam-apiserver 实现了优雅关停功能。 * 为了避免进程存在，但服务没成功启动的异常场景，iam-apiserver 实现了健康检查机制。 * Gin 中间件可通过配置文件配置，从而实现按需加载的特性。 * 为了能够直接辨别出 API 的版本，iam-apiserver 将 API 的版本标识放在 URL 路径中，例如 /v1/secrets 。 * 为了能够最大化地共享功能代码，iam-apiserver 抽象出了统一的元数据，每个 REST 资源都具有这些元数据。 * 因为 API 接口都是通过同一个函数来返回的，其返回格式自然是统一的。 * 因为程序中经常需要处理并发逻辑，iam-apiserver 抽象出了一个通用的并发模板。 * 为了方便根据需要切换 JSON 库，我们实现了插件化选择 JSON 库的功能。 * 为了实现调用链功能，iam-apiserver 不同函数之间通过 ctx context.Context 来传递 RequestID。 * iam-apiserver 通过 Redis 的 Sub/Pub 机制来保证数据一致性。 ## 课后练习 * 思考一下，在你的项目开发中，使用过哪些更好的并发处理方式，欢迎你在留言区分享。 * 试着给 iam-apiserver 增加一个新的、可配置的 Gin 中间件，用来实现 API 限流的效果。欢迎你在留言区与我交流讨论，我们下一讲见。 # 参考资料 https://learn.lianglianglee.com/%e4%b8%93%e6%a0%8f/Go%20%e8%af%ad%e8%a8%80%e9%a1%b9%e7%9b%ae%e5%bc%80%e5%8f%91%e5%ae%9e%e6%88%98/29%20%e6%8e%a7%e5%88%b6%e6%b5%81%ef%bc%88%e4%b8%8b%ef%bc%89%ef%bc%9aiam-apiserver%e6%9c%8d%e5%8a%a1%e6%a0%b8%e5%bf%83%e5%8a%9f%e8%83%bd%e5%ae%9e%e7%8e%b0%e8%ae%b2%e8%a7%a3.md * any list {:toc}

应用框架相关的特性

优雅关停

健康检查

插件化加载中间件

编程规范相关的特性

API 版本

统一的资源元数据

更多学习