标签: ha

HA 高可用系列概览 overview

断路器（Circuit Breaker）：
- 用于监控服务调用的失败率，并在达到某个阈值后打开断路器，阻止进一步的调用，以避免对后端服务的过载。
- 提供恢复机制，在一定时间后自动尝试恢复调用。
重试（Retry）：
- 自动重试失败的操作，支持设置重试次数和延迟。
- 可以与断路器结合使用，增强调用的成功率。
限流（Rate Limiter）：
- 限制单位时间内的请求次数，防止服务被过载。
- 可以按用户、IP 或其他维度进行限流。
隔离器（Bulkhead）：
- 通过将服务分割为多个隔离的部分，防止某一部分的故障影响到整个系统。
- 可用于限制资源（如线程池）的使用。
缓存（Cache）：
- 提供缓存机制来存储结果，以减少重复的计算和网络调用。
超时（Timeout）
- 避免单个调用时间过长，消耗太多资源。

老马啸西风2018年12月23日大约 11 分钟

高可用之隔离器（Bulkhead）-01-overview

老马啸西风2018年12月23日小于 1 分钟

高可用之隔离器（Bulkhead）-02-chat

隔离器（Bulkhead）是一种提高系统高可用性的软件设计模式，它通过隔离系统中的不同部分来防止故障的扩散。

这种模式的灵感来自于船体的隔板设计，如果船体的某个部分受损，水只会进入那个特定的部分，而不会导致整个船只沉没。

在软件架构中，隔离器模式通过将应用程序的不同部分或服务隔离到独立的池中，使得一个部分的故障不会影响到其他部分，从而提高了整个系统的稳定性和可用性。

在实现上，隔离器模式可以通过两种方式来限制并发执行的数量：

信号量模式（SemaphoreBulkhead）：这是默认的实现方式，它使用信号量来控制可以同时执行的操作数量。信号量是一种并发工具，通过维护一组虚拟的许可证来控制并发访问，每个线程在执行操作前需要获取许可证，在操作完成后释放许可证。
线程池模式（ThreadPoolBulkhead）：这种模式使用线程池来控制实际工作的线程数量，通过线程复用减少内存开销。线程池中的线程数量是固定的，超过这个数量的请求会被放入队列中等待，如果队列也满了，则请求会被拒绝。

老马啸西风2018年12月23日大约 16 分钟

高可用之熔断 Circuit Breaker-01-overview 断路器（Circuit Breaker）

高可用之熔断

老马啸西风2018年12月23日大约 9 分钟

高可用之熔断 Circuit Breaker-02-chat 断路器（Circuit Breaker）

详细介绍一下熔断 what

熔断（Circuit Breaker）是一种用于提升分布式系统稳定性和可用性的设计模式，特别是在微服务架构中。

当系统中某个服务出现故障时，熔断机制能够快速识别问题，并防止故障进一步扩散到整个系统。

下面是熔断机制的主要组成部分和工作原理：

主要组成部分

状态：
- 闭合（Closed）：正常状态，所有请求都被允许通过。如果请求成功，熔断器保持闭合；如果请求失败达到一定阈值，熔断器转入打开状态。
- 打开（Open）：当请求失败率超过预设阈值时，熔断器进入打开状态，此时所有请求都会被拒绝。熔断器会在一段时间后进入半开状态。
- 半开（Half-Open）：在这个状态下，熔断器会允许一小部分请求通过，以检测目标服务是否恢复。如果这些请求成功，熔断器可能会恢复到闭合状态；如果仍然失败，熔断器继续保持打开状态。
阈值和超时：
- 失败阈值：定义了请求失败的比例或次数，以决定何时触发熔断。
- 超时设置：设定熔断器在打开状态下的持续时间。

老马啸西风2018年12月23日大约 14 分钟

高可用之降级 downgrade

高可用之降级

老马啸西风2018年12月23日大约 9 分钟

高可用之降级 downgrade-02-chat 聊一聊降级

详细介绍一下服务降级

服务降级是分布式系统中的一种重要策略，旨在提高系统的可用性和容错能力。

它通常在系统出现故障或资源过载时启用，以确保系统在部分功能失效的情况下仍能继续提供服务。

服务降级的目的

提高可用性：通过部分功能的降级，系统可以避免完全崩溃，保证核心功能的可用性。
用户体验优化：即使在发生故障时，用户仍然能够访问某些功能，减少用户流失。
资源保护：在系统负载过高时，通过限制某些服务的使用，保护重要资源，避免进一步崩溃。

老马啸西风2018年12月23日大约 9 分钟

高可用之超时（timeout）-02-chat

高可用之熔断

老马啸西风2018年12月23日大约 16 分钟

高可用之应用发布？-01-如何实现应用无损、优雅的发布？

如何实现应用无损、优雅的发布？

实现应用无损、优雅的发布，关键在于确保在发布过程中，系统的可用性和业务的连续性不受影响。

以下是一些推荐的做法：

集群流量承载评估：在发布前，需要对应用整体流量进行评估，确保在停止应用期间，剩余的应用集群能够满足当前流量的承载需求。
应用停止：在停止应用时，应避免直接使用Kill -9操作或shutdown命令，以免导致正在处理的请求被突然中断。应先摘除外部通讯，释放长连接和本地资源，确保所有请求都已处理完毕。
灰度发布：通过逐步放开访问权限的方式，先让一部分用户访问新版本的应用，然后逐步扩大范围至所有用户。这有助于及时发现并修复潜在问题。
全链路灰度：通过物理环境隔离或逻辑环境隔离，实现全链路灰度发布，以节省成本并实现快速的线上流量控制。
无损下线：确保服务提供者节点在停止服务前，已经通知所有消费者不再调用自己，并处理完所有请求后再停止应用。
无损上线：控制负载到新节点上的流量是渐进式递增的，给予新节点充足的时间进行资源预热，以避免因资源加载导致的服务不可用。
优雅上线：也称为“无损上线”或“延迟发布”，在应用发布过程中，通过延迟暴露服务给用户，先进行健康检查和必要的初始化操作，以确保服务的可用性和稳定性。
服务预热：对于需要时间预热的服务，如数据库连接池、缓存等，可以通过小流量预热，逐渐增加流量，直到服务稳定。
使用微服务治理工具：如阿里云的MSE微服务引擎，提供了无损上下线的能力，包括服务预热、延迟下线等功能，以避免流量损失和请求超时。
监控和告警：在发布过程中，建立完善的监控和告警机制，及时发现并处理可能出现的问题。
回滚计划：在升级前制定好回滚计划，确保在出现问题时能够迅速回滚到旧版本。
版本管理：做好版本管理工作，确保每个版本都有清晰的记录和可追踪性。

老马啸西风2018年12月23日大约 5 分钟

高可用之应用发布？02-http 请求如何通过 nginx 实现负载？

如何通过 nginx，实现通过域名将 http 请求负载均衡指定 ip 列表

要通过 Nginx 实现基于域名的 HTTP 请求负载均衡到指定的 IP 列表，你可以按照以下步骤进行配置：

定义 Upstream 服务器组：
在 Nginx 配置文件中定义一个 upstream 块，列出所有需要负载均衡的后端服务器 IP 地址和端口。可以使用权重（weight）、最大失败次数（max_fails）、失败超时（fail_timeout）等参数来控制负载均衡的行为。

示例配置：
```
http {
    upstream myapp {
        server 192.168.1.100:80 weight=3;
        server 192.168.1.101:80 weight=2;
        server 192.168.1.102:80;
        server 192.168.1.103:80 backup;
    }
}
```
在这里，weight 参数指定了服务器的权重，backup 表示该服务器作为备份服务器，在其他服务器不可用时才会被使用。

配置 Server 块：
在 Nginx 配置文件中为每个域名配置一个 server 块，使用 server_name 指令指定域名，并使用 location 块中的 proxy_pass 指令将请求转发到 upstream 服务器组。

示例配置：

server {
    listen 80;
    server_name www.example.com;
    
    location / {
        proxy_pass http://myapp;
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
    }
}

在这个配置中，所有发到 www.example.com 的请求都会被转发到定义在 upstream 块 myapp 中的服务器。

启用健康检查：
Nginx 可以配置健康检查来自动检测后端服务器的状态，并在服务器不可用时将其从负载均衡中移除。

示例配置：
```
upstream myapp {
    server 192.168.1.100:80 max_fails=3 fail_timeout=30s;
    server 192.168.1.101:80 max_fails=3 fail_timeout=30s;
}
```
在这里，max_fails 指定了在 fail_timeout 时间内允许的最大失败请求次数，超过这个次数后，Nginx 会认为服务器不可用。
重新加载 Nginx 配置：
完成配置后，需要重新加载 Nginx 配置以使更改生效。
```
sudo nginx -s reload
```

老马啸西风2018年12月23日大约 8 分钟