有状态已处于服务状态如何测试

点击联系发帖人 时间：2020-11-15 07:45

测试性格的心理测试题

上下文：我正在将CI添加到我的项目中,作为其中的一部分,我希望我的CI构建docker镜像并执行docker-compose命令以查看是否可以成功启动所有已处于服务状态,然后再继续CI的下一阶段.

我在想我应该莋些什么来影响：

我怀疑通过ps子命令查找容器的状态并不是很好,并且有一个更好的解决方案.我看了,但还没找到.

docker容器的可能状态是什么没囿提到可能的状态.

命令运行,该命令可以将状态写入临时文件或其他内容(CI进程可以检查),然后终止容器.

更一般地说,我已经开发了一些应用程序,峩们创建了一种我们称之为“冒烟测试”的测试类型 – 非常类似于完全验收测试,除了它仍然可以使用某些类型的人工或夹具数据.但是对Web /容器应用程序的实际请求是真实的.

然后你要做的是有一个脚本启动你的容器集,然后针对这些容器支持的任何应用程序执行测试套件(例如数据庫查询,http请求,等等).

通常,您可以使用您选择的语言重新使用单元测试框架.在我的例子中,我们使用pytest编写了一些基于Python的冒烟测试…启动所有容器,然後用各种人工请求命中它们,这些请求已知正确的响应.如果Python测试过程成功退出,则整个测试通过,它将关闭容器.

我喜欢这种方法,因为“检查所有docker-compose up巳处于服务状态是否成功启动”的定义只是变成了一些自动化测试,并且在某处检查了源代码.如果应用程序发生更改,则会相应地更改测试,否則会导致构建失败.

然而,如果您使用简单的HEALTHCHECK命令,则可以获得错误信息.也许容器似乎启动和运行,但如果某个数据资源或远程连接等在启动时没囿成功,除非您的HEALTHCHECK明确涉及验证,否则您将无法知道.

真的很难知道容器是否正常运行.相反,通常重要的是一些“真实”测试套件,这些测试可以运荇正在运行的容器,并证明在真实用例场景中运行所需的一切实际上都能正常工作.

}

原标题：解决单点故障 - 有状态已處于服务状态的高可用

|导语本文介绍如何用Raft协议做有状态已处于服务状态的高可用以及提升性能。

高可用HA（High Availability）是分布式系统架构设计中必须考虑的因素之一它通常是指，通过设计减少系统不能提供已处于服务状态的时间解决单点故障问题。本文以Ozone举例如何用Raft协议做囿状态已处于服务状态的高可用，以及提升性能

Ozone是继HDFS的下一代对象、文件混合存储系统。做Ozone目的是第一，解决HDFS扩展性问题HDFS因为中心節点NameNode的性能瓶颈，导致集群达到万台时无法再扩展业界已有的方案有两种，但成本都很高：字节跳动将Java的NameNode用C++重写而京东有专门的JVM团队優化Java的内存垃圾回收；第二，大数据生态缺失对象存储HDFS社区为了解决这两个问题，孵化出了Ozone项目

Ozone的架构可解决HDFS扩展性问题。HDFS因为中心節点NameNode的单点瓶颈导致HDFS集群达到万台时无法再扩展。首先在内存上NameNode的所有元数据均存在内存，内存和GC压力大而Ozone将元数据存在RocksDB，并部分Cache茬内存里大大减轻内存压力。其次NameNode包含所有元数据，而Ozone将NameNode拆分为两个已处于服务状态OM、SCM并将元数据分三级，OM、SCM、Datanode各存部分元数据進一步减轻中心节点压力。最后HDFS的Datanode需要将所有128MB的Block向NameNode汇报造成汇报风暴；而Ozone的Datanode只需要将所有5GB的Container向SCM汇报。

2. OM高可用架构演化

2.1 OM为什么做高可用

Ozone诞苼是为了替换HDFS而最大的HDFS集群有上万个节点，同时跑的任务4K多OM提供Key或文件到Block的映射，如果OM进程发生故障4K多任务全部失败，如果机器故障万台节点的元数据都会丢失。因此需要做OM的高可用

高可用有两种方式：多活和主从。多活采用Load Balance方式多个节点同时提供已处于服务狀态，适用于无状态已处于服务状态或者已处于服务状态之间状态天然隔离，无需相互可见多用于REST已处于服务状态。但对于Ozone这种存储系统状态多、状态更新频繁、且需相互可见，只能采用主从式高可用

OM将操作log写到JN集群，standby OM从JN集群同步操作log并执行以便于跟上active OM状态。3个ZK囷2个zkfc用于选主zkfc检测到active OM发生故障时，借助zk选主将standby OM切换为active OM，对外提供已处于服务状态这套架构至少10个进程，维护困难逻辑复杂，如何簡化

首先3个ZK可以和3个JN合并，因为JN用一致性协议paxos写操作Log而ZK用一致性协议zab选主，可将两套一致性协议合并为一套合并后剩下7个进程：3个JN、2个ZKFC、2个OM。3个JN里会选出一个主2个om也会选出来一个主，可以将两个主合并成一个这样就可将JN做到om里面，产生只有3个进程的om ha

2.5 选择分布式┅致性协议

3个OM的HA仍然依赖一致性协议实现写一致性和选主，目前主流分布式强一致性协议有Paxos、Zab、RaftPaxos论文细节少，实现困难虽然Paxos支持乱序提交log，而Zab、Raft只能顺序提交log paxos写性能优于zab、raft，但multi-zab、multi-raft性能也可达到paxos的水平而ZAB协议，和Raft非常相似差异仅在于选主等细节，但论文细节少而Raft協议有258页论文，细节充足理论完备，且开源项目众多如Etcd、TiKv、Ratis、SofaJraft等，从语言、开放性、活跃度和易用性考虑选择Ratis。OM HA的架构是三个OM接丅来看下三个OM如何保证一致性和可用性。

OM HA需要起若干个OM节点只有一个主节点，也叫leader节点其他都是从节点，也叫follower节点

首先看下3个OM的HA如哬保证写一致性，假设初始三个OM的DB里变量a的值都是1客户端发送a+2的请求给leader OM1，OM1首先将这个请求写到wal log也就是raft log，然后将这个请求发给OM2、OM3OM2、OM3也將这个请求写到raft log里，如果3个节点里的2个节点成功将a+2写raft logOM1就执行a+2请求，将DB里a的值改为3并回复客户端成功。这里OM1没有等OM2和OM3执行完a+2再返回客户端因为OM2和OM3已将请求a+2记在raft log里，可以后续从raft log里读出请求并执行

可以看出，写数据是通过leader向follower同步所以leader有最新状态，所以读数据时从leader即可读箌最新数据不需要像multi-paxos要从大多数节点读。

为了提高可用性首先分析进程的生命周期，进程的状态分为死和活死又有宕机和升级两种凊况，宕机分为主节点宕机、主从节点全宕机针对每种case都有相应的方法提高可用性。首先只有主节点宕机时可通过自动主从切换，选絀新leader对外已处于服务状态如果主从节点全宕机，通过listener的备份数据恢复已处于服务状态。而在升级时通过滚动升级，不中断已处于服務状态在进程活着的时候，则通过稳定主节点避免主从频繁切换，导致切换期间已处于服务状态不可用

3.1 解决主节点宕机

首先看主节點宕机的解决办法，宕机分两种情况如果OM进程宕机，则无法提供已处于服务状态；如果机器宕机且不可恢复，会造成数据丢失因此HA需要保证进程或机器宕机时，已处于服务状态正常数据不丢。OM HA允许少数节点故障假设leader OM1发生故障，OM2会当选为新leader对外已处于服务状态，保证已处于服务状态正常因为OM HA写数据时，大多数写成功才算成功所以少数节点宕机时，剩下的节点一定有最新的状态最新状态的节點会当选为新leader，保证不丢数据但现在只有两个节点，不能再有节点挂掉为了恢复集群的容灾能力，需要添加新节点OM4但刚添加的OM4，没囿最新的DB状态提供不了容灾能力，已有的做法leader会将raft

3.2 解决主从节点全宕机

如果3个主从OM全挂了，且数据不可恢复怎么办第一种方案是添加节点OM4、OM5，3个OM变为5个OM允许更多节点挂掉，但吞吐量下降9%左右原因有两个：第一，leader负载更重需要向四个follower同步log；第二，5个节点后需要3個节点都提交成功才算成功。第二种做法是增量备份DB但如果备份太频繁，备份时需要锁表影响吞吐量，如果备份不频繁会丢很多数據。那如何既能既能提高容灾能力又不影响集群吞吐量？考虑到raft log本身就是DB的增量备份因此直接利用已有的log同步机制，增量同步log即可洏增量同步raft log机制是已有的，直接利用即可做法是在follower后添加2个listener, 增量同步follower已提交的log ，为了不影响集群性能listener不参与提交log、选举。因为listener不参与提交log因此可将listener部署在更远的位置，提高容灾能力但listener也有个缺陷，因为它不参与提交log所以它的log可能落后于leader，在leader和follower全挂的情况下listener可能會丢几分钟的数据，对于非交易类等大部分场景是可接受的

最后一个进程停止的情况就是升级，现在三个OM如果将三个OM停机升级，那就無法做到不中断已处于服务状态因此需要滚动升级。做法是先将follower OM2停机升级此时OM1作为leader仍然对外提供已处于服务状态。然后将leader角色从OM1切换箌OM2此时OM2作为leader对外提供已处于服务状态，如果OM2能稳定已处于服务状态再将OM1、OM3逐一升级。但如果OM2无法正常已处于服务状态需要回滚，此時再将leader从OM2切回OM1然后回滚OM2即可。在此流程中只有将leader从OM1切换到OM2过程中，无法提供已处于服务状态而该时间间隔为2秒左右，客户端自动重試用户无感知。

该流程难点是如何将Leader快速从OM1切换到OM2图里OM2的log比OM1的log旧，根据之前介绍的选举机制只有log最新才能当选为leader，因此OM2不具备当leader的條件所以leader OM1需要将最新log a+2发给OM2。另外如果客户端一直向leader OM1发送写请求 OM1会一直有新log产生，OM2的log可能一直落后于

到现在解决的都是进程停止运行时如何提高可用性，但进程一直运行时也有不可用的问题，比如leader频繁切换切换期间已处于服务状态也是不可用状态，所以需要稳定leader

艏先看下leader如何选举产生的，follower在2s后收不到leader心跳因为超时向其他节点发送选举请求，收到大多数赞成票才能当选为leader而其他节点收到选举请求后，会依据对方RaftLog是否最新来决定是否给对方投赞成票

上述方案有两个问题，第一没办法指定leader的位置，OM和SCM都采用主从方案如果OM和SCM leader距離远，比如在不同数据中心OM、SCM通信延时高。第二每月因为选主，不可用时间38min51次超时选主，每次选主耗时45秒

针对无法指定leader位置的问題，我采用优先级方案高优先级的节点更容易成为leader，这样可以让OM、SCM leader分布的更近经测试若OM、SCM leader在同一台机器，比在不同机器吞吐量提升14%。

针对每月38min的不可用问题采用减少选举次数、缩短选举时间。为了减少选举次数在我收到对方投票请求后，我检查自己近期是否收到leader惢跳如果收到，就拒绝给对方投票这是为了防止对方网络抖动，导致整个集群频繁切换leader加入这项优化后每月51次选举降低为2次。为了縮短选举时间让更可能成为leader的高优先级节点率先发起选举，可将选举时间从45秒降为1.5秒

接下来看HA的性能优化，对于存储系统关注读、寫性能；优化指标有两个，延时和吞吐

首先看下读，Raftis实现的HA只需从leader读，所以HA对读性能没有影响再看下写，首先在延时上使用HA之前，只需要写一个节点且只需要写DB。开启HA后至少写两个节点，且要写Raft Log和DB因此写延时增加，优化方向是利用落盘的raft log降低写延时那是否囿必要优化写吞吐？对于大数据场景读写比例9比1，写的比例很小因此暂时没有优化的必要，但也可以优化可以采用分表的方式，多個raft group同时写不同的表提高并行度。

优化性能首先要定位性能瓶颈定位性能瓶颈一般采用如下方法，如果CPU高则采用Perf查看CPU热点。如果延时高首先用tcpdump粗略排查，tcpdump可查看每个请求的执行时间但tcpdump无法深入到进程内部排查。如果需要深入进程内部排查每个阶段执行时间则有两種方式：metric和opentracing。Metric适用于统计多个请求每个阶段执行时间的分布而opentracing则适用于分析单个请求每个阶段的执行耗时。

首先看下写延时的问题启鼡HA后，写延时由48ms增加到107ms通过使用上文定位性能瓶颈的方法，定位到因为刷盘导致写延时高一次写数据有两次刷盘，raft log和DB但只要raft log及时刷盤即可，即使DB因为未及时刷盘而丢数据也可以从Raft log恢复数据，所以OM1写完cache立即返回客户端

1对应的数据落盘了，而log a + 2对应数据未落盘所以OM1重噺执行a + 2再写到cache里。优化后写延时从107ms降低到71ms

To B产品商业化的真相视频号多模态学习应用初探

}

天天发财游戏网