为什么宝马需要一个提供系统高可用性性的IT基础设施?

点击联系发帖人 时间：2017-06-04 16:47

oracle 高可用性

关于服务器，那些只知道与不知道的
导语随着科技的高速发展，企业对IT的依赖性也呈现出持续增长态势，特别是云计算和大数据的出现，IT建设开始更多的融入到企业发展中，通过将服务作为IT的核心，来提升企业业务的敏捷性。作为信息化建设的“心脏”，服务器选择好坏、合适与否将在很大程度上直接影响企业的正常运作。
读者小调查
1您最关心服务器的哪类问题？
品牌质量性能价格服务
1您觉得本篇专题对您了解服务器是否起到了帮助作用？？
1除了服务器，您还关注哪些产品类别？？
存储网络安全电脑外设
服务器技术解析
处理器平台
计算机的大脑，是衡量服务器性能的首要指标，目前市面上主流服务器大都采用Intel至强处理器
服务器硬盘
IT平台的数据仓库，所有信息都存储在这里，需要具备速度快、稳定性强、支持热插拔等特性。
服务器内存
相比PC，服务器内存要求要严格得多，除了速度外，它更强调内在纠错技术能力和稳定性。
IOPS，决定IT服务体验的关键指标，且随着数据爆发式增长，I/O性能将愈发重要
服务器网卡
衡量服务器网卡性能，主要有传输速度、CPU占用率、稳定性和安全性四个关键指标
服务器电源
作为整个机器的能源供应系统，电源是服务器能够7×24小时不间断运作的有利保障。
冗余电源是用于服务器中的一种电源，是由两个完全一样的电源组成，由芯片控制电源进行负载均衡，当一个电源出现故障时，另一个电源马上可以接管其工作，在更换电源后，又是两个电源协同工作。冗余电源是为了实现服务器系统的高可用性。
你应该知道的问题汇总
Q1服务器和工作站或是配置高的PC有什么区别？仅仅是在性能上吗？我用高配PC代替服务器可不可以？
&&&&&&A、我们可以这样理解，服务器就是一种高性能的计算机，在构成上与PC基本相似，有处理器、硬盘、内存等，但它们依旧无法通过高配置的PC来替代，这主要是因为其背后的技术是专为不同目的设计的。服务器作为网络的节点，存储和处理网络上80%的数据和信息，因此它也成为了网络的灵魂。因此相比PC产品在安全性、稳定性、可靠性、可扩展性、管理性等方面都有很大的差异。举例来说，服务器要实现每年365天，每周七天，每天24小时的管理、存储、发送和数据处理工作。基于这些原因，服务器的可靠性要远远超过台式机。为了做到这一点，服务器提供了通常桌面PC无法实现的各种功能。
Q2什么情况下才需要用到服务器？
&&&&&&A、这个问题比较笼统，我的理解是您需要判定企业在什么需求的情况下需要配置服务器而不能够用PC，对吗？对于这类问题，我们可以打一个比方，服务器就是企业的“大脑”，是整个IT架构的中枢所在，如果您的某项需求例如收发邮件、网站维护等需要设备做7x24小时的运行，同时需要处理大量数据或备份数据等，这时您可能就需要配置一台服务器了。
Q3如何根据企业需求来定制服务器？
&&&&&&A、目前服务器按企业的实际应用来分类,可以分为文件服务器、数据库服务器、邮件服务器、Web服务器等。&&&&&&文件服务器：在局域网当中，以文件数据共享为目标，将共多台计算机使用的文件存储，存放于一台服务器当中，这台主机就被称为文件服务器，文件服务器相当于一个信息系统的大仓库，保证用户和服务器之间快速传递数据。因此，选择文件服务器优先考虑的就是网络的传输情况，其次是磁盘的读取速度，对于处理器的要求不高。
&&&&&&数据库服务器：顾名思义，数据库服务器的主要作用就是帮助企业存储和检索数据，例如企业的财务系统，人事系统等需要频繁的读取和索引数据的各种管理系统。这就对服务器的网络系统和I/O数据传输能力有比较高的要求，这种情况，企业对数据库服务器选择考虑因素依次应该是网络的系统，IO数据传送能力，处理器、内存、磁盘系统。常规情况下，用户在选购服务器时可以选择2路的一个CPU，内存稍微大一些，硬盘读取速度稍微快一些。
&&&&&&邮件服务器：邮件服务器相对来说比较简单，是企业使用较多的一个服务器系统，扮演着电子邮件、路由器和仓库的双重角色。影响邮件服务器的关键因素依次是网络系统，内存，硬盘系统和处理器，这个相对来说比较简单一些，
&&&&&&Web服务器：Web服务器的性能是由网站内容来决定的，如果Web站点是静态的，那系统瓶颈依次是网络子系统和内存；如果Web服务器主要进行密集计算，系统瓶颈依次是内存、CPU、磁盘系统和网络系统。
&&&&&&此外，还有OA服务器、多媒体服务器或者是说ERP服务器等，用户在选购过程中可以根据自身的实际需求来决定，如果预算有限可以先配置最主要的服务器，将几种功能融于一台服务器，后期随着企业发展在分别购置、分类，毕竟按应用分类，能够在服务器遇到问题时，对症下药。
Q4我做ERP系统的，服务器是必须的，但我是不是可以用普通的配置好一点的PC来做服务器，不一定非要采购塔式服务器、机架服务器吧？
&&&&&&A、这主要是看你的ERP程序的应用规模和需求，如果用户人数多，数量大最好用专业一些的服务器，但如果规模小，用户人数不多，数据量也不是很大，而且不要求服务器7*24小时的工作，则完全可以用好点的PC机，但平时一定要做好备份。如果还需求7x24小时的话，这里还是建议你采用正规服务器，毕竟现在服务器的价格已经和台式pc相差不大了。
Q5塔式服务器、机架服务器、刀片服务器三者有何区别，我们应如何进行选择？
&&&&&&A：首先来看塔式服务器。塔式服务器与台式机电脑主机外观十分相像，经常见到。但塔式服务器主板扩展性较强，且机箱内部会预留很大空间，以便日后扩展，如硬盘、内存、电源等。可见，塔式服务器具有良好扩展性，适合成本预算有限、对性能要求较低的中小（微小）企业；缺点为：体积较大，占用空间较多。
&&&&&&其次，机架式服务器。机架式是绝大多数企业首选服务器，其统一标准的设计，满足企业服务器密集部署需求。主要特点：节省空间，可统一安装在机柜上，便于管理。缺点为：内部空间有限，扩展性受到限制和散热需注意。
&&&&&&最后来看刀片服务器。刀片服务器是一种高密度、低成本服务器平台，专门应用于特殊行业（航天、教育、政府等）。
Q6中小企业选购服务器应关注哪些方面？
&&&&&&A：采购服务器应注重：稳定性、易用性、扩展性、可靠性及高效性五方面。
Q7现在几乎所有的服务器都是采用至强E3、E5、E7处理器，他们有什么区别呢？对企业来说，如何确定选用哪种处理器最合适呢?
&&&&&&A：首先，Intel E3，E5，E7代表了3个不同档次的至强CPU，至强“E系列”的这种命名方式有些类似桌面上的Core i3，i5，i7；比较通俗易懂的解释就是可以对应我们的豪华汽车生产商宝马3系，5系和7系。分别对应好，更好和最好。其中：
&&&&&&至强E3处理器是第一款使用Haswell微架构的至强处理器芯片（目前，英特尔的多数芯片是以Ivy Bridge架构为基础），最多配置4个内核，最高支持32GB内存，耗电量只有13瓦，主要用于工作站和单路服务器；
&&&&&&至强E5处理器主要用于中档服务器，最高支持768GB内存，耗电量为60至130瓦，适用入门级双路服务器、高性能双路和四路服务器，也是目前使用最为广泛的主流处理器；
&&&&&&至强E7处理器是英特尔性能最高的服务器处理器，芯片包括30GB三级缓存，最高支持4TB内存，耗电量为130瓦。这种处理器可用于8路服务器。
&&&&&&至于具体应用可以根据处理器的型号来判定，以英特尔最新发布的E5-2600 V2为例，这里的“2”，也就是连字符后的第一个数字，它代表处理器最多支持的并行路数，有1、2、4、8四种规格，分别代表了单路、双路、四路和八路。我们现在举例的这款E5-2600 至强CPU，连字符后的第一个数字是"2"，就表示这款CPU为双路，只能用于对应的双路芯片组的主板。
&&&&&&紧接着，我们来看连字符后的第二个数字，它代表处理器封装接口形式，一共有2，4，6，8四种规格，分别是2对应Socket H2(LGA 1155)、4对应Socket B2(LGA 1356)、6对应Socket R(LGA 2011)、8对应Socket LS(LGA 1567)。我们举例的这款E5-2600，连字符后的第二个数字是"6"，对应Socket R(LGA 2011)
&&&&&&然后，连字符后第三和第四位代表编号序列，一般是数字越大产品性能越高，价格也更贵。
&&&&&&最后，看连字符后第四位数字后面的代表什么。紧跟第四位数字后的"L"代表是低功耗版，留空的话就代表是标准版。
连字符后面最后的数字代表修订版本，比如v2、v3、v4等等，这次新发布的E5-2600 V2就是第二次升级版。
Q8服务器内存中的DIMM是什么？
&&&&&&A：DIMM全称是Dual-Inline-Memory-Modules，即双列直插式存储模块，是在新型内存条，DIMM提供了64位的数据通道，因此它在主板上可以单条使用。它有168条引脚，故称为168线内存条。它要比SIMM插槽要长一些，并且它也支持新型的168线EDO-DRAM存储器。
&&&&&&对于多路的服务器来说，其对内存带宽和内存容量是极度渴求的，普通DIMM采用的是一种“短线连接”(Stub-bus)的拓扑结构，这种结构中，每个芯片与内存控制器的数据总线都有一个短小的线路相连，这样会造成电阻抗的不继续性，从而影响信号的稳定与完整，频率越高或芯片数据越多，影响也就越大。
Q9什么是平均无故障时间？
&&&&&&A、所谓平均无故障时间 (Mean Time Between Failure，简称MTBF) 是指MO磁光盘机平均能够正常运行多长时间，才发生一次故障，这是衡量MO磁光盘机可靠性的重要参数，它反映了产品的时间质量，是体现产品在规定时间内保持功能的一种能力，目前很多专业IT运维人员在测试服务器的过程中，都会将平均无故障时间作为衡量产品可靠性的重要指标，平均无故障时间越长，MO磁光盘机的可靠性就越高。
Q10平时服务器维护时都对服务器做些什么？
&&&&&&A、主要分为硬件维护和软件维护两部分。硬件维护就是对服务器的CPU、内存等硬件进行检测、更换和升级；软件维护则包括操作系统升级、软件维护、数据备份和安全维护等等。
Q11现在到处都在宣传虚拟化，服务器虚拟化、存储虚拟化、桌面虚拟化，他们到底有什么区别，有哪些好处和弊端，还是说是在炒概念？
&&&&&&A：确实，这两年虚拟化比较火，不过这不是炒概念，而是实实在在的东西。三者区别主要是：服务器虚拟化是指把一个实体服务器的运算能力分给不同的用户，而存储虚拟化是指把不同的存储服务集中到一个实体存储器上。而对于桌面虚拟化来讲，它并不是让多个用户合用一个桌面，而能将你电脑硬盘驱动上的内容迁移到服务器上。服务器统领着不同个人电脑、平板电脑、智能手机和瘦客户机上的桌面，让它们随时随地保持互联。服务器虚拟化之后增强的安全性和维护的便捷性同样可以应用到桌面上。
&&&&&&至于优缺点，由于篇幅有限，我们只简单介绍下服务器虚拟化的特点：
&&&&&&1.整合服务器:通过将物理服务器变成虚拟服务器减少物理服务器的数量，可以在电力和冷却成本上获得巨大节省。此外，还可以减少数据中心UPS和网络设备费用、所占用的空间等等。
&&&&&&2、避免过多部署:在实施服务器虚拟化之前，管理员通常需要额外部署一下服务器来满足不时之需。利用服务器虚拟化，可以避免这种额外部署工作，而且它支持虚拟机的完美分割。
&&&&&&3、事半功倍:在经济不景气的情况下，IT部门和管理员更需要有事半功倍的理想方式来实现。服务器虚拟化可以帮助管理员更灵活、更高效地实现IT管理工作。
&&&&&&4、节省开支:通过服务器虚拟化，公司不仅能享受到物理服务器、电源和散热系统带来的成本节约，而且还可以大幅减少管理物理服务器的宝贵时间。终端用户也会因高效稳定运行而更具有忠诚度。
&&&&&&5、迁移虚拟机:服务器虚拟化的一大功能是支持将运行中的虚拟机从一个主机迁移到另一个主机上，而且这个过程中不会出现宕机事件。VMware的 vMotion能为你实现这一点，使得像分布式资源调度（DRS）和分布式电源管理（DPM）一样去实现。
&&&&&&6、减少宕机事件:类似vMotion，storage vMotion（svMotion）、DRS和VMware高可用性（VMHA），都有助于虚拟化服务器实现比物理服务器更长的运行时间。
Q12现在服务器虚拟化越来越流行，是不是我们企业也应该着手布置虚拟化，在这之前需要准备些什么？
&&&&&&A：随着服务器虚拟化技术的成熟，优点确实越来越明显，但这并不意味着所有的企业都适合更确切说是实现由传统架构到虚拟化的平和过度。这之前有些问题一定要考虑清楚，比如说：虚拟化规划是否存在单点故障，所有的应用程序是否都支持虚拟化环境，是否有服务器不适宜虚拟化，域控制器该如何安置，最适合的虚拟化平台是什么，如果服务器出故障，应急计划是什么，每台宿主服务器可以容纳多少客户机，老旧硬件如何处理等等问题，都要考虑清楚，这里建议在有这个想法之后先进行一个评估或找相关专业人士根据企业自身现状进行咨询后在说决定。
Q13是否需要一套全新的安全和管理工具来保护虚拟化环境？
&&&&&&A、不需要。明智之举就是，从保护物理服务器和网络环境的一套现有安全工具入手，然后运用到虚拟环境。但一定要了解厂商是如何跟踪虚拟化风险、将来如何与其他产品进行集成的。
Q14冗余电源是指什么？对服务器采购来说必要吗？
&&&&&&A、很必要，前面有介绍服务器与PC的主要区别之一就是其稳定性，冗余电源就是基于这个目的的一项保护技术。它是由两个完全一样的电源组成，由芯片控制电源进行负载均衡，当一个电源出现故障时，另一个电源马上可以接管其工作，在更换电源后，又是两个电源协同工作。冗余电源是为了实现服务器系统的高可用性。除了服务器之外，磁盘阵列系统应用也非常广泛。
Q15RAID是指什么？如何选择合适的RAID级？
&&&&&&A、RAID是一种把多块独立的硬盘(物理硬盘)按不同的方式组合起来形成一个硬盘组(逻辑硬盘)，同时将数据切割成许多区段，分别存放在各个硬盘上，从而提供比单个硬盘更高的存储性能和提供数据备份技术，并且能利用同位检查（Parity Check）的观念，在数组中任一颗硬盘故障时，仍可读出数据，在数据重构时，将数据经计算后重新置入新硬盘中。根据磁盘陈列的不同组合方式，可以将RAID分为不同的级别。每级都有其独特的优势，用户可以根据特定的商务需求来进行组合。这里我们只介绍应用最广泛的RAID级：0、1、5和10.
&&&&&&RAID 0级，将数据基带条分配到多个磁盘上，没有冗余或奇偶检验。该RAID级的主要特性是数据吞吐速度极高，提高了数据读取性能，但任一磁盘发生故障都会丢失存储的数据。
&&&&&&使用两块硬盘存储复制数据时，我们实施RAID 1级（称之为磁盘镜像），多数情况下通过软件来实现。如果一个硬盘发生故障，则会将所有数据保存到另一个硬盘上。尽管它提供了最大的容错，但由于要求两倍的磁盘数量，因此RAID 1级是极为昂贵的选择。随着磁盘技术成本的不断下降，RAID 1逐渐成为优化数据可用性的可行选择。
&&&&&&RAID 5级，将基带条和“奇偶校验”组合在了一起，这种情况下，数据分布与线组的硬盘中。奇偶校验数据可以使RAID控制器了解数据在硬盘上的存储位置。RAID 5允许同时进行数据读写，为要求高性能的数据密集型应用提供了支持。可以通过调整基带条的大小来优化性能。RAID 5级以合理的价位提供了最佳的性能和数据安全性，因此目前它很受欢迎。
&&&&&&RAID 10级（0+1）是RAID 0和RAID 1的组合，它将基带条和磁盘镜像结合在了一起。RAID 10级可提供0级的快速性能和1级的数据保护特性。在这一配置中，数据分布在几个硬盘上，并将每个磁盘的数据都复制到另一个磁盘上，从而保护了数据。
Q16主要存储股票数据，包括日线数据，成交明细，财务数据（这3个数据相对不重要，3TB），分析后的记录数据（最重要的数据部分,2TB，基本上不允许出问题），如何选择硬盘和RAID模式？
&&&&&&A、你重要的是需要是一个RAID卡，这个钱不能省，否则都是白搭。如果对成本完全没有考虑的话，可以全部选用SAS盘做RAID5；对成本有控制的话，建议使用2TB SATA磁盘，还是都是RAID5的模式，需要用不重要的数据放一个阵列，3个硬盘RAID5即可；重要数据也是3个盘RAID5。额外需要1-2个盘做hotspare.还有一种方法，全部做RAID1。所有硬盘都做镜像。
Q17什么叫做负载平衡?
&&&&&&A、负载均衡是由多台服务器以对称的方式组成一个服务器集合，每台服务器都具有等价的地位，都可以单独对外提供服务而无须其他服务器的辅助。通过某种负载分担技术，将外部发送来的请求均匀分配到对称结构中的某一台服务器上，而接收到请求的服务器独立地回应客户的请求。均衡负载能够平均分配客户请求到服务器列阵，籍此提供快速获取重要数据，解决大量并发访问服务问题。这种群集技术可以用最少的投资获得接近于大型主机的性能。
&&&&&&采用负载均衡能将传入的请求传播到多达32台服务器上，即可以使用最多32台服务器共同分担对外的网络请求服务。网络负载均衡技术保证即使是在负载很重的情况下，服务器也能做出快速响应; 当网络负载均衡中的一台或几台服务器不可用时，服务不会中断。网络负载均衡自动检测到服务器不可用时，能够迅速在剩余的服务器中重新指派客户机通讯。这项保护措施能够帮助你为关键的业务程序提供不中断的服务，并可以根据网络访问量的增加来相应地增加网络负载均衡服务器的数量;
Q18如何控制机房的电力消耗？
&&&&&&A、对于耗电大户的数据中心来说，节约能源成为重中之重。有数据显示，除负责计算的设备之外，散热设施也消耗的了大量的电力，甚至达到了数据中心能耗的50%以上。
&&&&&&数据中心节能分为两条路：一是在保证整体性能不断提升的同时提升服务器的耐热程度，进而降低数据中心散热设施的压力，也就是我们常说高温数据中心;另一种则是大幅度降低当前服务器的功耗，从而减轻散热设施的压力，也就是近期热门的低功耗技术
对于中小企业来讲，机房或数据中心是自建还是IDC托管？
作为一家刚成立不久的微小企业，如果选购服务器，应该选购什么类型的服务器，哪些品牌可作为选择对象？
企业机房升级后，替换下的旧服务器、存储设备如何处理才能做到不浪费？
现在有很多家厂商都推出了计算、存储及网络融合一体机产品，这种新型设备是否真正适合中小企业？
现在公司越来越多的同事自带笔记本和平板电脑上班，给公司安全和IT管理造成了很大困难，面对这种情况应该怎么处理？
在关注服务器I/O性能时，经常会提到SATA端口、PCI-E3.0，SAS端口，这之间有哪些关联，哪种是现在和以后的主流？
选购数据库服务器时应考虑什么？邮件服务器和Web服务器呢？
是否有服务器不适宜虚拟化?
如果服务器出故障，应急计划是什么?
每台宿主服务器可以容纳多少客户机?
如何利用旧服务器?
现在的服务器集群该如何处置?
域控制器该如何安置?
软件许可证有哪些变化?
网站合作、内容监督、商务咨询、投诉建议：010-
Copyright © 2000--
硅谷动力公司版权所有京ICP证000088号developerWorks 社区
随着网络技术的发展，企业的应用也越来丰富，越来越复杂，他们对计算机系统的依赖性不断的增强。应用的后台核心领域是否具有保护业务的关键数据和维持应用程序的高可能性的能力已经成影响企业成功的关键的因素，人们不仅希望保障关键业务数据信息的完整，还希望联机应用能够不间断或在最短时间内恢复，这就是所谓的计算机系统的高可用性（HA，High Availability）。WebSphere Application Server 产品提供的高可用性框架消除了单一故障点，并为在产品环境中运行的应用程序和进程提供对等故障转移功能。此基础结构由高可用性管理器管理，并且包括单元、集群、核心组和高可用性组。每个高可用性组都有相关概念，以及如何配置高可用的 WAS 环境。
, 软件工程师, IBM
李明慧： 2007 年加入 IBM，先是在 IBM 中国软件开发中心 Data Studio 团队工作从事 InfoSphere Warehouse Administration Console 的功能测试工作。后转到 WebSphere 应用服务器系统测试部组工作，曾在 developerWorks 发表《将 DB2 DWE 9.1.X
迁移到 DB2 Warehouse 9.5 》、《 InfoSphere Warehouse SQL 仓储命令行接口》以及《 Linux 下利用 squid 反向代理提高网站性能》《 InfoSphere Warehouse Administration Console 的对比介绍》，《 SQL 语句性能调优 - 初级篇》。
引言随着网络技术的发展，企业的应用也越来丰富，越来越复杂，他们对计算机系统的依赖性不断的增强。应用的后台核心领域是否具有保护业务的关键数据和维持应用程序的高可能性的能力已经成影响企业成功的关键的因素，人们不仅希望保障关键业务数据信息的完整，还希望联机应用能够不间断或在最短时间内恢复，这就是所谓的计算机系统的高可用性。WebSphere Application Server（简称为 WAS）产品提供的高可用性框架消除了单一故障点，并为在产品环境中运行的应用程序和进程提供对等故障转移功能。此基础结构由高可用性管理器管理，并且包括单元、集群、核心组和高可用性组。每个高可用性组都有相关联的策略，高可用性管理器使用该策略来确定在给定时间高可用性组的哪些成员活动。本文将向您介绍 WAS 高可用性的相关概念，以及如何配置高可用的 WAS 环境。可用性相关的概念在开始介绍 WAS 高可用性之前，我们先来看一下什么是应用服务器系统可用性，如何来定义度量可用性？可用性是指系统正常无故障运行的时间，同时也包括当系统发生故障时，恢复所需要的时间。换句话说，其实是系统当机时间定义了系统的可用性。当机时间包括了计划当机时间和意外当机时间。如果用 A 来代表用百分比表示的系统可用性的话，它的计算公式为：A = MTBF/(MTBF + MTTR)其中：MTBF 为平均故障间隔时间 (Mean Time Between Failures)MTTR 为系统故障恢复所需最长时间 (Maximum Time to Recover the System from Failures)在这个公式中，当 MTBF 变大时，A 也会随之增大，并且 MTTR 对于 A 的影响也会变小。在 MTTR 接近零时，A 也会增大到接近 100% 了。这就意味着，如果我们能够尽快的从故障中恢复回来的话，这个系统就是一个高可用的系统。系统恢复的时间包括了故障检测的时间和系统恢复的时间。因此，集群软件使用故障检测机制和自动的故障转移，由正常的系统来接替工作。因为故障检测的时间很短，并且不需要试图修复故障，MTTR 被缩短了。因此，A 也就被显著的提高了。但是可用性问题是并不像上面公式那样简单的。首先，MTBF 仅代表了一个趋势。例如，我们说某 CPU 的 MTBF 是 500,000 个小时，这并不意味着，CPU 会在使用了 57 年之后，才会发生故障。事实上，CPU 可能在任意时刻出现故障。并且，通常情况下，系统都包含了很多的部件，每一个部件的 MTBF 和 MTTR 都是不一样的。这些不同，使得一个系统的可靠性不太可能通过上面的公式来推断。对于 WAS 生产系统来说，可用性就变得更加复杂了，因为 WAS 生产系统包含了很多的组件，像子防火墙、Load Balancer、Web 服务器、应用服务器以及管理服务器（Node Agent 和 Deployment Manager），以及管理存储库、日志文件、持久会话数据库、应用数据库，LDAP 目录服务器等等。整个系统的可用性其实是同这个系统中最弱的组件的可用性为决定的。通常情况下，可以通过额外的硬件备份以及集群软件来达到高可用性。目标就是通过各种各样的高可用性技术来达到减小 MTTR 的目的。即，如果 MTTR = 0，刚 A = 100%。通过这种方式，系统的可能性可以变得可以预测和可管理。以上介绍了高可用性的相关概念。布署高可用性环境包括了从硬件、软件，再到应用程等序方方面面，可以说一个高可用性的环境其实是一个解决方案。受篇幅所限，本文不可涵盖高可用性的所有方面。本文将只介绍 WAS 的高可用性的相关概念以及如何配置。设置 WAS 高可用性环境在开始高可用性环境之前，您需要了解如何设置高可用性环境，以避免不在故障转移覆盖范围内的故障风险。WAS 的高可用性管理设计在所有支持的产品拓扑中发挥作用。但是高可用性管理环境必须遵从下列规则：高可用性架构中的单元被分区成一个或多个核心组。产品提供了一个缺省的核心组，作为高可用性管理器功能的一部分。可以使用管理控制台来创建其它的核心组。核心组不能扩展到单元边界外，而且它也不能跟其它核心组重叠。集群必须仅能成为一个核心组的成员，该集群的所有成员也必须为同一核心组的成员。各个应用服务器也是核心组成员。所有正在运行的核心组成员必须能够与其它正在运行的同一核心组成员通信。接下来，先介绍一些设置高可用性管理，涉及到几个概念。高用性管理器高可用性管理器（High Availability Manager），是 WAS V6 ND 版本引入的一个新特性，它增强了 WebSphere 中的单例服务 (Singleton Service) 的可用性。单例服务包括：事务服务 - 事务日志恢复消息服务 - 消息引擎重启高可用性管理器提供了一个对等恢复的机制，该机制使得交易中的事务或传递中的消息可以在 WAS 应用服务器集群中进行恢复。高可用性管理器作为服务运行于每一个 WAS 的进程中（Deployment Manager、Node Agent、以及应用服务器），它监控 WAS 单例服务的健康状况。一旦发生了服务器故障，高可用性管理器就会将运行于故障服务器上的单例服务转移到对等的服务器上面去。故障转移例子，如正在进行着的事务交易或重启运行于故障服务器上的消息引擎。如图 1 所示，每个应用服务器上都运行着一个高可用性管理器实例，并且它们通过底层的 DCS (Distribution and Consistency Services) 通信架构来共享服务器状态信息，这样，在这个拓扑里出也不存在单点故障了。集群中的每个成员都知道单例服务运行在哪个服务器之上。图 1. 高可用服务器架构示例这样的 pear-to-pear 的故障转移模型极大地缩短了故障恢复的时间，而且通过比以往更简单的设置，就可以实现 WAS 集群的高可用性，不再需要任何的外部高可用性软件。核心组核心组就是一个单元中的高可用性域。它物理上的将一个单元中多个 JVM 分组，每个核心组用来承载单例服务。核心组可以包含单独运行的应用服务器、集群成员、Node Agent 或是 Deployment Manager。上述的每一个进程都会在单独的 JVM 里面。一个单元中必须至少包含一个核心组。当然，它也可以包含多个核心组。缺省情况下，每个单元中，WAS 会创建一个核心组，称为 Default Core Group。每一个 JVM 进程都只能是一个核心组的成员。所以，自然地，一个集群的所有成员都将只属于同一个核心组。图 2. 核心组示例这一组 JVM 能够作为一个组来共同运行高可用性服务。所有的能够运行服务的 JVM 在启动时就加入到组中。如果单例服务（例如事务管理器或消息引擎）的范围的 WebSphere 集群的话，那么集群中的所有成员都是可以运行该项服务的 JVM 组的一部分。正如前面提到，核心组不能超越单元的边界，或是与其它核心组重叠。同一个单元中的核心组或是不在同一单元里的核心组可以通过核心组网桥来共享工作负载管理路由信息。核心组网桥在那种大范围的跨地域的集群环境中，可以在单元中创建多个核心组，并通过核心组网桥来将它们连接起来形成灵活的拓扑结构。配置核心组网桥服务使得核心组之间能够共享有关内部产品组件的可用性信息。例如，通过配置核心组网桥服务，每个核心组都可以知道在所有核心组中配置的所有应用程序服务器的状态。可以配置核心组网桥以启用下列通信场景：同一单元中的核心组之间的通信；不同单元中的核心组之间的通信；同一单元中的核心组和其他单元中的一个或多少核心组之间的通信；不同网络上核心组之间的通信；使用代理对等访问点的核心组之间的通信；使用隧道对等访问点的核心组之间的通信。如果要使用 DMZ Secure Proxy Server for IBM WebSphere Application Server，那么必须配置此类型的通信。图 3. 核心组网桥示例核心组协调程序核心组的成员身份在运行时确立之后，其中的一个成员就会被中来做这个核心组的协调者，称为核心组协调程序。核心组协调程序主要负责管理核心组中的高可用性组，它主要负责以下几个方面维护所有核心组信息，包括核心组名、组成员、以及核心组策略。跟踪核心组成员的启动、停止或故障的状态信息，并将这些信息传播给核心组中的每个成员。将单例服务分配给核心组成员并根据核心组策略来进行故障转移。图 4. 核心组协调程序的职责示例高可用性组高可用性组是动态创建的核心组组件。不能直接对它们进行配置，但是它们直接受核心组级别上指定的静态数据（例如策略配置）影响。每个高可用性组都代表了一个高可用性的单例服务。高可用性组中的高可用性成员随时准备着来运行服务。图 5. 高可用性组示例高可用性组策略每个高可用性组都具有相关的策略都具有相关的策略。些策略可用于确定一个高可用性组的哪些成员在给定的时间处于活动状态。高可用性组使用的策略存储在核心组配置中。同一策略可供若干个不同的高可用性组使用，但所有应用此策略的高可性组必须属于同一核心组。为一个策略指定的所有设置会影响高可用性管理器如何管理与该策略相关联的高可用性组。某些策略设置只适用于特定的策略类型，而其他策略设置于适用于所有策略类型。有五种类型的策略：“全部活动”策略：当选择此策略时，高可用性组的所有成员都处于活动状态。“M/N”策略：当对包含 N 个成员的高可用性组选择些策略时，其中有 M 个成员会变成活动状态。可以在策略设置中配置 M 所表示的数目。“无操作”策略：当选对此策略时，没有任何高可性组成员变为活动状态。可以使用管理控制台来手动激活特定组成员。“1/N”策略：当对包含 N 个成员的高可用性组选择些策略时，访组中只有一个成员会变为活动状态。静态策略：当选择此策略时，只有在静态组服务器设置中指定的成员才会变成活动状态。策略是静态配置的，而由它们管理的高可用性组是动态创建的。通过比较高可性组名和策略匹配条件这两项信息，来将正在运行的高可用性组与已配置的策略关联机来。高可用性管理器会动态检测策略配置更改。因此，一旦保存和传播这些更改，策略设置更改就会生效，而不需要重新启动服务器。以上，已经给大家介绍了 WAS 高可用性环境的相关概念，接下来就通过一个示例来向大家说明如何构建 WAS 高可用性环境。设置高用性环境举例在本示例中，需要事先创建一个 Deployment Manager 和两个 node，并且这两个 node 已经联合到了 Deployment Manager 所在有单元中。在这两个 node 上分别创建一个集群（水平集群），集群名为 WebCluster 和 EJBCluster，每个集群有至少两个集群成员即可。为了验证配置的正确性，我们会用一个应用程序（ping51.ear），它包括两个模块，分别为 Web 模块和 EJB 模块，需要将它分别部署在两个集群上。创建新的核心组
前面提到，WAS 为每个单元都创建了缺省的核心组 DefaultCoreGroup。此缺省核心组对于大多数配置已经足够。但是在某些情况下，需要为单元创建其他的核心组。这里为了举例，我们将创建两个新的核心组。在管控制台中，单击服务器 & 核心组 & 核心组设置 & 新建，来创建核心组。创建两个核组，并取名为 CoreGroup1 和 CoreGroup2。将 Deployment Manager 和 node 移动到新建的核心组中
在移动应用程序服务器、Deployment Manager 或 Node Agent 时执行步骤稍有不同。首先将应用服务器移至另一个核心组。停止要移动的应用服务器。在管理控制台，单击服务器 & 核心组 & 核心组设置，在这里可以看到拓扑中的核心组列表。单击包含要移动的应用服务器的核心组的名称，这里应该是 DefaultCoreGroup。在核心组的配置页面的“其它属性”下，单击核心组服务器能够看到该核心组的成员列表。这个列表包含了所有隶属于该核心组的应用服务器、Node Agent 和 Deployment Manager。在“选择”列表中，选择要移到新核心组中的应用服务器，在这里，我们需要将两个集群中的集群成员分别移到两个核心组中去。单击移动。将显示核心组 & 核心组长设置 &core_group_name& 核心组服务器 & 移动管理控制台页面。该页面显示了选择要移动的应用服务器和应用服务器当前隶属的核心组。选择核心组以便将应用服务器移动到其中。“目标核心组”下面的下拉菜单列示了系统上的可用核心组。在这里，我们将 WebCluster 的两个成员服务器移动到 CoreGroup1 中，将 EJBCluster 的两个成员服务器移动到 CoreGroup2 中。保存设置。同步所有正在运行的节点，以便同步所有正在运行节点的配置。重新启动所移动的应用服务器。然后移动 Node Agent 至另一个核心组停上要移动的 Node Agent。与移动应用服务步骤相同的将 Node Agent 移动到另一个核心组里。在这里，我们将 WebCluster 所在的 Node Agent 移动到 CoreGroup1 中，将 EJBCluster 所在的 NodeAgent 移动到  CoreGroup2 中。保存设置。从 profile_root/node_agent_profile/bin 目录发出 syncNode 命令以便更新的配置手动同步到节点。重新启动所移动的 Node Agent。注意：一定在先手动同步配置，然后才能重新启动所移动的 Node Agent，以避免故障发生。最后移动 Deployment Manager 到另一个核心组。停止 Deployment Manager。从 profile_root/deployment_manager_profile/bin 目录中发出 wsadmin – conntype NONE – lang jython 命令，以便在 Deployment Manger 概要文件下启动本地脚本会话。这里我们可以将 Deployment Manager 移动到两个核心组中的任一个。AdminTask.moveServerToCoreGroup("-source &source_Core_Group& - target &target_Core_Group& -nodeName &node_name& -serverName &server_name&")发出 AdminConfig.save() 命令以保存配置更改。重新启动 Deployment Manger。通过管理控制台，同步所有节点，以便将更改的配置为每一个核心组设置核心组协调程序
前面提到核心组的成员身份在运行时确立之后，其中的一个成员就会被中来做这个核心组协调程序。进程名包括单元名、节点名和应用服务器名。默认情况下，高可用性管理器会按核心组名字字母顺序，选择排序最低的这个核心组进程来作为核心组协调程序。假如，在我们的环境中有如下的进程名：wascell01/wasdgmr01/dmgrwascell01/wasna01/wasmember01wascell01/wasna01/nodeagent在这个例子中，Deployment Manager 的名字，字母排序最低，然后是 Node Agent，最后是服务器成员。所以，如果没有指定首选协调组程序，那么 Deployment Manager 将会被为协调程序服务器。但是正如前面提到的，协调程序承担一些额外的职责，所以要占用 JVM 中一些额外的资源。因此我们应该挑选负担比较轻的进程作为协调程序，我们可以通过管理控制台来设置首选核心组协调程序，来覆盖默认选择的协调程序。在管理控制台中，单击服务器 & 核心组 & 核心组设置并选择现有的核心组，我们的示例中是： CoreGroup1 和 CoreGroup2。单击首选协调程序服务器，然后对首选协调程序服器列表添加或删除适当的服务器进程。使用添加和除去将服务器移入或移出核心组服务器列表，协调程序服务能够在该列表中的服务器上运行，使用上移和下移来调整此列表中服务器的顺序。请确保最想选用的服务器在列表开头，而最不想选用的服务器在列表末尾。这里我们可以选择负载较轻的 Node Agent 进程作为首选协调程序。虽然，我们只选择了一个 Node Agent 作为首选协调程序，但是您并不必担心会出现单点故障。与其它服务器器相比，高可用性管理器只是会给作为首选协调程序的服务器更高的优先级，而是完全排他的由首选协调程序来承担协调程序职责。配置核心网桥服务
如果要在核心组之间进行通信的话，需要配置核心网桥服务以在核心组之间建立通信。核心组是高可用性管理器的静态定组件。要配置核心组之间的通信，使用访问点组。访问点组是互相通信的核心组集合。为需要通信的每个核心组将核心组访问点添加到访问点组。核心访问点是为核心组通信的服务器（server）、节点（node）和传输通道链组合（transport channel chain）的集合。每个核心组都要定义一个或多个核心组访问点。DefaultCoreGroup 有一个缺省核心组问点。但是，如果核心组需要连接到不同网络上的其他核心组的话，那么您可能需要考虑为核心组配置多个核心组访问点。核心组访问点中的节点、服务器和传输通道链组合称为网桥接口。承载网桥接口的服务器叫做核心组网桥服务器。传输通道链定义了与其他核心网桥服务器通信时所使用的一组通道。每个传输通道链都有一个已配置的端口，核心组网桥服务器使用访端口来侦听来自其他核心组网桥服务器的消息。接下来，我们看一下，如何配同一单元中的核心组之间通信。配置访问点组以定义需要通信的核心组
在管理控制台中，单击服务器 & 核心组 & 核心组网桥设置 & 访问点组 & 新建。输入单元内唯一的访问点组名称。将核心组访问点添加到访问点组。为核心组选择单元中需要通信的任何可用核心组访问点。这里面我们需要将 CoreGroup1 和 CoreGroup2 加入到这个新建的访问点组中。为每个核心组访问点创建网桥接口
在管理控制台中，单击服务器 & 核心组 & 核心组网桥设置 & 访问点组 & acess_point_group_name& 核心组访问点。单击访问点组中核心组访问点的名称，然后单击显示详细信息。要创建新的网桥接口，单击网桥接口 & 新建。选择要做为网桥接口的服务器。我们应该选择不具有生产职责的服务器来作为核心网桥接口服务器。因为作为核心组网桥接口的任何服务器在核心组网桥启和故障转移处理期间，将使用大量的内存和 CPU。这里我们选择 Node Agent 作为核心组网桥接口。当然您也可将一个服务器专门用核心组网桥接口。高可用性组策略
WAS 提供了缺省策略，这些缺省策略已与某些产品组件使用的高可用性组相关。如果这些缺省策略无法满足安装需求，可以创建新的策略，但是不要更改任何一个缺省策略。就本示例言，我们不需要创建新的策略，只要使用缺省的策略就可以了。关于如何创建新的高可性组策略，可查阅参考资源。您可以在管理控制台中，单击服务器 & 核心组 & 核心组设置 & core_group_name & 策略来查看缺省策略。查看高可用性组信息
前面提到高可用性组是动态创建的核心组组件，是不能直接对它们进行配置的。下面我们来看一下，如何查看高可性组的信息。在管理控制台中，单击服务器 & 核心组 & 核心组设置。单击包含所要查看的高可性组的核心组。单击运行时选项卡。在组名字段中指定值。
如果要查看此核心组包含的所有高可用性组列表，那么在此字段中指定“*”。指定一组用逗号分隔的“名称 / 值”对，来仅获取那些组名包含指定“名称 / 值”对的高可用性组列表。例如。可以指定下面的这个值来获取名称包含 IBM_hc=WebCluster 和 type=WAS_TRANSACTION 的所有高可性组列表。
IBM_hc=WebCluster，type=WAS_TRANSACTION单击显示组，就可以看到符合条件的高可用性组的列表了。安装 ping51 应用程序
在管理控制台中，单击应用程序 & 新建应用程序 & 新建应用程序。下载附件中的 ping51 应用程序，浏览找到该应用程序后，单击下一步。选择快速路径，并单击下一步。在步骤 2 将模块映射至服务器时，分别将该应用程序的 Web 模块和 EJB 模块部署到 WebCluster 和 EJBCluster 上。成功安装应用程序之后，在单击应用程序 & 应用程序类型 & WebSphere 企业应用程序，选中刚才安装的 ping51 应用序，并将它启动。通过 URL：http://host:port/PingWeb/PingServlet?session=false 来访问应用，如果您能够看到类似下面的结果，那么您的配置就成功了。清单 1. 结果 ndcell:node7:WebCLustermember01
doGet /PingWeb/PingServlet?session=false&threads=1&iterations=10
0) PingThread[0] ndcell:win11towin98node11:EjbClustermember01 executed in 2
1) PingThread[0] ndcell:win11towin98node11:EjbClustermember01 executed in 2
2) PingThread[0] ndcell:win11towin98node11:EjbClustermember01 executed in 12
3) PingThread[0] ndcell:win11towin98node11:EjbClustermember01 executed in 2
4) PingThread[0] ndcell:win11towin98node11:EjbClustermember01 executed in 3
5) PingThread[0] ndcell:win11towin98node11:EjbClustermember01 executed in 2
6) PingThread[0] ndcell:win11towin98node11:EjbClustermember01 executed in 7
7) PingThread[0] ndcell:win11towin98node11:EjbClustermember01 executed in 3
8) PingThread[0] ndcell:win11towin98node11:EjbClustermember01 executed in 3
9) PingThread[0] ndcell:win11towin98node11:EjbClustermember01 executed in 2
====================
Target Distribution:
====================
ndcell:win11towin98node11:EjbClustermember01        10 38
  100.0% 3.8 ms/r 0.8421 r/ms
====================
Throughput Estimate:
====================
Milliseconds: 45
Total requests: 10
Time per request: 4.5 ms/r 0.2222 r/ms
====================小结本文向您介绍了 WAS 高可性的一些相关概念，并通过示例向您讲解了如何配置 WAS 的高可用性。WAS 的高可用性除了本文介绍的以外，还包括了很多的方面，如应用程序的高可性、SIP 高可用性等等，您可以通过参考资源了解更多的关于高可用性的知识。
查看，了解更多关于 WAS 的内容。
：这里为您总结了和 WAS 相关的资源，包括技术文章、试用版下载、最新动态等。
了解更多关于 WAS 高用性的内容。：为使用 WebSphere 产品的开发人员准备的技术信息和资料。这里提供产品下载、how-to 信息、支持资源以及免费技术库，包含 2000 多份技术文章、教程、最佳实践、IBM Redbook 和在线产品手册。：下载关键 WebSphere 产品的免费试用版。：IBM deveperWorks 最新的软件下载。：下载关键 WebSphere 最新的产品工具包。加入，developerWorks 社区是一个面向全球 IT 专业人员，可以提供博客、书签、wiki、群组、联系、共享和协作等社区功能的专业社交网络社区。加入，参与在线交流。
developerWorks: 登录
标有星（*）号的字段是必填字段。
保持登录。
单击提交则表示您同意developerWorks 的条款和条件。查看条款和条件。
在您首次登录 developerWorks 时，会为您创建一份个人概要。您的个人概要中的信息（您的姓名、国家/地区，以及公司名称）是公开显示的，而且会随着您发布的任何内容一起显示，除非您选择隐藏您的公司名称。您可以随时更新您的 IBM 帐户。
所有提交的信息确保安全。
选择您的昵称
当您初次登录到 developerWorks 时，将会为您创建一份概要信息，您需要指定一个昵称。您的昵称将和您在 developerWorks 发布的内容显示在一起。昵称长度在 3 至 31 个字符之间。
您的昵称在 developerWorks 社区中必须是唯一的，并且出于隐私保护的原因，不能是您的电子邮件地址。
标有星（*）号的字段是必填字段。
(昵称长度在 3 至 31 个字符之间)
单击提交则表示您同意developerWorks 的条款和条件。 .
所有提交的信息确保安全。
文章、教程、演示，帮助您构建、部署和管理云应用。
立即加入来自 IBM 的专业 IT 社交网络。
免费下载、试用软件产品，构建应用并提升技能。
static.content.url=/developerworks/js/artrating/SITE_ID=10Zone=WebSphereArticleID=710623ArticleTitle=您的 WebSphere Application Server 环境具备高可用性吗？publish-date=}

天天发财游戏网