摘 要:Internet的快速增长使网络服务器随着业务量的提高、访问量和数据流量的快速增长,服务器的负载均衡技术就成为建立一个高负载Web站点的关键性技术。使用LVS来实现负载均衡是很不错的选择,文章就LVS负载均衡的优点和实现方式进行了阐述,并对实现负载均衡的关键性配置进行了简单的说明。
关键词:LVS;服务器集群;负载均衡;调度算法
Internet的快速增长使多媒体网络服务器,特别是Web服务器,面对的访问者数量快速增加,网络服务器需要具备提供大量并发访问服务的能力。对于提供大负载Web服务的服务器来讲,CPU、I/O处理能力很快会成为瓶颈。简单的提高硬件性能并不能真正解决这个问题,因为单台服务器的性能总是有限的,尤其是网络请求具有突发性,当某些重大事件发生时,网络访问就会急剧上升,从而造成网络瓶颈,必须采用多台服务器也就是服务器集群提供网络服务,并将网络请求分配给这些服务器分担,才能提供处理大量并发服务的能力,因此服务器的负载均衡技术就成为建立一个高负载Web站点的关键性技术。
一、LVS及负载均衡介绍
(一)、LVS简介
LVS即 Linux Virtual Server,是由中国一个Linux程序员章文嵩博士发起和领导的,基于Linux系统的服务器集群解决方案,其实现目标是创建一个具有良好的扩展性、高可靠性、高性能和高可用性的体系。使用LVS架设的服务器集群系统从体系结构上看是透明的,最终用户只感觉到一个虚拟服务器。物理服务器之间可以通过高速的 LAN或分布在各地的WAN相连。最前端是负载均衡器,它负责将各种服务请求分发给后面的物理服务器,让整个集群表现得像一个服务于同一IP地址的虚拟服务器。
(二)负载均衡介绍
负载均衡(Load Balance)建立在现有网络结构之上,它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。
负载均衡可以通过软件实现也可以通过硬件实现,软件负载均衡解决方案是指在一台或多台服务器相应的操作系统上安装一个或多个附加软件来实现负载均衡,它的优点是基于特定环境,配置简单,使用灵活,成本低廉,可以满足一般的负载均衡需求。而硬件负载均衡解决方案是直接在服务器和外部网络间安装负载均衡设备,这种设备我们通常称之为负载均衡器,由于专门的设备完成专门的任务,独立于操作系统,整体性能得到大量提高,加上多样化的负载均衡策略,智能化的流量管理,可达到最佳的负载均衡需求。一般而言,硬件负载均衡在功能、性能上优于软件方式,不过成本昂贵,一台F5 BIG-IP等四/七层负载均衡交换机的价格在十几万到上百万。
现代负载均衡技术通常操作于网络的第四层或第七层。第四层负载均衡(NAT负载均衡)将一个Internet上合法注册的IP地址映射为多个内部服务器的IP地址,对每次 TCP连接请求动态使用其中一个内部IP地址,达到负载均衡的目的。第七层负载均衡控制应用层服务的内容,提供了一种对访问流量的高层控制方式,适合对HTTP服务器群的应用。
二、LVS负载均衡优点
(一)LVS负载均衡优点
LVS负载均衡的实现基础是 IP交换,将 IP层的 TCP/IP请求均匀的转移到服务器池中不同的服务器上。而在 Linux平台下 IP的交换具备了一定的可扩展性,可以实现高性能、高可扩展性、易管理性等诸多特点,成为一个以负载均衡为核心的真正意义的集群系统。其优点主要表现在:
1、抗负载能力强,因为LVS工作方式的逻辑是非常之简单,而且工作在网络第四层仅做请求分发之用,没有流量,所以在效率上基本不需要太过考虑。可支持几百万个并发连接。配置 100M网卡 ,采用 VS/TUN调度技术 ,集群系统的吞吐量可高达 1Gbit/s;如配置千兆网卡 ,则系统的最大吞吐量可接近10Gbit/s。
2、工作稳定,因为其本身抗负载能力很强,所以稳定性高也是顺理成章,另外各种LVS都有完整的双机热备方案,所以一点不用担心均衡器本身会出什么问题,节点出现故障的话,LVS会自动判别,所以系统整体是非常稳定的。
3、均衡器本身不产生流量,LVS仅仅分发请求,而流量并不从它本身出去,即使网卡或Linux内核的承载能力已到上限,内存和CPU方面基本无消耗,所以可以利用它这点来做一些线路分流之用。没有流量同时也保住了均衡器的I/O性能不会受到大流量的影响。
4、基本上能支持所有应用,因为LVS工作在4层,所以它可以对几乎所有应用做负载均衡,包括Http、数据库、聊天室等等。
5、成本低廉,LVS为开源软件,可以免费使用,可以很方便的从网络上查找到相关的技术文档。
6、很高的性价比,组成集群系统的服务结点可以是普通的PC机、工作站和普通服务器,提供超过单台计算机所不能比拟的高处理能力。LVS服务器集群系统具有良好的伸缩性,可以方便地向集群中加入或删除服务器结点,采用动态负载均衡算法可以有效提高集群的性能 ,尤其是在集群内部节点服务器性能不一的情况下 ,效果尤其明显。
7、良好的可管理性,管理人员通过简单的操作就可以对集群中的服务结点或控制结点进行管理,同时,因为没有太多可配置的选项,所以除了增减服务器,并不需要经常去触碰它,大大减少了人为出错的几率。。
三、使用LVS实现负载均衡的方法
(一)负载均衡实施要素
负载均衡方案应是在网站建设初期就应考虑的问题,不过有时随着访问流量的爆炸性增长,超出决策者的意料,这也就成为不得不面对的问题。当我们在引入某种负载均衡方案乃至具体实施时,像其他的许多方案一样,首先是确定当前及将来的应用需求,然后在代价与收效之间做出权衡。负载均衡策略的优劣及其实现的难易程度有两个关键因素:一是负载均衡算法,二是对网络系统状况的检测方式和能力。
考虑到服务请求的不同类型、服务器的不同处理能力以及随机选择造成的负载分配不均匀等问题,为了更加合理的把负载分配给内部的多个服务器,就需要应用相应的能够正确反映各个服务器处理能力及网络状态的负载均衡算法,而良好的负载均衡策略应有对网络故障、服务器系统故障、应用服务故障的检测方式和能力。
(二)LVS服务器集群的系统结构
LVS服务器集群采用IP负载均衡技术和基于内容请求分发技术。调度器具有很好的吞吐率,将请求均
衡地转移到不同的服务器上执行,且调度器自动屏蔽掉服务器的故障,从而将一组服务器构成一个高性能的、高可用的虚拟服务器。整个服务器集群的结构对客户是透明的,而且无需修改客户端和服务器端的程序。一般来说,LVS服务器集群采用三层结构,其体系结构主要组成部分为:
1、负载调度器(Load Balancer):它是整个集群对外面的前端机,负责将客户的请求发送到一组服务器上执行,而客户认为服务是来自一个IP地址(我们可称之为虚拟IP地址)上的。负载调度器可以运行在以下三种模式下:
(1)Virtual Server via NAT(VS-NAT):用地址翻译实现虚拟服务器。地址转换器有能被外界访问到的合法IP地址,它修改来自专有网络的流出包的地址。外界看起来包是来自 地址转换器本身,当外界包送到转换器时,它能判断出应该将包送到内部网的哪个节点。优点是节省IP 地址,能对内部进行伪装;缺点是效率低,因为返回给请求方的流量经过转换器。
(2)Virtual Server via IP Tunneling (VS-TUN):用IP隧道技术实现虚拟服务器。这种方式是在集群的节点不在同一个网段时可用的转发机制,是将IP包封装在其他网络流量中的方法。为了 安全的考虑,应该使用隧道技术中的VPN,也可使用租用专线。 集群所能提供的服务是基于TCP/IP的Web服务、Mail服务、News服务、DNS服务、Proxy服务器等。
(3)Virtual Server via Direct Routing(VS-DR):用直接路由技术实现虚拟服务器。当参与集群的计算机和作为控制管理的计算机在同一个网段时可以用此法,控制管理的计算机接 收到请求包时直接送到参与集群的节点。优点是返回给客户的流量不经过控制主机,速度快开销少。
2、服务器池(Server Pool):是一组真正执行客户请求的服务器,服务有WEB、MAIL、FTP和DNS等。
3、共享存储(Shared Storage):它为服务器池提供一个共享的存储区,这样很容易使得服务器池拥有相同的内容,提供相同的服务。
(三)LVS负载均衡的实现
在LVS中提供了八种不同的调度算法以供按照实际需求选择:
1、轮叫RR(Round Robin):将外部请求按顺序轮流分配到集群中的真实服务器上,它均等地对待每一台服务器,而不管服务器上实际的连接数和系统负载。
2、加权轮叫WRR(Weighted Round Robin):根据真实服务器的不同处理能力来调度访问请求。这样可以保证处理能力强的服务器处理更多的访问流量。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。
3、最少链接LC(Least Connections):动态地将网络请求调度到已建立的链接数最少的服务器上。如果集群系统的真实服务器具有相近的系统性能,采用“最小连接”调度算法可以较好地均衡负载。
4、加权最少链接WLC(Weighted Least Connections):在集群系统中的服务器性能差异较大的情况下,调度器采用“加权最少链接”调度算法优化负载均衡性能,具有较高权值的服务器将承受较大比例的活动连接负载。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。
5、基于局部性的最少链接LBLC(Locality-Based Least Connections):是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。该算法根据请求的目标IP地址找出该目标IP地址最近使用的服务器,若该服务器是可用的且没有超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于一半的工作负载,则用""最少链接""的原则选出一个可用的服务器,将请求发送到该服务器。
6、带复制的基于局部性最少链接LBLCR(Locality-Based Least Connections with Replication):也是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。该算法根据请求的目标IP地址找出该目标IP地址对应的服务器组,按“最小连接”原则从服务器组中选出一台服务器,若服务器没有超载,将请求发送到该服务器,若服务器超载;则按“最小连接”原则从这个集群中选出一台服务器,将该服务器加入到服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有被修改,将最忙的服务器从服务器组中删除,以降低复制的程度。
7、目标地址散列DH(Destination Hashing):根据请求的目标IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。
8、源地址散列SH(Source Hashing):根据请求的源IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。
在LVS中,用户的管理界面是ipvsadm,管理者通过ipvsadm来实现对服务器集群的负载均衡,ipvsadm的主要参数及含义如下:
-a 增加一个虚拟服务器,该服务器由协议、IP地址和端口号组成,例如:-a-t 10.1.1.100:80表示增加一个虚拟服务器,服务器的IP是10.1.1.100, -t表示tcp协议(-u表示udp),端口号为80。
-r 指定真实服务器的的IP地址
-s 指定负载均衡调度采用的算法(rr表示轮叫,wrr表示加权轮叫,lc表示最少链接,wlc表示?加权最少链接,lblc表示基于局部性的最少链接,lblcr表示?带复制的基于局部性最少链接,dh表示目标地址散列,sh 表示?源地址散列)
-w 表示权重,节点的权重越高,在集群中使用的频率就越高。比如说权重为3的节点在每接收三个访问请求之后,权重为2的节点才接收两个访问请求。
负载调度器使用的模式设置:-g表示 DR方式,-m表示NAT方式,-i表示TUN方式
例如,/sbin/ipvsadm -a -t 10.1.1.110:80 -r 202.101.89.128 -g -w 2表示增加一个虚拟IP为10.1.1.110的服务器,采用tcp协议,端口号为80,对应的实际IP是202.101.89.128,负载均衡工作的模式为DR,服务器的权重为2。
总之,LVS本身是基于IP层的负载均衡,可以说是最高效的一种方式。其中VS- DR和VS-TUN两种工作模式可以由后端机器直接对外服务,负载均衡的性能很高,对资源占用很少,通过LVS服务器集群负载均衡技术,能够以很高的性价比解决网络访问量激增带来的服务器瓶颈问题。
参考文献:
LVS中文站点: http://zh.linuxvirtualserver.org/