大型网站架构之性能篇

248 阅读6分钟

网站的高性能架构(性能)

不同视角下的网站性能有着不同的标准,也有不同的优化手段。
1.用户视角的网站性能优化
通过优化页面HTML样式、利用浏览器端的并发和异步特性(即用户不用等待结果)、调整浏览器缓存策略、使用CDN服务、反向代理等手段,从而
实现不优化应用程序和架构,也能使浏览器尽快展示用户感兴趣的内容。
2.开发人员视角的网站性能优化

  • 使用缓存加速数据读取
  • 使用集群提高吞吐量
  • 使用异步消息加快请求响应以及实现削峰
  • 使用代码优化改善程序性能。

3.运维人员视角的网站性能优化

  • 建设优化骨干网
  • 使用高性价比定制服务器
  • 利用虚拟化技术优化资源利用

性能测试的指标包括
响应时间:指应用执行一个操作需要的时间,包括从发出请求到收到最后响应数据所需要的时间。
并发数:指系统能够同时处理请求的数目,反应系统的负载能力 (正在运行的请求)。
吞吐量:指单位时间内系统处理的请求数量,体现系统整体处理能力(一天可以处理的总请求数)。
性能计数器:描述服务器或者操作系统性能的一些数据指标,在linux系统通过top命令进行查看。

性能测试的方法
性能测试:对系统不断施加压力,验证系统在资源可接受范围内,是否能达到性能预期。
负载测试:对系统继续施加压力,如果某种资源进入饱和状态,这个时候系统的处理能力会下降。
压力测试:超过安全负载的情况下,对系统继续施加压力,直到系统崩溃或者不能再处理任何请求,以此获得系统最大压力承受能力。
稳定性测试:被测试系统在特定硬件、软件、网络环境下,给系统加载一定业务压力,使系统运行一段较长时间,以此检测系统是否稳定。
在这里插入图片描述

在这里插入图片描述
性能测试的目的就是找到系统系统最佳运行点、系统最大负载点以及系统崩溃点,从而合理选择服务器部署方式。

Web前段性能优化

a.浏览器访问优化
1.减少http请求:通过合并CSS、合并JavaScript、合并图片从而减少请求次数。
2.使用浏览器缓存:通过设置HTTP头中Cache-Control和Expires的属性,设定浏览器缓存生命周期。在更新静态资源的缓存时,应采用逐量更新的方法。
3.启动压缩:在服务器端对文件进行压缩,在浏览器对文件进行解压,可以有效减少通讯传输的数据量。
4.CSS放在页面最上面、JS放在页面最下面:因为浏览器在下载所有CSS之后才会对整个页面进行渲染,而浏览器在加载JS立即执行。
5.减少Cookie传输:Cookie因为存储在浏览器中会包含在每次请求和响应中,同时在对静态文件进行访问时,Cookie是没有实际意义的。

b.在网络服务商服务器中使用CDN加速

c.在网站服务器之前使用反向代理服务器,使用其缓存模块对请求进行缓存处理

应用服务器性能优化

a.使用缓存(网站性能优化第一定律:优先考虑使用缓存优化性能。)
缓存就是将数据放在离计算最近的位置。缓存的本质是内存hash表,网站应用中,数据缓存以键值对的形式存储在内存Hash表中。

缓存雪崩问题
缓存雪崩,是指在某一个时间段,缓存集中过期失效。
解决方法:根据业务特点,对不同的“记录”设置不同的失效周期。

缓存预热
新启动的缓存系统如果没有任何数据,在重建缓存数据的过程中,系统的性能和数据库负载都不太好,那么最好在缓存系统启动时就把热点数据加载好,
如一些元数据—城市地名列表、类目信息等。

缓存穿透问题
缓存穿透,是指查询一个数据库一定不存在的数据。 假如有恶意攻击,就可以利用这个漏洞,对数据库造成压力,甚至压垮数据库。即便是采用UUID,也是很容易找到一个不存在的KEY,进行攻击。
解决方法: 如果从数据库查询的对象为空,也放入缓存,只是设定的缓存过期时间较短,比如设置为60秒

缓存击穿问题
缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库。
解决方案:对热点数据设置比较长的生命周期或者永不过期。

缓存的并发竞争问题
多客户端同时并发写一个key,可能本来应该先到的数据后到了,导致数据版本错了。
解决方法: CAS类的乐观锁(即redis事务机制)

分布式缓存框架
分布式缓存架构通常有两类

  • 以JBoss Cache为代表的需要更新同步的分布式缓存
  • 以Memcached为代表的不相互通信的分布式缓存(主流的方式)

b.异步操作(任何可以晚点做的事情都应该晚点再做)
通过异步处理,将短时间高并发产生的事务消息存储在消息队列中,从而肖平高峰期的并发事务。
消息队列的消费端既可以是应用程序也可以直接是数据库。

c.使用集群(众人拾柴火焰高)
借助负载均衡服务器,将并发请求分发到多台服务器上处理,避免单一服务器因负载压力过大而响应缓慢。

d.代码优化
代码优化通常从以下方面:

  • 多线城:因为IO和多CPU,通过多线程能够最大限度使用CPU资源。
  • 复用:采用单例或者对象池实现对数据库连接、网络通信连接、线程、复杂对象等资源的复用。
  • 数据结构:灵活组合各种数据结构改善数据读写和计算特性可极大优化程序的性能。
  • 垃圾回收:有助于程序优化和参数调优,以及编写内存安全的代码。

存储性能优化

a.存储介质:机械硬盘和固态硬盘
b.读写算法:B+树和LSM树
c.访问技术:Raid和HDFS

在这里插入图片描述