技术解析
硬件升级
硬件是基础,如果流量级别真的到大流量级别了,那么硬件基础肯定不能差。
负载均衡
根据某种负载策略把请求分发到集群中的每一台服务器上,让整个服务器群来处理网站的请求。
硬件方面可以考虑专门负责负载均衡的硬件F5;对于大部分公司,会选择廉价有效的方法扩展整个系统的架构,来增加服务器的吞吐量和处理能力,以及承载能力。
服务器集群
用N台服务器构成一个松耦合的多处理器系统(对外来说,他们就是一个服务器),它们之间通过网络实现通信。让N台服务器之间相互协作,共同承载一个网站的请求压力。
在客户端看来就像是只有一个服务器。集群可以利用多个计算机进行并行计算从而获得很高的计算速度,也可以用多个计算机做备份,从而使得任何一个机器坏了整个系统还是能正常运行。
要考虑的问题是身份验证的问题。通过session复制、session共享、读取cookies等策略使得身份得以验证,也可以直接通过获取用户关键属性判断(不过对数据库压力大,容易成为瓶颈)
数据库优化
使用索引可快速访问数据库表中的特定信息。
当一张的数据达到几百万时,你查询一次所花的时间会变多,如果有联合查询的话,很有可能会死在那儿了。分表的目的就在于此,减小数据库的负担,缩短查询时间。
基本的原理是让主数据库处理事务性增、改、删操作(INSERT、UPDATE、DELETE),而从数据库处理SELECT查询操作。
数据库读写分离
数据库分表技术(垂直分割,水平分割)
表建立相应的索引
页面静态化
前台实现完全的静态化最好,可以完全不用访问数据库。
缓存技术(MemCache、Redis)
将动态数据存储到缓存文件中,动态网页直接调用 这些文件,而不必再访问数据库
Redis稳定持久化,MemCache批量读取快,但备份差。
禁止外部盗链
外部网站的图片或者文件盗链往往会带来大量的负载压力,因此应该严格限制外部对于自身的图片或者文件盗链
控制大文件的下载
大文件的下载会占用很大的流量,并且对于非SCSI硬盘来说,大量文件下载会消耗 CPU,使得网站响应能力下降。因此,尽量不要提供超过2M的大文件下载,如果需要提供,建议将大文件放在另外一台服务器上。