联系我们Contact Us

大型网站技术架构：核心原理与案例分析

2021-07-07

3462次

大型网站架构演化

大型网站软件系统的特点

高并发，大流量
高可用
海量数据
用户分布广泛，网络情况复杂
安全环境恶劣
需求快速变更，发布频繁
渐进式发展

大型网站架构模式

网站架构模式

分层(横向)
在大型网站架构中采用分层结构，将网站软件系统分为应用层、服务层、数据层
分割(纵向)
网站常用的分布式方案

分布式应用和服务
分布式静态资源
分布式数据和存储
分布式计算

异步
冗余
服务器冗余运行，数据冗余备份。大型网站对整个数据中心进行备份，在全球范围内部署灾备数据中心。
自动化
安全

大型网站核心架构要素

性能
可用性
伸缩性
扩展性
安全性

瞬时响应：网站的高性能架构

网站性能测试
性能测试标准
性能测试方法

性能测试
负载测试
压力测试
稳定性测试

性能测试报告
性能优化策略

性能分析
检查请求处理的各个环节的日志，分析哪个环节响应时间不合理、超过预期；然后检查监控数据，分析影响性能的主要因素是内存、磁盘、网络还是CPU，是代码问题还是架构设计不合理，或者系统资源确实不足
性能优化

web前端性能优化

减少http请求
使用浏览器缓存
启用压缩
对于html、css、javascript文件启用GZip压缩，但压缩会对服务器和浏览器产生一定的压力，在通信带宽良好，而服务器资源不足的情况下要权衡考虑
一般情况下，css放在页面上面，js放在页面下面，但是如果页面解析时就需要用到js，这时放在底部就不合适了
减少cookie的传输

CDN(Content Distribute Network，内容分发网络)加速，CDN能够缓存的一般是静态资源，将访问频度高的文件缓存在CDN中可极大改善网页的打开速度
反向代理

保护网站安全
可以通过配置缓存功能加速web请求
可以实现负载均衡功能，改善网站的高并发情况下的性能

应用服务器性能优化

分布式缓存
网站性能的优化定律：优先考虑使用缓存优化性能

网站数据的访问通常遵循二八定律，即80%的访问落在20%的数据上
不恰当的使用缓存非但不能提高系统的性能吗，还会成为系统的累赘甚至风险，不恰当的使用缓存如下：

频繁修改的数据一般，数据的读写比在2:1以上，即写入一次缓存
没有热点的访问
数据不一致与脏读
缓存可用性
通过分布式缓存服务器，将缓存数据分布到集群多态服务器上可在一定程度上改善缓存的可用性
缓存中存放的热点数据
热点数据有事缓存系统利用近久未用算法(LRU)，对不断访问的数据筛选淘汰出来的，这个过程需要花费较长的时间。新启动的缓存系统在缓存系统启动时就把热点数据加载好，这个缓存预加载手段叫作缓存预热
缓存穿透
应对办法：将请求的不存在的数据也缓存起来
分布式缓存架构

JBoss Cache
Memcached

异步操作
使用集群负载均衡
代码优化

多线程
假设服务器上执行的都是相同的任务，针对该类任务启动的线程格式可以参考
启动线程数 = [任务执行时间 / (任务执行时间 -IO等待时间)] * CPU 内核数
启动线程数和CPU 内核数量成正比，和IO阻塞时间成反比。如果任务都是cpu计算型任务，那么线程多不能超过Cpu内核数
在编程上面解决线程安全的主要手段：

将对象状态设计为无状态对象
使用局部对象
并发访问资源时使用锁

资源复用
资源复用主要模式

单例模式
对象池 (线程池和连接池)

数据结构
垃圾回收了解垃圾回收机制，尽量避免Full GC

存储性能优化

建议使用固态硬盘
B+ 树是一种专门针对磁盘存储而优化的N叉排序树，以树节点为单位存储在磁盘中
LSM树
RAID(廉价磁盘冗余阵列) VS. HDFS

网站的高可用架构

网站可用性的度量与考核

网站的可用性度量

网站不可用时间(故障时间) = 故障修复时间点-故障发现时间点
网站年度可用性指标 = (1-网站不可用时间/年度总时间) *

网站可用性考核
故障分 = 故障时间(分钟) * 故障权重

高可用网站架构
高可用架构的主要手段是数据和服务的冗余备份及失效转移，一旦某些服务器宕机，就将服务切换到其他可用的服务器上，如果磁盘损坏，则从备份的磁盘读取数据
一个典型的网站设计通常分为三层，各层之间具有相对独立性

应用层主要负责具体业务逻辑处理
服务层可复用的服务
数据层数据的存储与访问

高可用的应用
应用的无状态性

通过负载均衡进行无状态服务的失效转移
应用服务器集群的session管理

session复制
session绑定
使用cookie记录session
session服务器

高可用的服务
可复用的服务和应用一样，是无状态的服务，可以使用类似负载均衡的失效转移策略实现高可用服务
可以的服务策略

分级管理
超时设置
异步调用
服务降级

拒绝服务
关闭功能

幂等性设计
在服务层保证服务重复调用和调用一次产生的结果相同

高可用的数据

CAP原理
高可用数据有如下几个层面的含义：

数据持久性
数据可访问性
数据一致性

CAP认为，一个提供数据服务的存储系统无法同时满足数据一致性、数据可用性、分区耐受性(系统具有跨网络分区的伸缩性)，在大型网站中，通常会选择强化分布式存储系统的可用性和伸缩性在某种程度上放弃一致性

数据一致性分为：

数据强一致
数据用户一致
数据终一致

数据备份

数据冷备
数据热备

异步热备方式
同步热备方式

失效转移

失效确认
系统确认一台服务器是否宕机的手段：

心跳检测
应用程序访问失败报告

访问转移
数据恢复

高可用网站的软件质量

网站发布
相当于给飞行中的飞机换个引擎，既不能让飞机有剧烈晃动(影响用户体验)，也不能让飞机降落(系统停机维护)，更不能让飞机坠毁(系统故障网站完全不可用)
版本控制

自动化发布
灰度发布：在部分服务器上发布新版本，其余服务器保持老版本(或发布另一个版本)，然后监控用户操作行为，手机用户体验报告，比较用户对两个版本的满意度，以确定终的发布版本

网站运行监控

监控数据采集

用户行为日志收集 storm工具
指用户在浏览器上所做的所有操作及其所在的操作环境，包括用户操作系统与浏览器版本信息，ip地址、页面访问路径、页面停留时间等。

服务器端日志收集
客户端浏览器日志收集

服务器性能监控
Ganglia
运行数据报告

监控管理

系统报警
失效转移
自动优雅降级

网站的伸缩性架构

通过不断地向集群中添加服务器来增强整个集群的处理能力

网站架构的伸缩性设计

不同功能进行物理分离实现伸缩

纵向分离将业务处理流程上的不同部分分离部署，实现系统伸缩性
横向分离将不同的业务模块分离部署，实现系统伸缩性

单一功能通过集群规模实现伸缩
相同服务部署在多台服务器上构成一个集群对外提供服务

应用服务器集群的伸缩性设计
负载均衡

http 重定向负载均衡
dns域名解析负载均衡
反向代理负载均衡反向代理服务器需要配置双网卡和内外部两套ip地址，反向代理服务器是所有请求和响应的中转站，其性能可能会成为瓶颈
ip负载均衡在内核进程中完成数据分发，交反向代理负载均衡有更好的性能。但是由于所有请求响应都需要经过负载均衡服务器，集群的响应数据吞吐量不得不受制于负载均衡服务器的网卡和带宽
数据链路层负载均衡 (三角传输模式) LVS
负载均衡算法

分布式缓存集群的伸缩性设计
必须让新上线的缓存服务器对整个分布式缓存集群影响小

memcached分布式缓存集群
对于服务器集群的管理，路由算法至关重要，和负载均衡算法一样，决定着究竟该访问集群中的哪台服务器
余数hash路由算法
在网站访问量少的时候，扩容缓存服务器集群，，这时候对数据库的负载小，通过模拟请求的方法逐渐预热缓存
分布式缓存的一致性hash算法一台物理服务器虚拟为 150 左右各虚拟服务器合适

数据存储服务器集群的伸缩性设计

关系数据库集群的伸缩性设计

数据库的数据复制功能
数据分库制约条件时跨库的表不能进行join操作
支持数据分片的分布式关系数据库产品： Amoeba 和 Cobar
应用于服务器和数据库之间
Cobar 以数据库为单位进行数据迁移的

NoSQL数据库的伸缩性设计
nosql 数据库产品放弃了关系数据库的两大重要基础：

以关系代数为基础的结构话查询语言
事务一致性保证

HBase (借助可伸缩的HDFS分布式文件系统) 数据以HRegion为单位进行管理
这个世界只有遇不到的问题，没有解决不了的问题，高手之所以成为高手，是因为他们遇到了常人很难遇到的问题，并解决了。

网站的可扩展架构

扩展性: 对现有系统影响小的情况下，系统功能可持续扩展或提升的能力。表现在系统基础设施不需要经常变更，应用之间较少依赖和耦合，对需求变更可以敏捷响应。是系统架构设计层面的开闭原则(对扩展开放，对修改关闭)

伸缩性: 指系统能够通过增加(减少)自身资源规模的方式增强(减少)自己计算处理事务的能力。如果这种增长是成比例的，就被称作线性伸缩性。

构建可扩展网站架构
将一个大系统切分成N个低耦合的子模块的能力，这些子模块包括横向的业务模块也包含纵向的基础模块
利用分布式消息队列降低系统耦合性

事件驱动架构 : 通过在低耦合的模块之间传输事件消息，以保持模块的松散耦合，并借助事件消息的通信完成模块间合作
常见的是：分布式消息队列
Apache ActiveMQ

利用分布式服务打造可复用的业务平台
分布式服务通过接口分解系统耦合性，不同子系统通过相同的接口描述进行服务调用
拆分，降低系统耦合性

web service 与企业级分布式服务
缺点：

臃肿的注册和发现机制
低效的xml序列化手段
开销相对较高的http远程通信
复杂的部署与维护手段

大型网站分布式服务的需求与特点：

web service
负载均衡
失效转移
高效的远程通信
整合异构系统
对应用少侵入是否使用分布式服务需要根据业务发现规划
版本管理
实时监控

分布式服务框架设计 Thrift 及 Dubbo
可扩展性的数据结构
利用开放平台建设网站生态圈

网站的安全架构

网站应用攻击与防御

ModSecurity 开源的web防火墙

信息加密技术及密钥安全管理

改善密钥安全性的手段

将密钥和算法放在一个独立的服务器上，甚至做成一个专用的硬件设施，对外提供加密和解密服务
将加密算法放在应用系统中，密钥则放在独立服务器中，实际存储时密钥被切分成数片，加密后分别保存在不同存储介质中

信息过滤与反垃圾

文本匹配

trie 算法
构造多级Hash表进行文本匹配(缺点：浪费部分内存空间)

分类算法

贝叶斯分类算法
TAN算法
ARCS算法

分类算法除了用于反垃圾，还可用于信息自动分类。

3. 黑名单

1. hash表

2. 布隆过滤器 (不适合用于判断)

4. 电子商务风险控制

1. 风控

1. 规则引擎

2. 统计模型

案例

wikipedia

wikipedia CDN缓存的几条准则:

内容不包括动态信息，以免页面内容缓存很快失效或包含过时信息
每个内容页面有的rest风格的url，一遍cdn快速查找并避免重复缓存
在html响应头写入缓存控制信息，通过应用控制内容是否缓存及缓存有效期

服务端性能优化

使用APC (php 缓存字节码缓存模块)
使用Imagemagick进行图片处理和转化
使用Tex进行文本格式化
替换php的字符串查找函数 strstr()，使用更优化的算法重构

后端性能优化
后端优化主要的手段是使用缓存，将热点数据缓存在分布式缓存系统的内存中

热点特别集中的数据直接缓存到应用服务器的本地内存中
缓存数据的内容尽量是应用服务器可以直接使用的格式，以减少应用服务器从缓存中获取数据后解析构造数据的代价
使用缓存服务器存储session对象
memcached的持久化连接非常廉价，如果有需要就创建一个

对于存储核心的mysql数据库的优化:

使用较大的服务器内存
使用RAID0磁盘阵列以加速磁盘访问（加速磁盘访问，降低了数据库的持久可靠性）
将数据库事务一致性设置在较低水平，加快宕机恢速度
如果Master 数据库宕机，立即将应用切换到Salve数据库，同时关闭数据写服务

网购秒杀系统架构
秒杀业务不能使用正常的业务流程，也不能和正常的网站交易业务共用服务器，必须设计部署专门的秒杀系统进行专门应对

秒杀系统的解决多用户抢购的问题策略：

秒杀系统独立部署
秒杀商品页面静态化
租借秒杀活动网络带宽
动态生成随机下单页面url

上一篇： 滴滴下架后，共享出行会再出现新的格局吗？

下一篇： kubernetes——容器网络

新闻中心