缓存加速之squid代理服务器

1,165 阅读13分钟

缓存加速之squid代理服务器

一.缓存代理概述

1.1 什么是代理服务器?

代理服务器是一个位于客户端原始(资源)服务器之间的服务器,为了从原始服务器取得内容,客户端向代理服务器发送一个请求并指定目标原始服务器,然后代理服务器向原始服务器转交请求并将获得的内容返回给客户端。

缓存服务器是代理服务器的一种子类型,对于Web至关重要,尤其对于大型高负载Web站点。缓存可作为性能优化的一个重要手段,可以极大减轻后端服务器的负载。通常对于静态资源,即较少经常更新的资源,如图片,css或js等进行缓存,从而在每次刷新浏览器的时候,不用重新请求,而是从缓存里面读取,这样就可以减轻服务器的压力

1.2 代理服务器的工作机制

  • 代替客户机向网站请求数据,从而可以隐藏用户的真实IP地址。
  • 将获得的网页数据(静态 Web 元素)保存到缓存中并发送给客户机,以便下次请求相同的数据时快速响应

1.3 Squid 代理的类型:

  • 传统代理:适用于Internet 正向代理,需在客户机指定代理服务器的地址和端口。
  • 透明代理:客户机不需指定代理服务器的地址和端口,而是通过默认路由、防火墙策略将Web访问重定向给代理服务器处理。
  • 反向代理:如果 Squid 反向代理服务器中缓存了该请求的资源,则将该请求的资源直接返回给客户端;否则反向代理服务器将向后台的 WEB 服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存在本地,供下一个请求者使用。

1.4 Squid、Varinsh和Nginx有什么区别,工作中你怎么选择?

Squid、Varinsh和Nginx都是代理服务器,

什么是代理服务器:能当替用户去访问公网,并且能把访问到的数据缓存到服务器本地,等用户下次再访问相同的资源的时候,代理服务器直接从本地回应给用户,当本地没有的时候,我代替你去访问公网,我接收你的请求,我先在我自己的本地缓存找,如果我本地缓存有,我直接从我本地的缓存里回复你如果我在我本地没有找到你要访问的缓存的数据,那么代理服务器就会代替你去访问公网。

区别

  1. Nginx本来是反向代理/web服务器,用了插件可以做做这个副业但是本身不支持特性挺多,只能缓存静态文件
  2. 从这些功能上。varnish和squid是专业的cache服务,而nginx这些是第三方模块完成;
  3. varnish本身的技术上优势要高于squid,它采用了可视化页面缓存技术;在内存的利用上,Varnish比Squid具有优势,性能要比Squid高。还有强大的通过Varnish管理端口,可以使用正则表达式快速、批量地清除部分缓存它是内存缓存,速度一流,但是内存缓存也限制了其容量,缓存页面和图片一般是挺好的;
  4. squid的优势在于完整的庞大的cache技术资料,和很多的应用生产环境; 既能支持正向代理,也能支持方向代理,缓存数据也能支持持久化。

工作中选择: 要做cache服务的话,我们肯定是要选择专业的cache服务,优先选择squid或者varnish

二. Squid 服务的安装

2.1 Squid服务的安装

2.1.1 关闭系统防火墙与selinux
 systemctl stop firewalld
 systemctl disable firewalld
 setenforce 0

image-20220606233901974

2.1.2 编译安装Squid

主机ip:192.168.10.10

 1.编译安装 Squid
 yum -y install gcc gcc-c++ make
 ​
 tar zxvf squid-3.5.28.tar.gz -C /opt/
 ​
 cd /opt/squid-3.5.28
 ​
 ./configure --prefix=/usr/local/squid \             #指定安装目录路径
 --sysconfdir=/etc \                                 #指定配置文件路径
 --enable-arp-acl \                                  #MAC地址管控,防止客户端使用IP欺骗
 --enable-linux-netfilter \                          #使用内核过滤
 --enable-linux-tproxy \                             #支持透明模式
 --enable-async-io=100 \                             #异步IO,提升存储性能
 --enable-err-language="Simplify_Chinese" \          #错误信息的显示语言
 --enable-underscore \                               #允许URL中有下划线
 --disable-poll \                                    #关闭默认使用 poll 模式
 --enable-epoll \                                    #开启epoll模式提升性能
 --enable-gnuregex                                   #使用GNU正则表达式
 ----------------------------------------------------------------------------------------------------------
 ​
 ./configure --prefix=/usr/local/squid \
 --sysconfdir=/etc \
 --enable-arp-acl \
 --enable-linux-netfilter \
 --enable-linux-tproxy \
 --enable-async-io=100 \
 --enable-err-language="Simplify_Chinese" \
 --enable-underscore \
 --disable-poll \
 --enable-epoll \
 --enable-gnuregex
 ​
 make && make install
 ​
 ln -s /usr/local/squid/sbin/* /usr/local/sbin/
 #将squid命令加入系统变量,下次就不用指定绝对路径了
 ​
 useradd -M -s /sbin/nologin squid
 #建立squid用户
 ​
 chown -R squid:squid /usr/local/squid/var/      #此目录用于存放缓存文件
2.1.2 修改 Squid 的配置文件
 vim /etc/squid.conf
 ......
 --56行--插入
 http_access allow all               #放在 http_access deny all 之前,允许任意客户机使用代理服务,控制规则自上而下匹配
 http_access deny all
 http_port 3128                      #用来指定代理服务监听的地址和端口(默认的端口号为 3128)
 --61行--插入
 cache_effective_user squid          #添加,指定程序用户,用来设置初始化、运行时缓存的账号,否则启动不成功
 cache_effective_group squid         #添加,指定账号基本组
 coredump_dir /usr/local/squid/var/cache/squid       #指定缓存文件目录

image-20220607010229708

2.1.3 Squid 的运行控制
 #检查配置文件语法是否正确
 squid -k parse
 ​
 #启动 Squid,第一次启动 Squid 服务时,会自动初始化缓存目录
 squid -z                    #-z 选项用来初始化缓存目录
 squid                       #启动 squid 服务
 ​
 netstat -anpt | grep "squid"

image-20220607011211064

image-20220607011138007

image-20220607011319649

2.1.4 创建 Squid 服务脚本

 vim /etc/init.d/squid
 #直接复制一下脚本
 #!/bin/bash
 #chkconfig: 2345 90 25
 PID="/usr/local/squid/var/run/squid.pid"
 CONF="/etc/squid.conf"
 CMD="/usr/local/squid/sbin/squid"
 ​
 case "$1" in
    start)
      netstat -natp | grep squid &> /dev/null
      if [ $? -eq 0 ]
      then
        echo "squid is running"
      else
        echo "正在启动 squid..."
        $CMD
      fi
    ;;
    stop)
      $CMD -k kill &> /dev/null
      rm -rf $PID &> /dev/null
    ;;
    status)
      [ -f $PID ] &> /dev/null
         if [ $? -eq 0 ]
           then
             netstat -natp | grep squid
           else
             echo "squid is not running"
         fi
    ;;
    restart)
       $0 stop &> /dev/null
       echo "正在关闭 squid..."
       $0 start &> /dev/null
       echo "正在启动 squid..."
    ;;
    reload)
       $CMD -k reconfigure
    ;;
    check)
       $CMD -k parse
    ;;
    *)
       echo "用法:$0{start|stop|status|reload|check|restart}"
    ;;
 esac
 ​
 #2345是默认自启动级别,如是-代表任何级别都不自启动;90是启动优先级,25是停止优先级,优先级范围是0-100,数字越大,优先级越低。
 ​
 chmod +x /etc/init.d/squid
 chkconfig --add squid
 chkconfig --level 35 squid on
  • 编写脚本,并给予权限、执行

image-20220607011655827

  • 查看是都成功添加到chkconfig

image-20220607012027235

加入chkconfig系统服务之后就可以通过service命令或者systemctl命令进行squid进程的管理与控制,start|stop|status|reload|check|restart

三.Squid之传统代理实例

传统代理:适用于Internet 正向代理,需在客户机指定代理服务器的地址和端口。

主机IP地址
Squid代理服务器192.168.10.10
Web网站服务(源主机)192.168.10.20
客户机192.168.10.101

3.1 修改Squid配置文件

 vim /etc/squid.conf
 ......
 http_access allow all
 http_access deny all
 http_port 3128
 cache_effective_user squid
 cache_effective_group squid
 --63行--插入
 cache_mem 64 MB             #指定缓存功能所使用的内存空间大小,便于保持访问较频繁的WEB对象,容量最好为4的倍数,单位为MB,建议设为物理内存的1/4
 reply_body_max_size 10 MB           #允许用户下载的最大文件大小,以字节为单位,当下载超过指定大小的Web对象时,浏览器的报错页面中会出现“请求或访问太大”的提示默认设置0表示不进行限制
 maximum_object_size 4096 KB         #允许保存到缓存空间的最大对象大小,以KB为单位,超过大小限制的文件将不被缓存,而是直接转发给用户
 ​
 service squid restart
 或
 systemctl resta
  • 查看服务器内存容量,以便设置squid配置文件的内存容量,推荐设置为内存总容量的1/4

image-20220607014833490

  • 添加配置

  • 检查配置文件是否有格式错误,没有错误,进入下一步

image-20220607020144578

  • 重启服务并查看是否重启成功

3.2 生产环境中还需要修改防火墙规则

 iptables -F
 iptables -I INPUT -p tcp --dport 3128 -j ACCEPT
 #添加防火墙策略,添加input入站策略,tcp协议,端口3128,允许通过
 ​
 iptables -nL
 #查看是否添加成功
  • 添加策略

image-20220607020818721

  • 查看是否添加成功

image-20220607021031993

3.3 准备web服务器

 #关闭防火墙和selinux
 systemctl stop firewalld
 setenforce 0
 ​
 #安装http服务
 yum install -y httpd
  • 关闭防火墙、selinux并安装httpd服务

image-20220607021851326

3.4 win客户端尝试不通过squid服务器直接访问web服务器

 #以下为ie浏览器设置
 打开浏览器,工具-->Internet选项-->连接-->局域网设置-->开启代理服务器(地址:Squid服务器IP地址,端口:3128
  • 查看与squid服务器的连通性

image-20220607022741335

  • 访问web主机

image-20220607023002427

  • 查看web主机日志

image-20220607023109960

3.5 设置win10服务端并通过squid代理服务访问web服务器

 #以下为ie浏览器设置
 打开浏览器,工具-->Internet选项-->连接-->局域网设置-->开启代理服务器(地址:Squid服务器IP地址,端口:3128
  • 使用代理服务器访问web主机

    image-20220607023247405

  • 设置客户端ie浏览器

image-20220607023705295

3.6 查看 Web 访问日志的新增记录

 tail -f /var/log/httpd/access_log
 在浏览器输入Web服务器IP地址访问,查看Web服务器访问日志,显示的是由代理服务器替客户机在访问。

image-20220607024155412

3.7 查看 Squid 访问日志的新增记录中的缓存命中情况

 tail -f /usr/local/squid/var/logs/access.log
         TCP_MEM_HIT/200
  • 需要先清楚删除ie的浏览记录,进行第二次访问,看squid缓存服务器是否起到作用

image-20220607024731981

  • 进行第二次访问

image-20220607024844556

  • 查看squid访问日志是否有TCP_MEM_HIT/200,说明缓存利用成功

image-20220607025153566

四.Squid之透明代理实例

透明代理:要求代理服务器得是网关服务器,至少双网卡,开启路由转发功能,防火墙iptables/firewalld设置重定向规则

image-20220609010753836

实验主机分配

在搭建的传统代理基础上做如下修改: (1)squid服务器添加一块网卡:12.0.0.1(仅主机模式);开启路由转发功能 (2)web服务器网段修改为12.0.0.12(仅主机模式) (3)客户端IP地址不变,且浏览器关闭手动代理设置

  • Squid代理服务器:内网ens33:192.168.10.10,外网ens3612.0.0.1
  • Web网站服务(源主机):12.0.0.12
  • 客户机:192.168.100.101

4.1 网卡配置

4.1.1 web服务器网卡配置

image-20220607153525935

4.1.2 squid代理服务器网卡配置

ens-33网卡设置

image-20220607153752383

ens-36网卡设置

image-20220607154159684

设置完网络systemctl restart network

4.1.3 客户端网卡设置

image-20220608150314078

4.2 Squid服务器配置

4..2.1 Squid配置文件设置
 vim /etc/squid.conf
 ......
 http_access allow all
 http_access deny all
 --60行--修改添加提供内网服务的IP地址,和支持透明代理选项 transparent
 http_port 192.168.10.10:3128 transparent     #在传统代理基础上添加此行即可
 ​
 systemctl restart squid
  • 修改添加提供内网服务的IP地址,和支持透明代理选项 transparent

image-20220607155959627

  • 重启并查看服务状态

image-20220607160252652

4.2.2 开启路由转发,实现本机中不同网段的地址转发
 echo 'net.ipv4.ip_forward = 1' >> /etc/sysctl.conf 
 ​
 sysctl -p  #刷新配置

image-20220607160556336

4.2.3 修改防火墙规则
 iptables -F
 iptables -t nat -F
 iptables -t nat -I PREROUTING -i ens33 -s 192.168.10.0/24 -p tcp --dport 80 -j REDIRECT --to 3128   #用于转发http协议
 iptables -t nat -I PREROUTING -i ens33 -s 192.168.10.0/24 -p tcp --dport 443 -j REDIRECT --to 3128  #用于转发https协议
 iptables -I INPUT -p tcp --dport 3128 -j ACCEPT

4.3 关闭客户端ie浏览器代理服务器并初次访问

 关闭客户机的浏览器之前设置的代理服务器的功能后访问 http://12.0.0.12

image-20220607162144902

  • 初次访问是不会清楚缓存的,需要清楚客户端ie浏览器纪录并再次访问

image-20220607162954547

4.3 查看 Squid 访问日志的新增记录

 tail -f /usr/local/squid/var/logs/access.log
 ​
 #示例,如果出现TCP_MEM_HIT/200说明已经击中缓存
 ​
  • 清楚浏览器缓存,并再次访问
  • 已经击中了缓存

image-20220608154547266

4.4 查看 Web 访问日志的新增记录,显示的是由代理服务器的外网口代替客户机在访问

 tail -f /var/log/httpd/access_log

image-20220608155808392

成功!!!

五.ACL访问控制

在配置文件 squid.conf 中,ACL 访问控制通过以下两个步骤来实现:

  • (1)使用 acl 配置项定义需要控制的条件;
  • (2)通过 http_access 配置项对已定义的列表做“允许”或“拒绝”访问的控制。

5.1 格式

 acl 列表名称 列表类型 列表内容 …

5.2 ACL示例范本

 vim /etc/squid.conf
 ​
 ......
 acl localhost src 192.168.80.10/32                  #源地址为 192.168.80.10
 acl MYLAN src 192.168.80.0/24 192.168.1.0/24        #客户机网段
 acl destinationhost dst 192.168.80.13/32            #目标地址为 192.168.80.13
 acl MC20 maxconn 20                               #最大并发连接 20
 acl PORT port 21                                    #目标端口 21
 acl DMBLOCK dstdomain .qq.com                       #目标域,匹配域内所有站点
 acl BURL url_regex -i ^rtsp:// ^emule://            #以 rtsp://、emule:// 开头的目标 URL地址,-i表示忽略大小写
 acl PURL urlpath_regex -i .mp3$ .mp4$ .rmvb$     #以 .mp3、.mp4、.rmvb 结尾的目标 URL 路径
 acl WORKTIME time MTWHF 08:30-17:30                 #时间为周一至周五 8:30~17:30,“MTWHF”为每个星期的英文首字母

5.3 对客户机ip进行访问限制

客户机ip:192.168.100.101

web服务端ip:12.0.0.12

  • 在脚本中添加ACL设置

image-20220609014236642

  • 注意,如果是拒绝列表,需要放在http_access allow all前面

image-20220609015416061

  • 重启squid服务并验证设置是否成功

image-20220609015955547

image-20220609020207203

5.4 调用指定文件中的列表内容进行控制

在需要控制的条件较多时,ACL可以使用文件列表导入的方法进行控制,本次需要禁止ip为192.168.10.30主机通过squid代理服务器访问web服务器

 vim /usr/local/squid/myhost.txt
 192.168.10.30
 ​
 vim etc/squid.conf
 ​
 192.168.10.30主机尝试访问网页12.0.0.1

image-20220610200444506

image-20220610201415001

使用ip为192.168.10.30的主机进行访问

六.squid日志分析

安装日志分析主机

squid缓存代理服务器:192.168.10.10

6.1 安装图形处理软件

 #安装图像处理软件包
 yum install -y pcre-devel gd gd-devel
 ​
 mkdir /usr/local/sarg
 tar zxvf sarg-2.3.7.tar.gz -C /opt/
 ​
 cd /opt/sarg-2.3.7
 ./configure --prefix=/usr/local/sarg \
 --sysconfdir=/etc/sarg \                            #配置文件目录,默认是/usr/local/etc
 --enable-extraprotection                            #额外安全防护
 ​
 ----------------------------------------------------------------------------------------------------------
 ./configure --prefix=/usr/local/sarg --sysconfdir=/etc/sarg --enable-extraprotection
 ​
 make && make install

安装依赖关系,需要联网安装,本地yum无法安装

image-20220613184141866

下面的截图省略,按照说明安装即可

6.2 修改配置文件

 vim /etc/sarg/sarg.conf
 --7行--取消注释
 access_log /usr/local/squid/var/logs/access.log     #指定访问日志文件
 --25行--取消注释
 title "Squid User Access Reports"                   #网页标题
 --120行--取消注释,修改
 output_dir /var/www/html/sarg                       #报告输出目录
 --178行--取消注释
 user_ip no                                          #使用用户名显示
 --184行--取消注释,修改
 topuser_sort_field connect reverse                  #top排序中,指定连接次数采用降序排列,升序是normal
 --190行--取消注释,修改
 user_sort_field connect reverse                     #对于用户访问记录,连接次数按降序排序
 --206行--取消注释,修改
 exclude_hosts /usr/local/sarg/noreport              #指定不计入排序的站点列表的文件
 --257行--取消注释
 overwrite_report no                                 #同名同日期的日志是否覆盖
 --289行--取消注释,修改
 mail_utility mailq.postfix                          #发送邮件报告命令
 --434行--取消注释,修改
 charset UTF-8                                       #指定字符集UTF-8
 --518行--取消注释
 weekdays 0-6                                        #top排行的星期周期
 --525行--取消注释
 hours 0-23                                          #top排行的时间周期
 --633行--取消注释
 www_document_root /var/www/html                     #指定网页根目录
 ​

image-20220613215143567

下面的截图省略,按照说明取消注释并修改相关内容即可

6.3 添加不计入站点文件,添加的域名将不被显示在排序中

 touch /usr/local/sarg/noreport
 ​
 ln -s /usr/local/sarg/bin/sarg /usr/local/bin/
 sarg --help

image-20220613220250292

6.4 验证

 yum install httpd -y
 systemctl start httpd
 ​
 #运行
 sarg                #启动一次记录
 ​
 ​
 浏览器访问 http://192.168.80.10/sarg ,查看sarg报告网页。

image-20220613220805163

image-20220613221410523

image-20220613221620818

image-20220613221831509

6.5 添加计划任务,执行每天生成报告

 vim /usr/local/sarg/report.sh
 #/bin/bash
 #Get current date
 TODAY=$(date +%d/%m/%Y)
 #Get one week ago today
 YESTERDAY=$(date -d "1 day ago" +%d/%m/%Y)
 /usr/local/sarg/bin/sarg -l /usr/local/squid/var/logs/access.log -o /var/www/html/sarg -z -d $YESTERDAY-$TODAY &> /dev/null
 find ./ -type d -a -name "$(env LANG=en_US.UTF-8 date -d "30 day ago" +%Y%b%d)-$(env LANG=en_US.UTF-8 date -d "29 day ago" +%Y%b%d)" | xargs rm -rf
 exit 0
 ​
 ​
 chmod +x /usr/local/sarg/report.sh
 ​
 crontab -e
 0 0 * * * /usr/local/sarg/report.sh

image-20220613222837799

image-20220613223558297

七.squid反向代理

如果 Squid 反向代理服务器中缓存了该请求的资源,则将该请求的资源直接返回给客户端;否则反向代理服务器将向后台的 Web 服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存在本地,供下一个请求者使用。

image-20220613224614994

工作机制:

●缓存网页对象,减少重复请求

●将互联网请求轮训或按权重分配到内网Web服务器

●代理用户请求,避免用户直接访问Web服务器,提高安全

7.1 实验准备

squid主机配置双网卡:ens33:192.168.10.10 ens36:12.0.0.1

内网web主机1:192.168.10.12 提前安装好httpd服务

内网web主机2:192.168.10.100 提前安装好httpd服务

外网客户机器:12.0.0.101 网关指向:12.0.0.1

7.2 修改squid配置文件

 vim /etc/squid.conf
 ......
 --60行--修改,插入
 http_port 192.168.80.10:80 accel vhost vport
 cache_peer 192.168.80.11 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web1
 cache_peer 192.168.80.12 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web2
 cache_peer_domain web1 web2 www.kgc.com
 #表示对www.kgc.com的请求,squid向192.168.80.11和192.168.80.12的80端口发出请求
 ​
 ----------------------------------------------名词解释-------------------------------------------------------
 http_port 80 accel vhost vport #squid从一个缓存变成了一个Web服务器反向代理加速模式,这个时候squid在80端口监听请求,同时和web server的请求端口(vhost vport)绑定,这个时候请求到了squid,squid是不用转发请求的,而是直接要么从缓存中拿数据要么向绑定的端口直接请求数据。
 accel :反向代理加速模式
 vhost :支持域名或主机名来表示代理节点
 vport :支持IP和端口来表示代理节点
 ​
 parent :代表为父节点,上下关系,非平级关系
 80 :代理内部web服务器的80端口
 0 :没有使用icp(电信运营商),表示就一台squid服务器
 no-query :不做查询操作,直接获取数据
 originserver :指定是源服务器
 round-robin :指定 squid 通过轮询方式将请求分发到其中一台父节点
 max_conn :指定最大连接数
 weight : 指定权重
 name :设置别名
 ----------------------------------------------------------------------------------------------------------

image-20220613233538474

7.3 清空之前透明模式配置的 iptables 规则

squid主机:192.168.10.10

 iptables -F
 iptables -t nat -F
 ​
 systemctl stop httpd       #防止 httpd 服务使用的 80 端口号和 squid 反向代理配置的监听端口冲突
 systemctl restart squid

image-20220613234015889

7.4 后端节点服务器设置

 yum install -y httpd
 systemctl start httpd
 ​
 #节点1:
 echo "this is test01" >> /var/www/html/index.html
 #节点2:
 echo "this is test02" >> /var/www/html/index.html

image-20220613234305488

image-20220613234325716

7.5 客户机win7的域名映射配置

 修改 C:\Windows\System32\drivers\etc\hosts 文件
 192.168.80.10 www.kgc.com
 ​
 浏览器不开启代理访问 http://www.kgc.com

image-20220613234700062

使用www.kgc.com可以轮询访问两台web主机

image-20220613234800914

image-20220613234903534

7.6 查看缓存命中情况

 tail -f /usr/local/squid/var/logs/access.log

image-20220613235145215

\