安装 <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

   可以从Squid站点[url]www.squid-cache.org[/url]获取该软件的源代码安装包,包括gzbz2两种压缩方式。也可以使用Linux的发行版,如Red

Hat提供的RPM包。

   RPM方式安装很简单,命令如下:

 $ rpm -ivh Squid-2.x.STALBx.i386.rpm

   不过笔者认为,即便是系统中已经默认安装了Squid,也应当先删掉然后安装最新的源代码包。因为开源软件会不断修正问题、提供更新的功能,使用最新版本可以保证最高的性能及安全,而且源代码方式可以完全定制系统。不过STABLE稳定版、DEVEL版通常是提供给开发人员测试程序的,假定下载了最新的稳定版squid-2.5.STABLE2.tar.gz,用以下命令解开压缩包:

 $ tar xvfz squid-2.5.STABLE.tar.gz

   用bz2方式压缩的包可能体积更小,相应的命令是:

 $ tar xvfj squid-2.5.STABLE.tar.bz2

  然后,进入相应目录对源代码进行配置和编译,命令如下:

$ cd squid-2.5.STABLE2

   配置命令configure有很多选项,如果不清楚可先用“-help”查看。通常情况下,用到的选项有以下几个:

--prefix=/web/squid # 指定Squid的安装位置,如果只指定这一选项,那么该目录下会有binsbinmanconf等目录,而主要的配置文件此时在conf子目录中。为便于管理,最好用参数--sysconfdir=/etc把这个文件位置配置为/etc
--enable-storeio=ufs,null #
使用的文件系统通常是默认的ufs,不过如果想要做一个不缓存任何文件的代理服务器,就需要加上null文件系统。
--enable-arp-acl #
这样可以在规则设置中直接通过客户端的MAC地址进行管理,防止客户使用IP欺骗。
--enable-err-languages="Simplify_Chinese" --enable-default-err-languages="Simplify_Chinese" #
上面两个选项告诉Squid编入并使用简体中文错误信息。
--enable-linux-netfilter #
允许使用Linux的透明代理功能。
--enable-underscore #
允许解析的URL中出现下划线,因为默认情况下Squid会认为带下划线的URL是非法的,并拒绝访问该地址。

   整个配置编译过程如下:

./configure --prefix=/var/squid --sysconfdir=/etc --enable-arp-acl --enable-linux-netfilter --enable-pthreads --enable-err-language="Simplify_Chinese" --enable-storeio=ufs,null --enable-default-err-language="Simplify_Chinese" --enable-auth="basic" --enable-baisc-auth-helpers="NCSA" --enable-underscore

   其中一些选项有特殊作用,将在下面介绍它们。

   最后执行makemake install两条命令,将源代码编译为可执行文件,并拷贝到指定位置。

   基本配置

  安装完成后,接下来要对Squid的运行进行配置(不是前面安装时的配置)。所有项目都在squid.conf中完成。Squid自带的squid.conf

包括非常详尽的说明,相当于一篇用户手册,对配置有任何疑问都可以参照解决。

   在这个例子中,代理服务器同时也是网关,内部网络接口eth0IP地址为192.168.0.1,外部网络接口eth1IP地址为202.103.x.x

下面是一个基本的代理所需要配置选项: http_port 192.168.0.1:3128

   默认端口是3128,当然也可以是任何其它端口,只要不与其它服务发生冲突即可。为了安全起见,在前面加上IP地址,Squid就不会监听外部的网络接口。

   下面的配置选项是服务器管理者的电子邮件,当错误发生时,该地址会显示在错误页面上,便于用户联系:

 cache_mgr [email]netsnake@963.net[/email]

    以下这些参数告诉Squid缓存的文件系统、位置和缓存策略:
 cache_dir ufs /var/squid cache_mem 32MB cache_swap_low 90 cache_swap_high 95

   在这里,Squid会将/var/squid目录作为保存缓存数据的目录,每次处理的缓存大小是32兆字节,当缓存空间使用达到95%时,新的内容将取代旧的而不直接添加到目录中,直到空间又下降到90%才停止这一活动。如果不想Squid缓存任何文件,如某些存储空间有限的专有系统,可以使用null文件系统(这样不需要那些缓存策略): cache_dir null /tmp

   下面的几个关于缓存的策略配置中,较主要的是第一行,即用户的访问记录,可以通过分析它来了解所有用户访问的详尽地址:

cache_access_log /var/squid/access.log cache_log /var/squid/cache.log cache_store_log /var/squid/store.log

    下面这行配置是在较新版本中出现的参数,告诉Squid在错误页面中显示的服务器名称:
 visible_hostname No1.proxy

   以下配置告诉Squid如何处理用户,对每个请求的IP地址作为单独地址处理: client_mask 255.255.255.255

    如果是普通代理服务器,以上的配置已经足够。但是很多Squid都被用来做透明代理。所谓透明代理,就是客户端不知道有代理服务器的存在,当然也不需要进行任何与代理有关的设置,从而大大方便了系统管理员。相关的选项有以下几个:
 httpd_accel_host virtual httpd_accel_port 80 httpd_accel_with_proxy on httpd_accel_user_host_header on

  在Linux上,可以用iptables/ipchains直接将对Web端口80的请求直接转发到Squid端口3128,由Squid接手,而用户浏览器仍然认为它访问的是对方的80端口。例如以下这条命令:
 iptables -t nat -A PREROUTING -s 192.168.0.200/32 -p tcp --dport 80 -j REDIRECT 3128
 
  就是将192.168.0.200的所有针对80端口的访问重定向到3128端口。

   所有设置完成后,关键且重要的任务是访问控制。Squid支持的管理方式很多,使用起来也非常简单(这也是有人宁愿使用不做任何缓存的Squid,也不愿意单独使用iptables的原因)。Squid可以通过IP地址、主机名、MAC地址、用户/密码认证等识别用户,也可以通过域名、域后缀、文件类型、IP地址、端口、URL匹配等控制用户的访问,还可以使用时间区间对用户进行管理,所以访问控制是Squid配置中的重点。SquidACLAccess Control List,访问控制列表)对访问类型进行划分,用http_access deny allow进行控制。根据需求首先定义两组用户advancenormal,还有代表所有未指明的用户组all及不允许上网的baduser,配置代码如下:

 acl advance 192.168.0.2-192.168.0.10/32 acl normal src 192.168.0.11-192.168.0.200/32 acl baduser src 192.168.0.100/32 acl
baddst dst [url]www.somebadsite.com[/url] acl all src <?xml:namespace prefix = st1 ns = "urn:schemas-microsoft-com:office:smarttags" />0.0.0.0/0 http_access deny baduser http_access allow advance http_access allow normal

  可以看出,ACL的基本格式如下: acl 列表名称 控制方式 控制目标

   比如acl all src 0.0.0.0/0,其名称是all,控制方式是srcIP地址,控制目标是0.0.0.0/0IP地址,即所有未定义的用户。出于安全考虑,总是在最后禁止这个列表。

    下面这个列表代表高级用户,包括IP地址从192.168.0.2192.168.0.10的所有计算机:
 acl advance 192.168.0.2-192.168.0.20/32

   下面这个baduser列表只包含一台计算机,其IP地址是192.168.0.100 acl baduser 192.168.0.100/32

   ACL写完后,接下来要对它们分别进行管理,代码如下: http_access deny baduser http_access allow advance http_access allow normal

   上面几行代码告诉Squid不允许baduser组访问Internet,但advancenormal组允许(此时还没有指定详细的权限)。由于Squid是按照顺序读取规则,会首先禁止baduser,然后允许normal。如果将两条规则顺序颠倒,由于badusernormal范围中,Squid先允许了所有的normal,那么再禁止baduser就不会起作用。

   特别要注意的是,Squid将使用allow-deny-allow-deny……这样的顺序套用规则。例如,当一个用户访问代理服务器时,Squid会顺序测试Squid中定义的所有规则列表,当所有规则都不匹配时,Squid会使用与最后一条相反的规则。就像上面这个例子,假设有一个用户的IP地址是192.168.0.201,他试图通过这台代理服务器访问Internet,会发生什么情况呢?我们会发现,他能够正常访问,因为Squid找遍所有访问列表也没有和192.168.0.201有关的定义,便开始应用规则,而最后一条是deny,那么Squid默认的下一条处理规则是allow,所以192.168.0.201反而能够访问Internet了,这显然不是我们希望的。所以在所有squid.conf中,最后一条规则永远是http_access deny all,而all就是前面定义的“src 0.0.0.0”

 

 

 

 

  高级控制

  前面说过,Squid的控制功能非常强大,只要理解Squid的行为方式,基本上就能够满足所有的控制要求。下面就一步一步来了解Squid是如何进行控制管理的。

  通过IP地址来识别用户很不可靠,比IP地址更好的是网卡的MAC物理地址。要在Squid中使用MAC地址识别,必须在编译时加上“--enable-arp-acl”选项,然后可以通过以下的语句来识别用户:

 

acl advance arp 00:01:02:1f:2c:3e 00:01:02:3c:1a:8b ...


  它直接使用用户的MAC地址,而MAC地址一般是不易修改的,即使有普通用户将自己的IP地址改为高级用户也无法通过,所以这种方式比IP地址可靠得多。

  假如不想让用户访问某个网站应该怎么做呢?可以分为两种情况:一种是不允许访问某个站点的某个主机,比如sinapage的主机是sinapage4.sina.com.cn,而其它的新浪资源却是允许访问的,那么ACL可以这样写:

 

acl ?sinapage ?dstdomain sinapage4.sina.com.cn
... ...
http_access deny sinapage
... ...


  由此可以看到,除了sinapage4,其它如[url]www.sina.com.cn[/url]news.sina.com.cn都可以正常访问。

  另一种情况是整个网站都不许访问,那么只需要写出这个网站共有的域名即可,配置如下:

 

acl qq dstdomain .tencent.com.cn


  注意tencent前面的“.”,正是它指出以此域名结尾的所有主机都不可访问,否则就只有tencent.com.cn这一台主机不能访问。

  如果想禁止对某个IP地址的访问,如202.108.0.182,可以用dst来控制,代码如下:

 

acl badaddr dst 202.108.0.182


  当然,这个dst也可以是域名,由Squid查询DNS服务器将其转换为IP

  还有一种比较广泛的控制是文件类型。如果不希望普通用户通过代理服务器下载MP3AVI等文件,完全可以对他们进行限制,代码如下:

 

acl mmxfile urlpath_regex \.mp3$ \.avi$ \.exe$
http_access deny mmxfile


  看到regex,很多读者应该心领神会,因为这条语句使用了标准的规则表达式(又叫正则表达式)。它将匹配所有以.mp3.avi等结尾的URL请求,还可以用-i参数忽略大小写,例如以下代码:

 

acl mmxfile urlpath_regex -i \.mp3$


  这样,无论是.mp3还是.MP3都会被拒绝。当然,-i参数适用于任何可能需要区分大小写的地方,如前面的域名控制。

  如果想让普通用户只在上班时间可以上网,而且是每周的工作日,用Squid应当如何处理呢?看看下面的ACL定义:

 

acl worktime time MTWHF 8:30-12:00 14:00-18:00
http_access deny !worktime


  首先定义允许上网的时间是每周工作日(星期一至星期五)的上午和下午的固定时段,然后用http_access 定义所有不在这个时间段内的请求都是不允许的。

  或者为了保证高级用户的带宽,希望每个用户的并发连接不能太多,以免影响他人,也可以通过Squid控制,代码如下:

 

acl conncount maxconn 3
http_access deny conncount normal
http_access allow normal


  这样,普通用户在某个固定时刻只能同时发起三个连接,从第四个开始,连接将被拒绝。

  总之,SquidACL配置非常灵活、强大,更多的控制方式可以参考squid.conf.default

   认证

  用户/密码认证为Squid管理提供了更多便利,最常用的认证方式是NCSA。从Squid 2.5版本开始,NCSA认证包含在了basic中,而非以前单独的认证模块。下面来看看实现认证的具体操作。

  首先在编译时配置选项应包括以下配置:

 

--enable-auth="basic" --enable-basic-auth-helpers="NCSA"


  “make install”以后,需要将“helpers/basic_auth/NCSA/ncsa_auth”拷贝到用户可执行目录中,如/usr/bin(如果在该目录中找不到这个执行文件,在编译时请使用make all而不是make,或者直接在该目录中执行make),然后需要借助Apache的密码管理程序htpasswd来生成用户名/密码对应的文件,就像下面这行代码:

 

htpasswd -c /var/squid/etc/password guest


  在输入两遍guest用户的密码后,一个guest用户就生成了。如果以后需要添加用户,把上面的命令去掉-c参数再运行即可。

  Squid 2.5在认证处理上有了较大的改变,这里就只讨论2.5版本的处理方法,2.4及以下版本请参考squid.conf.default。在2.5版的squid.conf中,包括以下几个相关选项:

 

# 该选项指出了认证方式( basic) 、需要的程序( ncsa_auth )和对应的密码文件( password
auth_param basic program /usr/bin/ncsa_auth /var/squid/etc/password
# 指定认证程序的进程数
auth_param basic children 5
# 浏览器显示输入用户 / 密码对话框时的领域内容
auth_param basic realm My Proxy Caching Domain
# 基本的认证有效时间
auth_param basic credentialsttl 2 hours
# 普通用户需要通过认证才能访问 Internet
acl normal proxy_auth REQUIRED
http_access allow normal


  通过以上的配置即可完成认证工作。有的读者可能要问:认证只针对普通用户,而高级用户是直接上网的,该怎么处理呢?其实,这两种用户是可以共存的。如前所述,Squid是顺序处理http_access的,所以在http_access处理过程中,如果先处理normal用户,那么当前用户无论是否属于高级用户,都会被要求进行认证;相反如果先处理高级用户,剩下的就只有需要认证的普通用户了。例如以下配置代码:

 

...
http_access allow normal ( 需要认证 )
http_access allow advance (不需要认证)
...


  不管是否为noauth用户,都要求进行用户名/密码验证。正确的方法是将二者位置交换,代码如下:

 

...
http_access allow advance
http_access allow normal
...


  这时,高级用户不会受到任何影响。

  总结

  下面把整个squid.conf总结一下:

 

# 服务器配置
http_port 192.168.0.1:3128
cache_mgr [email]netsnake@963.net[/email]
cache_dir null /tmp
cache_access_log /var/squid/access.log
cache_log /var/squid/cache.log
cache_store_log /var/squid/store.log
visible_hostname No1.proxy
client_mask 255.255.255.255
httpd_accel_host virtual
httpd_accel_port 80
httpd_accel_with_proxy on
httpd_accel_user_host_header on

# 用户分类
acl advance arp 00:01:02:1f:2c:3e 00:01:02:3c:1a:8b ...
acl normal proxy_auth REQUIED
acl all src 0.0.0.0

# 行为分类
acl mmxfile urlpath_regex \.mp3$ \.avi$ \.exe$
acl conncount maxconn 3
acl worktime time MTWHF 8:30-12:00 14:00-18:00
acl sinapage dstdomain sinapage4.sina.com.cn
acl qq dstdomain .tencent.com.cn

# 处理
http_access allow advance
http_access deny conncount normal
http_access deny !worktime
http_access deny mmxfile
http_access deny sinapage
http_access deny qq
http_access allow normal


  配置后的状况是,advance组可以不受任何限制地访问Internet,而normal组则只能在工作时间上网,而且不能下载多媒体文件,不能访问某些特定的站点,而且发送请求不能超过3个。

  通过本文的介绍,它可以了解Squid的基本能力。当然,它的能力远不止此,可以建立强大的代理服务器阵列,可以帮助本地的Web服务器提高性能,可以提高本地网络的安全性等。要想发挥它的功效,还需要进一步控制。

 

 

 

 

 

 

 

 

squid 是一款功能十分强大的代理服务器软件,这里我把我的配置过程公布出来供大家参考。
一、安装
squid
我的配置环境是FC2,在安装时安装了squidRPM包,可以用:rpm -q squid来进行查询。这里建议把RPM包卸掉,去官方网站下载最新的原码包。卸载命令:

rpm -e squid

目前官方网站最近的版本为:squid-2.5.STABLE7,下载了squid-2.5.STABLE7.tar.gz后先解压:
tar -vxzf squid-2.5.STABLE7.tar.gz
然后进入squid-2.5.STABLE7目录,进行编译:./configure 这里有很多选项,大家可以参考./configure --help里的说明,我编译的时候有没带选项。然后

make all
make install
OK
squid的安装完成了

二、配置

如果在configure时没在加安装目录的选项,那么默认会安装在/usr/local/squid的目录下。

修改配置文件
/usr/local/squid/etc/squid.conf
修改如下:

http_port 8080
代理端口改成
8080
cache_effective_user squid
更改squid的进程用户,这里说明一下,默认安装这里是nobody权限,这样会导致启动不成功,因为nobody权限不能写cachelog文件,因为在系统安装时装了squidrpm包,所以有一个squid的用户,在/etc/passwd里可以找到,如果没有这个帐号最好是添加一个,强烈建议不要把root权限给
squid,
visible_hostname xinhe
设置主机名,这个默认配置没有,必须添加,否则无法启动。

/usr/local/squid目录的所以都改为
squid
chown squid:squid -R /usr/local/squid
然后启动squid测式一下,

/use/local/squid/sbin/suqid -z
-z
是为了创建cache目录

如果这里失败的话请回到上一步检查权限问题,要确保squid/use/local/suqid/var目录有写权限。

如果成功的话会提示创建cache目录成功

再运行

/use/local/squid/sbin/squid
检查 /use/local/squid/sbin/squid/var/下的cache目录和logs目录下的日志文件是否正确创建,再运行

netstat -an |grep LISTEN
看代理端口8080是否在监听,如果在,就证在squid成功运行了,否则请在logs下的日志文件里找一下原因。

这样,squid的配置是算完成了(这里用的是最简单的配置
)
三、添加认证功能

squid
自身不带认证功能,需要另外的软件来支持认证,可以选mysql,smb,LDAP,ncsa等,从squid2.5开始都包含了ncsa的模块

我们再回到最开始解压的目录:
squid-2.5.STABLE7
helpers/basic_auth/NCSA目录下找到ncsa_auth文件。

注意:如果你在开始编译的时候用的是:make all的话就会有这个会件,否则,需要在这个目录下单独编译

把这个文件拷贝到/usr/bin目录下

cp ./ncsa_auth /usr/bin
下一步开始创建认证用户和密码

htpasswd -c /usr/local/squid/etc/password guest
如果是以后添加用户的话就把-c的参数去掉

然后再更改/use/local/squid/etc/squid.conf文件

auth_param basic program /usr/bin/ncsa_auth /usr/local/squid/etc/password
配置认证文件和用户文件

auth_param basic children 5
指定认证程序的进程数

auth_param basic realm Squid proxy-caching web server
代理服务器的名称

auth_param basic credentialsttl 2 hours
认证有效时间为2小时

acl normal proxy_auth REQUIRED
http_access allow normal
只有认证用户才能访问

OK 重启squid服务,
在浏览器里配上这个代理,打开任意网站,如果弹出了

 

 

 

 

 

Squid.conf 的几个重要参数的配置说明:

http_port 61.155.143.54:80 #Squid Server 侦听的端口。假设我的主页的 dns server 指到 61.155.143.54 上的,因此我必须让 squid 来侦听这个 IP 的这个端口。

cache_mem 32 MB # 要额外提供多少内存给 squid 使用,这里的额外是指 squid 会将最常用的一些缓存放到这块内存中。这个指令也是我看了官方文档后才理解的。因为一开始从实际使用情况来看,我这边设 32M 的话,用 top 命令来查看一般会达到 100M 左右。这点让我让我很想不通,呵呵。然后就去看官方文档,发觉 squid 是这样来计算使用多少内存的: squid 本身的进程大概 10M -20M ,然后下面我设的 cache 目录的大小是 500M 的话,那他放在内存里的 hash 索引大概需要 20M 左右,然后再加上这里设置的 cache_mem 的值。官方文档建议你的实际内存大小应该是这个 squid 所需要总内存的 2 倍以上。自己量力而为吧。 cache_mem 当然是越大越好了。

cache_dir ufs /usr/local/squid-54/var/cache 500 16 256 # 设置 squid 存放 cache 目录的位置以及大小。第一个数字 500 是指目录的总大小为 500M (默认为 100M ),第二个数字 16 是指第一级目录为 16 个,第三个数字 256 是指第二级目录为 256 个我个人觉得如果网站访问量大,并且内容很多的话,可以考虑将默认的 100M 改大一点,否则会报错。我就经历过,错误我忘了记录了(该死!)大致就是说超过 Max 的极限了,当时查了半天才找到罪魁祸首是这条指令,惭愧 ~~~

cache_access_log none
cache_log none

cache_store_log none # 我是将这些 log 记录都关了, 有需要的可以将它们打开。

acl managerIP src 10.10.10.10
acl ipcanbrows dst 10.10.10.0/24
#acl 应该是 squid 配置里面最难理解也最需要花时间的地方了。应该说只需要修改很小的一部分就可以了,像这里我只是在原来的基础上加了 2 条记录,前面一条的意思是我定义了 10.10.10.10 为源路径,另外一条是指目的端是 10.10.10.0/24 这个网段。而 managerIP,ipcanbrows 随便取得名字。具体的规则需要下面的语句来定义。 10.10.10.10 就是本服务器的内网 ip ,而 apache server ip 就在 10.10.10.0/24 这个网段里,不需要用外网 ip ,一定程度上节约了 ip 地址。

http_access allow manager managerIP ipcanbrows localhost # 加上 2 个允许就可以了。高深的配置我觉得我也不需要,用户可以访问就达到目的了:)

httpd_accel_host virtual # 由于我后面的 apache server 是基于 ip 来做虚拟主机的,因此这里需要设置成 virtual

httpd_accel_port 80 #http 加速的端口,因为习惯等原因,还是将后面的 apache server 监听 80 端口。

httpd_accel_uses_host_header on # 如果选了 virtual 的话,这里必须设置成 on

这里最多只列出了 5% 左右的选项,但是我配置的时候就只是用到了这些,因此,如果做网站加速的话,基本设置就是这些。当然需要更强劲的功能的话就需要好好读读 squid 的配置文件的文档了。

最后的步骤:

1. 改变 var 目录的权限: chown -R nobody var

2. 创建缓存目录: sbin/squid -z

3. 启动 squid bin/RunAccel & ( 这边我使用 squid 附带的启动脚本来启动 squid ,有个好处就是,如果 squid 的进程死了的话,这个脚本会自动启动 squid ,对于运行在线上的服务器来说,这点太重要了。

一些使用体会:

1. squid 使用时间长了,速度会变慢,我的建议是每 2 小时 kill squid 进程, RunAccel 脚本会自动再启动的它。

2. 写一脚本,放进 crontab 中,每天凌晨 4 点左右把 cache 目录清空。

#!/bin/sh
# squid clean swap and restart script by marco lu
SQUID_DIR=/usr/local/squid-54/
PID_FILE=${SQUID_DIR}var/logs/squid.pid
CACHE_DIR=${SQUID_DIR}var/cache
PPID=`ps aux | grep -i squid-54 | grep -v grep|awk '{print $2}'`
kill -9 ${PPID} > /dev/null
kill -9 `cat ${PID_FILE}` > /dev/null
rm -rf $CACHE_DIR/*
${SQUID_DIR}sbin/squid -z > /dev/null
if [ $? -eq 0 ]
then
${SQUID_DIR}bin/RunAccel & > /dev/null
fi