varnish 缓存为王

web

字数统计: 2.5k阅读时长: 11 min

 2017/05/30   Share

varnish

varnish是一款高性能的开源http缓存加速器，缓存服务器我们最常见的是squid，这是一款较早期的较重量级的缓存的服务器，varnish与squid的关系就像现在的nginx和httpd的关系，现在nginx已经被广泛的接受了，所以相信varnish在未来的前途还是很可观的，在如今的互联网系统中，有太多的系统架构是依赖缓存服务器的，所以在整个系统架构中缓存是关键的一环，现在的互联网时代缓存为王，但想要管理好缓存也并不是容易办到的，缓存数据我们需要通过内核操控内存的中的数据，这对我们来说本身不可见，我们只能通过不断调试测试来完成缓存工作。

http cache

程序运行具有局部性特征：时间局部性，空间局部性，即每个程序在特定时间运行会较为频繁，当该时间点运行完的数据在下一刻可能仍会被需要运行，在该节点运行的数据，其周边的节点的运行的数据也会较为频繁。所以整个程序的运行是具有热点数据的，如果我们可以在整个系统中将热点数据进行缓存处理，那么整个系统中后端服务器的处理能力将会有指数级增长。

为了评定缓存的能力，我们有缓存命中率的评定标准(hit/(hit+miss)),缓存的命中率存在两种评定标准：
（1）文档的命中率：从命中的文档个数进行衡量
（2）字节的命中率：从命中的内容的大小进行衡量

对于缓存的整个处理步骤：

接受请求–>解析请求（提取请求的url及各种头部）–>查询缓存–>新鲜度检测–>构建响应报文–>发送响应–>记录日志

缓存控制机制：

HTTP/1.0 Expires
	Expires: Fri,20,May 2017 02:03:18 GMT  #过期时间
HTTP/1.1 Cache-Control: max-age
	Cache-Control: no transform,max-age=3600  #相对时间，保存3600
		cache-request-directive=
				no-cache
				no-store
				max-age
				max-stale
				min-fresh
		cache-response-directive=
				public
				private
				no-cache
				no-store
				must-revalidate
				max-age
				s-max-age

新鲜度检测机制：

有效性再验证：revalidate
如果原始内容未改变，则仅响应首部（不用附带body部分）：响应码为304（not modified）
如果原始内容发生了改变，则正常响应，响应码为200
如果原始内容消失，则响应为404，此时缓存中的缓存项也应该被删除
条件式请求首部
If-Modified-Since: 基于原始内容的最近一个修改的时间戳进行
If-Unmodified-Since:
If-Match
If-None-Match:基于Etag的比较进行

varnish进程特性

varnish的工作模式需要通过management提高的管理接口，通过vcl编程编译成c语言，再通过c编译成子进程可以识别的共享对象来进行配置。

安装

1	~]# yum install -y epel-release
2	~]# yum install -y varnish

配置varnish进程参数

~]# cat /etc/varnish/varnish.params
RELOAD_VCL=1                                        #是否运行reload
VARNISH_VCL_CONF=/etc/varnish/default.vcl           #vcl配置文件
# VARNISH_LISTEN_ADDRESS=192.168.1.5                #监听的ip
VARNISH_LISTEN_PORT=80                              #监听的端口
VARNISH_ADMIN_LISTEN_ADDRESS=127.0.0.1              #管理的ip
VARNISH_ADMIN_LISTEN_PORT=6082                      #管理的端口
VARNISH_SECRET_FILE=/etc/varnish/secret             #认证文件
VARNISH_STORAGE="malloc,256M"                       #varnish存储对象
#VARNISH_STORAGE="file,/var/lib/varnish/varnish_storage.bin,1G"  #varnish存储对象
VARNISH_USER=varnish                                #varnish启动的用户
VARNISH_GROUP=varnish                               #varnish启动的用户组
#DAEMON_OPTS="-p thread_pool_min=5 -p thread_pool_max=500 -p thread_pool_timeout=300"  #其他选项


~]# cat /usr/lib/systemd/system/varnish.service
...
ExecStart=/usr/sbin/varnishd \
        -P /var/run/varnish.pid \
        -f $VARNISH_VCL_CONF \
        -a ${VARNISH_LISTEN_ADDRESS}:${VARNISH_LISTEN_PORT} \
        -T ${VARNISH_ADMIN_LISTEN_ADDRESS}:${VARNISH_ADMIN_LISTEN_PORT} \
        -S $VARNISH_SECRET_FILE \
        -s $VARNISH_STORAGE \
        $DAEMON_OPTS
...

varnish的存储对象：

（1）file ：自管理的文件系统，黑盒：
（2）malloc：使用malloc()库调用在varnish启动时向内存申请指定大小的空间
（3）persistent：与file功能相同；仍处于测试期
启动varnish

1	~]# systemctl start varnish.service

vcl

vcl是一种‘域‘专用的编程语言，vcl存在多个状态引擎，通过return的返回值来退出当前状态，并进入下个状态，彼此间状态相互联系，但彼此间又相互隔离，不同的状态引擎，其返回状态都不相同。

varnish的状态引擎：

vcl_recv
vcl_hash
	hit:vcl_hit
	miss:vcl_miss
	purge:vcl_purge
	pipe:vcl_pipe
	pass,hit_for_pass:vcl_pass
vcl_backend_fetch
vcl_backend_response
vcl_backend_error

vcl_synth

vcl_deliver

各个状态引擎的关系如下图：

数据报文大致流向：

vcl_recv-->vcl_hash-->
		(1)vcl_hit-->
				(a)vcl_deliver
				(b)vcl_pass
		(2)vcl_miss-->
				(a)vcl_pass
				(b)vcl_backend_fetch
		(3)vcl_purge-->
				(a)vcl_synth
				(4)vcl_pipe-->
vcl_pass-->
		vcl_backend_fetch
vcl_backend_fetch-->
		vcl_backend_response-->vcl_deliver
		vcl_backend_error

vcl编程

varnish做反代，请求后端服务器

测试信息:

~]# cat /etc/varnish/default.vcl
vcl 4.0;
backend default {
    .host = "10.211.55.43";
    .port = "80";
}
sub vcl_deliver {
	if (obj.hits>0) {
        set resp.http.X-Cache = "HIT" + " " + server.ip;
    } else {
        set  resp.http.X-Cache = "MISS" + " " + server.ip;
	}
}

内建变量：

req.*: 客户端请求
req.http.*:客户端请求报文首部
bereq.*: 由varnish向backend主机发出的http请求
beresp.*：由backend主机发来的http响应报文
resp.*：varnish响应client的http响应报文
resp.http.*: 响应报文各首部的值
obj.*:对缓存在缓存空间中的缓存对象属性，只读

client.*,server.*,storage.*: 可用在所有client side的sub routines中

自定义变量：set

常用的变量:
bereq.http.HEADERS
bereq.request: 请求方法
bereq.url:请求的url
bereq.poro: 协议版本
bereq.backend: 指明要调用的后端主机

beresp.poro
beresp.status: 响应的状态码
beresp.reason
beresp.backend.name
beresp.http.HEADERS
beresp.ttl:后端服务器响应内容的余下的生存时间

obj.hits: 此对象从缓存中命中的次数
obj.ttl: 对象ttl值

server.ip
server.hostname

req.method:请求方法
req.url:请求的url

实例1

强制对某资源请求不检查缓存：

vcl 4.0;
backend default {
    .host = "10.211.55.43";
    .port = "80";
}
sub vcl_recv {
	if(req.url ~ "(?!)/admin | (?!)/login") {
		return(pass)
	}
}

varnish不能随便重启，我们需要通过管理接口重新加载配置：

~]# varnishadm -S /etc/varnish/secret -T 127.0.0.1:6082
200        
-----------------------------
Varnish Cache CLI 1.0
-----------------------------
Linux,3.10.0-514.16.1.el7.x86_64,x86_64,-smalloc,-smalloc,-hcritbit
varnish-4.0.4 revision 386f712

Type 'help' for command list.
Type 'quit' to close CLI session.

vcl.load test /etc/varnish/default.vcl
200        
VCL compiled.

vcl.use test
200        
VCL 'test5' now active

实例2

对公开的图片取消其私有标识，并强行通过varnish修改的时长

vcl 4.0;
backend default {
    .host = "10.211.55.43";
    .port = "80";
}

sub vcl_backend_response {
	if(beresp.http.cache-control !~ 's-maxage') {
		if(bereq.url ~ "(?!)\.jpg$") {
			set beresp.ttl = 7200s;
			unset beresp.http.Set-Cookie;
		}
		if(bereq.url ~ "(?!)\.css") {
			set beresp.ttl = 3600s;
			unset beresp.http.Set-Cookie;
		}
	}
}

实例3

缓存修剪

vcl 4.0;
backend default {
    .host = "10.211.55.43";
    .port = "80";
}

acl purgers {
	"127.0.0.1";
	"10.211.55.0"/24;
}

sub vcl_recv {
	if(req.method == "PURGE") {
        if(!client.ip ~ purgers) {
            return(synth(405,"purger not to alloed to " + client.ip));
		}
        return(purge);
	}
}

sub vcl_purge {
    return(synth(200,"purged"));
}

测试：

~]# curl -X PURGE http://10.211.55.39
<!DOCTYPE html>
<html>
  <head>
    <title>200 purged</title>
  </head>
  <body>
    <h1>Error 200 purged</h1>
    <p>purged</p>
    <h3>Guru Meditation:</h3>
    <p>XID: 32791</p>
    <hr>
    <p>Varnish cache server</p>
  </body>
</html>

不在acl列表中使用purge
~]# curl -X PURGE http://10.211.55.39
<!DOCTYPE html>
<html>
  <head>
    <title>405 purger not to alloed to 10.212.55.43</title>
  </head>
  <body>
    <h1>Error 405 purger not to alloed to 10.212.55.43</h1>
    <p>purger not to alloed to 10.212.55.43</p>
    <h3>Guru Meditation:</h3>
    <p>XID: 32799</p>
    <hr>
    <p>Varnish cache server</p>
  </body>
</html>

实例4

设定多个后端主机

vcl 4.0;
backend default {
		.host="10.211.55.34",
		.port="80",
}

backend appser {
		.host="10.211.55.35";
		.port="80";
}

sub vcl_recv {
		if(req.url ~ "(?!)\.php$") {
			set req.backend_hint = appser;
		} else {
			set req.backend_hint = default;
		}
}

实例5

负载均衡器

vcl 4.0;
import directors

backend default {
	.host="10.211.55.34";
	.port="80";
	.probe={
		.url="/";
		.interval=1s;
		.window=8;
		.threshold=5;
		.timeout=2s;
	}
}

backend appser {
	.host="10.211.55.35";
	.port="80";
	.probe={
		.url="/";
		.interval=1s;
		.window=8;
		.threshold=5;
		.timeout=2s;
	}
}

sub vcl_init {
	new bar=directors.round_robin();
	bar.add_backend(default);
	bar.add_backend(appser);
}

sub vcl_recv {
	set req.backend_hint=bar.backend();
}

测试：

1	~]# curl 10.211.55.39
2	nginx1
3	~]# curl 10.211.55.39
4	nginx2

varnish常用的命令行工具

varnishadm: varnish命令行管理接口
varnishtop: varnish实时请求状态查看
varnishncsa: varnish格式化请求日志查看，默认在内存中只有90m的存储空间，需要实时写入存储，可以启动varnishncsa.service
varnishlog: varnish原始日志查看，可以启动varnishlog写入存储
varnishstat: varnish状态查看

参考资料：http://www.varnish-cache.org

原文作者：Zhang Jusene

原文链接：http://jusene.github.io/2017/05/30/varnish/

发表日期：May 30th 2017, 10:13:42 am

更新日期：November 30th 2019, 1:54:24 am

Next Post

HAProxy 高性能负载均衡器
Previous Post

python3解析yaml文件

CATALOG

1. varnish
2. http cache
3. varnish进程特性
4. vcl
5. varnish常用的命令行工具



1	HTTP/1.0 Expires
2	Expires: Fri,20,May 2017 02:03:18 GMT #过期时间
3	HTTP/1.1 Cache-Control: max-age
4	Cache-Control: no transform,max-age=3600 #相对时间，保存3600
5	cache-request-directive=
6	no-cache
7	no-store
8	max-age
9	max-stale
10	min-fresh
11	cache-response-directive=
12	public
13	private
14	no-cache
15	no-store
16	must-revalidate
17	max-age
18	s-max-age

1	~]# cat /etc/varnish/varnish.params
2	RELOAD_VCL=1 #是否运行reload
3	VARNISH_VCL_CONF=/etc/varnish/default.vcl #vcl配置文件
4	# VARNISH_LISTEN_ADDRESS=192.168.1.5 #监听的ip
5	VARNISH_LISTEN_PORT=80 #监听的端口
6	VARNISH_ADMIN_LISTEN_ADDRESS=127.0.0.1 #管理的ip
7	VARNISH_ADMIN_LISTEN_PORT=6082 #管理的端口
8	VARNISH_SECRET_FILE=/etc/varnish/secret #认证文件
9	VARNISH_STORAGE="malloc,256M" #varnish存储对象
10	#VARNISH_STORAGE="file,/var/lib/varnish/varnish_storage.bin,1G" #varnish存储对象
11	VARNISH_USER=varnish #varnish启动的用户
12	VARNISH_GROUP=varnish #varnish启动的用户组
13	#DAEMON_OPTS="-p thread_pool_min=5 -p thread_pool_max=500 -p thread_pool_timeout=300" #其他选项
14
15
16	~]# cat /usr/lib/systemd/system/varnish.service
17	...
18	ExecStart=/usr/sbin/varnishd \
19	-P /var/run/varnish.pid \
20	-f $VARNISH_VCL_CONF \
21	-a ${VARNISH_LISTEN_ADDRESS}:${VARNISH_LISTEN_PORT} \
22	-T ${VARNISH_ADMIN_LISTEN_ADDRESS}:${VARNISH_ADMIN_LISTEN_PORT} \
23	-S $VARNISH_SECRET_FILE \
24	-s $VARNISH_STORAGE \
25	$DAEMON_OPTS
26	...

1	vcl_recv
2	vcl_hash
3	hit:vcl_hit
4	miss:vcl_miss
5	purge:vcl_purge
6	pipe:vcl_pipe
7	pass,hit_for_pass:vcl_pass
8	vcl_backend_fetch
9	vcl_backend_response
10	vcl_backend_error
11
12	vcl_synth
13
14	vcl_deliver

1	vcl_recv-->vcl_hash-->
2	(1)vcl_hit-->
3	(a)vcl_deliver
4	(b)vcl_pass
5	(2)vcl_miss-->
6	(a)vcl_pass
7	(b)vcl_backend_fetch
8	(3)vcl_purge-->
9	(a)vcl_synth
10	(4)vcl_pipe-->
11	vcl_pass-->
12	vcl_backend_fetch
13	vcl_backend_fetch-->
14	vcl_backend_response-->vcl_deliver
15	vcl_backend_error

1	~]# cat /etc/varnish/default.vcl
2	vcl 4.0;
3	backend default {
4	.host = "10.211.55.43";
5	.port = "80";
6	}
7	sub vcl_deliver {
8	if (obj.hits>0) {
9	set resp.http.X-Cache = "HIT" + " " + server.ip;
10	} else {
11	set resp.http.X-Cache = "MISS" + " " + server.ip;
12	}
13	}

1	req.*: 客户端请求
2	req.http.*:客户端请求报文首部
3	bereq.*: 由varnish向backend主机发出的http请求
4	beresp.*：由backend主机发来的http响应报文
5	resp.*：varnish响应client的http响应报文
6	resp.http.*: 响应报文各首部的值
7	obj.*:对缓存在缓存空间中的缓存对象属性，只读
8
9	client.,server.,storage.*: 可用在所有client side的sub routines中

1	~]# varnishadm -S /etc/varnish/secret -T 127.0.0.1:6082
2	200
3	-----------------------------
4	Varnish Cache CLI 1.0
5	-----------------------------
6	Linux,3.10.0-514.16.1.el7.x86_64,x86_64,-smalloc,-smalloc,-hcritbit
7	varnish-4.0.4 revision 386f712
8
9	Type 'help' for command list.
10	Type 'quit' to close CLI session.
11
12	vcl.load test /etc/varnish/default.vcl
13	200
14	VCL compiled.
15
16	vcl.use test
17	200
18	VCL 'test5' now active

1	~]# curl -X PURGE http://10.211.55.39
2	<!DOCTYPE html>
3	<html>
4	<head>
5	<title>200 purged</title>
6	</head>
7	<body>
8	<h1>Error 200 purged</h1>
9	<p>purged</p>
10	<h3>Guru Meditation:</h3>
11	<p>XID: 32791</p>
12	<hr>
13	<p>Varnish cache server</p>
14	</body>
15	</html>
16
17	不在acl列表中使用purge
18	~]# curl -X PURGE http://10.211.55.39
19	<!DOCTYPE html>
20	<html>
21	<head>
22	<title>405 purger not to alloed to 10.212.55.43</title>
23	</head>
24	<body>
25	<h1>Error 405 purger not to alloed to 10.212.55.43</h1>
26	<p>purger not to alloed to 10.212.55.43</p>
27	<h3>Guru Meditation:</h3>
28	<p>XID: 32799</p>
29	<hr>
30	<p>Varnish cache server</p>
31	</body>
32	</html>

1	vcl 4.0;
2	backend default {
3	.host="10.211.55.34",
4	.port="80",
5	}
6
7	backend appser {
8	.host="10.211.55.35";
9	.port="80";
10	}
11
12	sub vcl_recv {
13	if(req.url ~ "(?!)\.php$") {
14	set req.backend_hint = appser;
15	} else {
16	set req.backend_hint = default;
17	}
18	}

1	vcl 4.0;
2	import directors
3
4	backend default {
5	.host="10.211.55.34";
6	.port="80";
7	.probe={
8	.url="/";
9	.interval=1s;
10	.window=8;
11	.threshold=5;
12	.timeout=2s;
13	}
14	}
15
16	backend appser {
17	.host="10.211.55.35";
18	.port="80";
19	.probe={
20	.url="/";
21	.interval=1s;
22	.window=8;
23	.threshold=5;
24	.timeout=2s;
25	}
26	}
27
28	sub vcl_init {
29	new bar=directors.round_robin();
30	bar.add_backend(default);
31	bar.add_backend(appser);
32	}
33
34	sub vcl_recv {
35	set req.backend_hint=bar.backend();
36	}