77百科网
当前位置: 首页 生活百科

redis的多线程模式(属于单线程还是多线程)

时间:2023-08-17 作者: 小编 阅读量: 2 栏目名: 生活百科

不同版本的Redis是不同的,在4.0之前Redis是单线程运行的,但是单线程并不代表效率低。而使用惰性删除,可以有效地避免Redis卡顿的问题。如果是非阻塞类型的已连接套接字,那么当调用recv()但却收不到数据时,也不用处于阻塞状态,同样可以直接返回去做其它事情。因此必须要有一种机制,能够继续在监听套接字上等待后续连接请求,并在请求到来时通知Redis。

Redis 是单线程还是多线程

redis 应该是使用频率最高的组件之一了,不仅在工作中会大量使用,面试的时候也经常会作为考点出现,下面就来深入地了解一下 Redis。

先来探讨一个问题,Redis 使用的到底是多线程还是单线程?

不同版本的 Redis 是不同的,在 4.0 之前 Redis 是单线程运行的,但是单线程并不代表效率低。像 Nginx、Nodejs 也是单线程程序,但它们的效率并不低,因为底层采用了基于 epoll 的 IO 多路复用(后面说)。

此外 Redis 是基于内存操作的,它的瓶颈在于机器的内存、网络带宽,而不是 CPU,因为在你 CPU 还没达到瓶颈时你的内存可能就先满了、或者带宽达到瓶颈了。因此 CPU 不是主要原因,那么自然就采用单线程了。更何况使用多线程还会面临一些额外的问题,比如共享资源的保护等等,对于一个 CPU 不是主要瓶颈的键值对数据库而言,采用单线程是非常合适的。

简单来说,Redis 在 4.0 之前使用单线程的模式是因为以下三个原因:

  • 使用单线程模式的 Redis,其开发和维护会更简单,因为单线程模型方便开发和调试;
  • 即使使用单线程模型也能够并发地处理多客户端请求,因为 Redis 内部使用了基于 epoll 的多路复用;
  • 对于 Redis 而言,主要的性能瓶颈是内存或者网络带宽,而并非 CPU;

但 Redis 在 4.0 以及之后的版本中引入了惰性删除(也叫异步删除),这是由额外的线程执行的。意思就是我们可以使用异步的方式对 Redis 中的数据执行删除操作了,例如:unlink key, flushdb async, flushall async,举个例子:

127.0.0.1:6379> set name satoriOK127.0.0.1:6379> get name"satori"# 这里是异步删除一个 key# 同步的话则是 del name127.0.0.1:6379> unlink name(integer) 1127.0.0.1:6379> flushdb asyncOK127.0.0.1:6379> flushall asyncOK

这样处理的好处就是不会使 Redis 的主线程卡顿,会把这些删除操作交给后台线程来执行。

通常情况下使用 del 指令可以很快地删除数据,但是当被删除的 key 是一个非常大的对象时,例如:删除的是包含了成千上万个元素的 hash 集合,那么 del 指令就会造成 Redis 主线程卡顿。而使用惰性删除,可以有效地避免 Redis 卡顿的问题。

除了惰性删除,像持久化、集群数据同步等等,都是由额外的子线程执行的,而 Redis 主线程则专注于网络 IO 和键值对读写。

单线程的 Redis 为什么这么快

正如上面所说,Redis4.0 之前是单线程的,那既然是单线程为什么速度还能那么快?吞吐量还能那么高?

原因有以下几点:

1)基于内存操作:Redis 的所有数据都在内存中,因此所有的运算都是内存级别的,所以它的性能比较高;

2)数据结构简单:Redis 的数据结构是为自身专门量身打造的,而操作这些数据结构的时间复杂度是 O(1);

3)多路复用和非阻塞 I/O:Redis 使用 I/O 多路复用功能来监听多个 socket 连接客户端,这样就可以使用一个线程来处理多个连接,从而减少线程切换带来的开销,同时也避免了 I/O 阻塞操作,从而大大地提高了 Redis 的性能;

4)避免上下文切换:因为是单线程模型,因此就避免了不必要的上下文切换和多线程竞争,这就省去了多线程切换带来的时间和性能上的开销,而且单线程不会导致死锁的问题发生;

非阻塞 I/O 和 I/O 多路复用是什么

首先我们可以使用 get 命令,获取一个 key 对应的 value,比如:

127.0.0.1:6379> get name"satori"

那么问题来了,以上对于 Redis 服务端而言,都发生了哪些事情呢?

服务端必须要先监听客户端连接(bind/listen),然后当客户端到来时与其建立连接(accept),从 socket 中读取客户端的请求(recv),对请求进行解析(parse)。这里解析出的请求类型是 get、key 是 "name",再根据 key 获取对应 value,最后返回给客户端,也就是向 socket 写入数据(send)。

以上所有操作都是由 Redis 主线程依次执行的,但里面会有潜在的阻塞点,分别是 Accept 和 recv。

当 Redis 监听到一个客户端有连接请求、但却一直未能成功建立连接,那么主线程会一直阻塞在 accept 函数这里,导致其它客户端无法和 Redis 建立连接。

类似的,当 Redis 通过 recv 从客户端读取数据时,如果数据一直没有到达,那么 Redis 主线程也会一直阻塞在 recv 这一步,因此这就导致了 Redis 的效率会变得低下。

非阻塞 I/O

但很明显,Redis 不会允许这种情况发生,因为以上都是阻塞 I/O 会面临的情况,而 Redis 采用的是非阻塞 I/O,也就是将 socket 设置成了非阻塞模式。

首先在 socket 模型中,调用 socket() 方法会返回主动套接字,调用 bind() 方法绑定 IP 和 端口,再调用 listen() 方法将主动套接字转化为监听套接字,最后监听套接字调用 accept() 方法等待客户端连接的到来,当和客户端建立连接时再返回已连接套接字,而后续就通过已连接套接字来和客户端进行数据的接收与发送。

但是注意:我们说在 listen() 这一步,会将主动套接字转化为监听套接字,而此时的监听套接字的类型是阻塞的,阻塞类型的监听套接字在调用 accept() 方法时,如果没有客户端来连接的话,就会一直处于阻塞状态,那么此时主线程就没法干其它事情了。

所以在 listen() 的时候可以将其设置为非阻塞,而非阻塞的监听套接字在调用 accept() 时,如果没有客户端连接到达时,那么主线程就不会傻傻地等待了,而是会直接返回,然后去做其它的事情。

类似的,我们在创建已连接套接字的时候也可以将其类型设置为非阻塞,因为阻塞类型的已连接套接字在调用 send() / recv() 的时候也会处于阻塞状态。比如当客户端一直不发数据的时候,已连接套接字就会一直阻塞在 recv() 这一步。如果是非阻塞类型的已连接套接字,那么当调用 recv() 但却收不到数据时,也不用处于阻塞状态,同样可以直接返回去做其它事情。

但是有两点需要注意:

1)虽然 accept() 不阻塞了,在没有客户端连接时 Redis 主线程可以去做其它事情,但如果后续有客户端连接,Redis 要如何得知呢?因此必须要有一种机制,能够继续在监听套接字上等待后续连接请求,并在请求到来时通知 Redis。

2)send() / recv() 不阻塞了,相当于 I/O 读写流程不再是阻塞的,读写方法都会瞬间完成并返回,也就是说它会采用能读多少就读多少、能写多少就写多少的策略来执行 I/O 操作,这显然更符合我们对性能的追求。

但这样会面临一个问题,那就是当我们执行读取操作时,有可能只读取了一部分数据,剩余的数据客户端还没发过来,那么这些数据何时可读呢?同理写数据也是这种情况,当缓冲区满了,而我们的数据还没有写完,那么剩下的数据又何时可写呢?因此同样要有一种机制,能够在 Redis 主线程做别的事情的时候继续监听已连接套接字,并且在有数据可读写的时候通知 Redis。

这样才能保证 Redis 线程既不会像基本 IO 模型一样,一直在阻塞点等待,也不会无法处理实际到达的客户端连接请求和可读写的数据,而上面所提到的机制便是 I/O 多路复用。

I/O 多路复用

I/O 多路复用机制是指一个线程处理多个 IO 流,也就是我们经常听到的 select/poll/epoll,而 Linux 默认采用的是 epoll。

简单来说,在 Redis 只运行单线程的情况下,该机制允许内核中同时存在多个监听套接字和已连接套接字。内核会一直监听这些套接字上的连接请求或数据请求,一旦有请求到达就会交给 Redis 线程处理,这样就实现了一个 Redis 线程处理多个 IO 流的效果。

上图就是基于多路复用的 Redis IO 模型,图中的 FD 就是套接字,可以是监听套接字、也可以是已连接套接字,Redis 会通过 epoll 机制来让内核帮忙监听这些套接字。而此时 Redis 线程或者说主线程,不会阻塞在某一个特定的套接字上,也就是说不会阻塞在某一个特定的客户端请求处理上。因此 Redis 可以同时和多个客户端连接并处理请求,从而提升并发性。

但为了在请求到达时能够通知 Redis 线程,epoll 提供了基于事件的回调机制,即针对不同事件的发生,调用相应的处理函数。

那么回调机制是怎么工作的呢?以上图为例,首先 epoll 一旦监测到 FD 上有请求到达,就会触发相应的事件。这些事件会被放进一个队列中,Redis 主线程会对该事件队列不断进行处理,这样一来 Redis 就无需一直轮询是否有请求发生,从而避免资源的浪费。

同时,Redis 在对事件队列中的事件进行处理时,会调用相应的处理函数,这就实现了基于事件的回调。因为 Redis 一直在对事件队列进行处理,所以能及时响应客户端请求,提升 Redis 的响应性能。

比如连接请求和数据读取请求分别对应 Accept 事件和 Read 事件,Redis 分别对这两个事件注册 accept 和 get 回调函数。当 Linux 内核监听到有连接请求或数据读取请求时,就会触发 Accept 事件或 Read 事件,然后内核就会回调 Redis 注册的 accept 函数或 get 函数。

就像病人去医院看病,在医生实际诊断之前每个病人(类似于请求)都需要先分诊、测体温、登记等等。如果这些工作都由医生完成,那么医生的工作效率就会很低。所以医院设置了分诊台,分诊台会一直处理这些诊断前的工作(类似于 Linux 内核监听请求),然后再转交给医生做实际诊断,这样即使一个医生(相当于 Redis 的主线程)也能有很高的效率。

需要注意的是,不同的操作系统有着不同的多路复用实现,除了 Linux 的 epoll,还有 FreeBSD 的 kqueue、以及 Solaris 的 evport。

相关视频推荐

源码调试:redis io多线程

redis 为什么是单线程?这里单线程指什么?redis单线程为什么这么快?

需要C/CLinux服务器架构师学习资料加qun812855908获取(资料包括C/C,Linux,golang技术,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,ZK,流媒体,CDN,P2P,K8S,Docker,TCP/IP,协程,DPDK,ffmpeg等),免费分享

嗦一下 Redis 6.0 的多线程

Redis 6.0 引入了一些新特性,其中非常受关注的一个特性就是多线程。在 4.0 之前 Redis 是单线程的,因为单线程的优点很明显,不但降低了 Redis 内部实现的复杂性,也让所有操作都可以在无锁的情况下进行,并且不存在死锁和线程切换带来的性能以及时间上的消耗。

但是其缺点也很明显,单线程机制导致 Redis 的 QPS(Query Per Second,每秒查询数)很难得到有效的提高(虽然已经够快了,但人毕竟还是要有更高的追求的)。

然后 Redis 在 4.0 版本引入了多线程,但是此版本的多线程主要用于大数据量的异步删除,对于非删除操作的意义并不是很大。

而 Redis 6.0 中的多线程则是真正为了提高 I/O 的读写性能而引入的,它的主要实现思路是将主线程的 I/O 读写任务拆分给一组独立的子线程去执行。也就是说,从 socket 读数据和写数据不再由主线程负责,而是交给了多个子线程,这样就可以使多个 socket 的读写并行化了。这么做的原因就在于,虽然在 Redis 中使用了 I/O 多路复用和非阻塞 I/O,但数据在内核态空间和用户态空间之间的拷贝是无法避免的,而数据的拷贝这一步是阻塞的,并且当数据量越大时拷贝所需要的时间就越多。

所以 Redis 在 6.0 引入了多线程,用于分摊同步读写 I/O 压力,从而提升 Redis 的 QPS。

但是注意:Redis 的命令本身依旧是由 Redis 主线程串行执行的,只不过具体的读写操作交给独立的子线程去执行了(一会儿详细说明 Redis 的主线程和子线程之间是如何协同的)。而这么做的好处就是不需要为 Lua 脚本、事务的原子性而额外开发多线程互斥机制,这样一来 Redis 的线程模型实现起来就简单多了。因为和之前一样,所有的命令依旧是由主线程串行执行,只不过具体的读写任务交给了子线程。

除了引入多线程,还可以将内核网络协议栈换成用户态网络协议栈(DPDK),让网络请求不在内核里进行,直接在用户态完成。但 Redis 并没有采用这种做法,虽然替换协议栈可以避免频繁地让内核参与网络请求处理,提升请求处理效率。原因是该做法要求 Redis 添加对用户态网络协议栈的支持,需要修改 Redis 源码中和网络相关的部分,这会带来很多额外的开发工作量;而且新增代码还可能引入 bug,导致 Redis 程序不稳定,因此 Redis 6.0 没有采用这种做法。

请再具体嗦一下 Redis 6.0 的主线程和子线程之间是如何协同的?

整体可以分为四个阶段。

阶段一:服务端和客户端建立 socket 连接,并分配子线程(处理线程)

首先,主线程负责建立连接请求,当有客户端请求到达时,主线程会创建和客户端的 scoket 连接,该 socket 连接就是用来和客户端进行数据传输的。只不过这一步不由主线程来做,主线程要做的事情是将该 socket 放入到全局等待队列中,然后通过轮询的方式选择子线程,并将队列中的 socket 连接分配给它。

所以无论是从客户端读数据还是向客户端写数据,都由子线程来做。因为我们说 Redis 6.0 引入的多线程就是为了缓解主线程的 I/O 读写压力,而 I/O 读写这一步是阻塞的,所以应该交给子线程并行操作。

阶段二:子线程读取并解析请求

主线程一旦把 socket 连接分配给子线程,那么会进入阻塞状态,等待子线程完成客户端请求的读取和解析,得到具体的命令操作。由于可以有多个子线程,所以这个操作很快就能完成。

阶段三:主线程执行命令操作

等到子线程读取到客户端请求并解析完毕之后,再由主线程以单线程的方式执行命令操作,所以 I/O 读写虽然交给了子线程,但命令本身还是由 Redis 主线程执行的。

阶段四:子线程回写 socket、主线程清空全局队列

当主线程执行完命令操作时,还需要将结果写入缓冲区,而这一步显然要由子线程来做,因为是 I/O 读写。此时主线程会再次陷入阻塞,直到子线程将这些结果写回 socket 并返回给客户端。

和读取一样,子线程将数据写回 socket 时,也是多个线程在并行执行,所以写回 socket 的速度也很快。之后主线程会清空全局队列,等待客户端的后续请求。

在 Redis 6.0 中如何开启多线程?

在了解了 Redis 6.0 的多线程机制之后,我们要如何开启多线程呢?在 Redis 6.0 中,多线程机制默认是关闭的,如果想启动的话,需要修改 redis.conf 里的两个配置。

# 设置 io-thread-do-reads 配置项为 yes# 表示启用多线程io-thread-do-reads yes# 通过 io-threads 设置子线程的数量io-threads 3

上述配置表示开启 3 个子线程,需要注意的是,线程数并不是越大越好,应该小于机器的 CPU 核数。关于线程数的设置,官方的建议是:如果 4 核的 CPU,那么设置子线程数为 2 或 3;如果 8 核的 CPU,那么设置子线程数为 6。

如果你在实际应用中,发现 Redis 实例的 CPU 开销不大,吞吐量却没有提升。那么可以考虑使用 Redis 6.0 的多线程机制,加速 IO 读写处理,进而提升实例的吞吐量。

最后关于 Redis 的性能,Redis 的作者在 2019 的 RedisConf 大会上提到,Redis6.0 引入的多线程 I/O 特性对性能的提升至少是一倍以上。国内也有人在阿里云使用 4 个线程的 Redis 版本和单线程的 Redis 版本进行比较测试,发现测试的结果和 Redis 作者说的一致,性能基本可以提高一倍。

小结

以上我们就介绍了 Redis 在 4.0 之前明明采用单线程但却依然快的原因:基于内存操作、量身打造的数据结构、I/O 多路复用和非阻塞 I/O、避免了不必要的线程上下文切换。

并且在 Redis4.0 开始支持多线程,主要体现在大数据的异步删除上面,例如:unlink key、flushdb async、flushall async 等。

而 Redis6.0 的多线程则增加了对 I/O 读写的并发能力,因为数据在用户态和内核态之间穿梭是需要进行拷贝的,而这一步会阻塞,所以通过多个线程并行操作能更好地提升 Redis 的性能。

,
    推荐阅读
  • 个人发票怎么开(怎么开个人发票)

    下面更多详细答案一起来看看吧!其余的什么地址电话、开户行、账号、税号等,一律不用填写。虽然国家要求所有开据的普通发票必须要有税号才能做为报销凭证,如果没有税号是不能入账的,但是开给个人及政府机关的普通发票除外。

  • 鼻息肉做完手术又长出来(鼻息肉切了又长)

    如果我们把息肉当作一个单个的生命体来看,息肉生长的地方肯定是它喜欢这儿的“环境”,只有生长环境适合,息肉才能存活,这个道理其实不难理解。当然还有一个原因就是不良的生活作息和饮食习惯造成的。息肉中医认为,息肉是痰湿、浊气、淤血它们三者治疗相互交结在一起,从而形成的病理现象。

  • 下雪后车辆上的积雪要清理吗(车上积雪要及时清理干净吗)

    若不及时清除,就会侵蚀车漆,使外部亮釉失去光泽。因此,车主最好能在雪停后立刻洗车,即使天气预报显示未来的几天内还会下雪,也不要拖着不洗车。为减少腐蚀物质对车漆的伤害,如果未来几天没有降雪天气,车主可以在洗车后给车辆打蜡或封釉保护漆面。除了玻璃之外,车辆的车漆处理不好,也极易因积雪而遭受损伤。因为积雪里含有很多空气中的化学颗粒物成分,对轮胎、车漆等都会造成腐蚀。

  • 西游记第二十五回风雪通天河(西游记第二十三回)

    唐僧师徒渡过通天河后,继续西行。且说孙悟空化斋回来,难觅三人影踪。妖怪得胜,得意洋洋归洞府。查遍了满天星斗,并无私自下界的。孙悟空同众天将出了南天门,来到金晚山。哪吒使出斩妖剑,劈手相迎。两人正相持之间,哪吒即将六件神兵从妖怪身上抛来。这边孙悟空、李天王等的兵器得而复失,商议下来,悟空决定仍去调查那妖怪的根源。孙悟空当下就纵筋斗云赶往灵山,拜见了如来佛。如来听说后,将慧眼遥观,早已知情。

  • 紧贴实战!贵州武警点燃冬训场

    近日,武警贵州总队训练基地紧贴实战化训练,组织官兵开展刺杀课目训练,进一步锤炼军事技能,磨砺血性胆气。“突刺,刺!杀!”训练场上,官兵们以高昂的士气迅速投入到实战化训练中。

  • 凯瑟琳四肢纤细(玉体横陈堀江由衣)

    《凯瑟琳:玉体横陈》将于2019年2月14日发售,登陆PS4和PSV平台。

  • 米酒做法窍门(做米酒的步骤)

    米酒做法窍门糯米1000g、甜酒曲5g。将蒸熟的糯米放一会,让温度降至温热,约35度左右,撒上甜酒曲。加入适量水,用手将甜酒曲和糯米搅拌均匀;用手心将米酒压平,在中间打个孔。有保鲜膜将装有米酒的容器密封;盖上锅盖,放在30度左右的房间保存24小时。等到有酒香后,倒入开水,杀死甜酒曲中的酵粉,米酒就做好了,可以直接食用,也可以煮开后食用。

  • 阴丽华简介(阴丽华崩逝时间)

    阴丽华简介阴丽华,南阳郡新野县人。光武帝刘秀元配,东汉第二任皇后。春秋时期名相管仲后裔,汉明帝刘庄的生母。新莽末年,天下大乱,刘秀亦于家乡起兵。昆阳之战后,刘秀于宛城迎娶阴丽华为妻。东汉建立后,阴丽华受封贵人。建武十七年(41年),皇后郭圣通被废,刘秀封阴丽华为皇后。汉明帝即位后,尊阴丽华为皇太后,共在位二十四年。永平七年(64年)正月,阴丽华崩逝,年六十。同年二月,与刘秀合葬于原陵,谥号“光烈”。

  • 羊肉怎么炖比较滋补(羊肉配四样滋补又美味)

    羊肉黑豆,提高蛋白质利用率。胡萝卜是公认的“护眼明星”,其富含的胡萝卜素能在人体内转化为维生素A。维生素A是构成视觉细胞内感光物质的成分,可保证暗光下明暗变换时视力不受影响。胡萝卜素是一种脂溶性的营养素,羊肉中的脂肪能促进其吸收利用。因此炖羊肉时加上山药,能增强滋补效果。

  • 洗白色衣服发黄的小妙招(简单小妙招解决白衣服发黄问题)

    将有黄污渍的地方放入菠菜水中搓揉,再浸泡10分钟。