Nosql概述
为什么要用Nosql?
- 单机MySQL的年代

90年代,一个基本的网站访问量一般不会太大,单个数据库完全足够
那个时候,更多的是使用静态网页,HTML,服务器根本没有太大的压力
思考:这种情况下,整个网站的瓶颈是什么?
- 数据量如果太大,一个机器放不下
- 数据的索引300万就一定要建立索引。数据的索引(B+Tree),一个机器内存放不下
- 访问量(读写混合),一个服务器承受不了
只要你开始出现以上的三种情况之一,那么就必须要升级
- Memcached(缓存) + MySQL + 垂直拆分(读写分离)
网站80%的情况都是在读,每次都要去查询数据库的话就十分麻烦,所以我们希望减轻数据库的压力,我们可以使用缓存来保证效率。
发展过程:优化数据结构和索引–》文件缓存(I/O)–》Memcached(当时最热门的技术)

- 分库分表 + 水平拆分 + MySQL集群
技术和业务在发展的同时,对人的要求也越来越高了
本质:数据库(读,写)
早些年MyISAM:表锁,十分影响效率,高并发下就会出现严重的锁问题
转战Innodb:行锁
慢慢的就开始使用分库分表来解决写的压力,MySQL在那个年代推出了表分区,但并没有很多公司使用。
MySQL的集群,很好满足了那个年代的需求

- 最近的年代
2010–2020十年之间,世界已经发生了翻天覆地的变化;(定位,也是一种数据,音乐,热榜。。。)
MySQL等关系型数据库就不够用了,数据量很多,变化很快
MySQL有的使用它来存储一些比较大的文件,博客,图片,数据库表很大,效率就低了,如果有一种数据库来专门处理这种数据,MySQL压力就变得十分小(研究如何处理这些问题)大数据的IO压力下,表几乎没法更改
目前一个基本的互联网项目

为什么要用NoSQL
用户个人信息,社交网络,地理位置。用户自己产生的数据,用户日志等等爆发式增长
这时候我们就需要使用NoSQL数据库,NoSQL可以很好的处理以上的情况。
什么是NoSQL
NoSQL
NoSQL = Not Only SQL(不仅仅是SQL)
关系型数据库:表格,行,列(POI)
泛指非关系型数据库,随着web2.0互联网的诞生,传统的关系型数据库很难对付web2.0时代,尤其是超大规模的高并发的社区。暴露出来很多难以克服的问题,NoSQL在当今大数据环境下发展的十分迅速,Redis是发展最快的,而且是我们当下必须掌握的一个技术
很多数据类型,用户的个人信息,社交网络,地理位置,这些数据类型的存储不需要一个固定的格式,不需要过多的操作就可以横向扩展。Map<String,Object>使用键值对来控制。
NoSQL特点
解耦
方便扩展(数据之间没有关系,很好扩展)
大数据量高性能(Redis 一秒写8万次,读取11万次,NoSQL的缓存记录级,是一种细粒度的缓存,性能会比较高)
数据类型时多样型的(不需要事先设计数据库!随取随用!如果是数据量十分大的表,很多人就无法设计了)
传统RDBMS和NoSQL
1
2
3
4
5
6
7
8传统的RDBMS
- 结构化组织
- SQL
- 数据和关系都存在单独的表中
- 操作,数据定义语言
- 严格的一致性
- 基础的事务
- ......1
2
3
4
5
6
7
8NoSQL
- 不仅仅是数据
- 没有固定的查询语言
- 键值对存储,列存储,文档存储,图像数据库(社交关系)
- 最终一致性
- CAP定理和BASE (异地多活)
- 高性能,高可用,高可扩展
- ......
3V + 3高
大数据时代的3V:主要是描述问题的
- 海量Volume
- 多样Variety
- 实时Velocity
大数据时代的3高:主要对程序的要求
- 高并发
- 高可拓
- 高性能
真正在公司中的实践:NoSQL+RDBMS一起使用才是最强的
阿里巴巴演进分析
如果你未来想当一个架构师:没有什么是加一层解决不了的
1 | # 1、商品的基本信息 |
NoSQL的四大类
KV键值对:
- 新浪:Redis
- 美团:Redis + Tair
- 阿里、百度:Redis + memcache
文档型数据库(bson格式和json一样):
- MongoDB(一般必须要掌握)
- MongoDB是一个基于分布式文件存储的数据库,C++编写,主要用来处理大量的文档!
- MongoDB是一个介于关系型数据库和非关系型数据库中间的产品,MongoDB是非关系型数据库中功能最丰富,最像关系型数据库的
- ConthDB
列存储数据库:
- HBase
- 分布式文件系统
图关系数据库:
- 不是存图形,而是存关系的,比如:朋友圈社交网络,广告推荐
- Neo4j,InfoGrid
Redis入门
概述
Redis是什么?
Redis(Remote Dictionary Server ),即远程字典服务
是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API
免费和开源,当下最热门的NoSQL技术之一,也被人们称之为结构化数据库
Redis能干嘛?
- 内存存储、持久化,内存中是断电即失、所以说持久化很重要(rdb、aof)
- 效率高,可以用于高速缓存
- 发布订阅系统
- 地图信息分析
- 计时器、计数器(浏览量)
- ……
特性
- 多样的数据类型
- 持久化
- 集群
- 事务
- ……
主要:Windows在GitHub上下载(停更很久了)
Redis推荐都是在Linux服务器上搭建的。
Linux安装
下载安装包 redis-6.2.6.tar.gz
解压安装包

进入解压后的文件夹,可以看到我们redis的配置文件

基本的环境安装
1
2
3
4
5yum install gcc-c++
make
make install

Redis的默认安装路径 /usr/local/bin

将Redis配置文件复制到我们当前目录下

Redis默认不是后台启动的,修改配置文件

启动Redis服务

使用redis-cli进行连接测试

查看redis的进程是否开启

关闭Redis服务

测试性能
redis-benchmark是一个压力测试工具
官方自带的性能测试工具
redis-benchmark命令参数
图片来自菜鸟教程:

测试
1 | # 测试:100个并发连接 100000请求 |


如何查看这些分析呢?
基础知识
redis默认有16个数据库

默认使用的是第0个
可以使用select进行切换
1 | [root@VM-24-12-centos cconfig]# redis-cli |

1 | 127.0.0.1:6379[3]> keys * |
清楚当前数据库flushdb
1 | 127.0.0.1:6379[3]> flushdb |
清楚全部数据库的内容FLUSHALL
1 | 127.0.0.1:6379[3]> FLUSHALL |
Redis是单线程的!
Redis是很快的,官方表示,Redis是基于内存操作,CPU不是Redis性能瓶颈,Redis的瓶颈是根据机器的内存和网络带宽,既然可以使用单线程来实现,就用单线程了。
Redis是C语言写的,官方提供的数据为100000+的QPS,完全不比同样是用于key-value的Memecache差。
Redis为什么单线程还那么快?
- 误区1:高性能的服务器一定是多线程的?
- 误区2:多线程(CPU上下文会切换)一定比单线程效率高
核心:redis是将多有的数据全部放在内存中的,所以说使用单线程去操作效率就是最高的,多线程(CPU上下文会切换:耗时的操作),对于内存系统来说,如果没有上下文切换效率就是最高的,多次读写都是在一个CPU上的,在内存情况下,这个就是最佳的方案。
五大数据类型
官网文档

全段翻译:
Redis 是一个开源(BSD许可)的,内存中的数据结构存储系统,它可以用作数据库、缓存和消息中间件。 它支持多种类型的数据结构,如 字符串(strings), 散列(hashes), 列表(lists), 集合(sets), 有序集合(sorted sets) 与范围查询, bitmaps, hyperloglogs 和 地理空间(geospatial) 索引半径查询。 Redis 内置了 复制(replication),LUA脚本(Lua scripting), LRU驱动事件(LRU eviction),事务(transactions) 和不同级别的 磁盘持久化(persistence), 并通过 Redis哨兵(Sentinel)和自动 分区(Cluster)提供高可用性(high availability)。
Redis-Key
1 | 127.0.0.1:6379> ping |
String
1 | 127.0.0.1:6379> set key1 v1 # 设置值 |
String类似的使用场景:value除了是我们的字符串还可以是我们的数字
- 计数器
- 统计多单位的数量
- 粉丝数
- 对象缓冲存储
List
基本的数据类型,列表

在redis里,我们可以把list玩成栈、队列阻塞队列。
所有的list命令都是l开头的,redis不区分大小写命令
1 | ########################## |
小结
- 实际上是一个链表
- 如果可以不存在,创建新的链表
- 如果可以存在,新增内容
- 如果移除了所有值,空链表,也代表不存在
- 在两边插入或者改动值,效率最高,中间元素,相对来说效率会低一点
Set(集合)
set中的值是不能重复的
1 | 127.0.0.1:6379> sadd myset "hello" # set集合中添加元素 |
Hash
Map集合,key-Map(相当于key-(key-value))
1 | 127.0.0.1:6379> hset myhash field1 codechen # set一个具体key-value |
hash变更的数据 user name age,尤其是用户信息之类的,经常变动的信息,hash更适合于对象的存储,String更适合字符串存储
Zset(有序集合)
在set的基础上,增加了一个值,set k1 v1 zset k1 score1 v1
1 | 127.0.0.1:6379> zadd myset 1 one # 添加一个值 |
三种特殊数据类型
geospatial地理位置
朋友的定位,附近的人,打车距离计算?
Redis的Geo在Redis3.2版本就推出了。这个功能可以推算地理位置的信息,两地之间的距离,方圆几里的人!
getadd
1 | # getadd 添加地理位置 |
getpos
1 | 127.0.0.1:6379> geopos china:city beijing # 获取指定城市的经度纬度 |
deodist
两人之间的距离
单位:
- m表示单位为米
- km表示单位为千米
- mi表示单位为英里
- ft表示单位为英尺
1 | 127.0.0.1:6379> geodist china:city beijing shanghai |
georadius
找附近的人?(获得所有附近的人的地址,定位)通过半径来查询
获得指定数量的人
所有数据应该都录入:china:city,才会让结果更加清晰
1 | 127.0.0.1:6379> GEORADIUS china:city 110 30 1000 km # 以110,30这个经纬度为中心,寻找方圆1000km以内的城市 |
GEORADIUSBYMEMBER
1 | # 找出位于指定元素周围的其他元素 |
DEOHASH命令-返回一个或多个位置元素的Geohash表示
该命令将返回11个字符的Geohash字符串
1 | # 将二维的经纬度转换为一维的字符串,如果两个字符串越接近,那么则距离越近 |
geo底层的实现原理其实就是Zset,我们可以使用Zset命令操作Geo
1 | 127.0.0.1:6379> geohash china:city beijing chongqing |
Hyperloglog
基数
简介
Redis 2.8.9版本就更新了Hyperloglog数据结构
Redis Hyperloglog 基数统计的算法
优点:占用的内存是固定,2^64不同的元素的技术,只需要12kb内存,如果要从内存角度来比较的话Hyperloglog首选。
网页的UV(一个人访问一个网站多次,但是还是算作一个人)
传统的方式,set保存用户的id,然后就可以统计set中的元素数量作为标准判断
这个方式如果保存大量的用户id,就会比较麻烦,我们的目的是为了技术,而不是保存用户id;
0.81错误率!统计UV任务,可以忽略不计的
测试使用
1 | 127.0.0.1:6379> pfadd mykey a b c d e f g h i j # 创建第一组元素mykey |
如果允许容错,那么一定可以使用Hyperloglog
如果不允许容错,就使用set或者自己的数据类型即可
Bitmaps
位存储
统计用户信息,活跃,不活跃!登录、未登录!打卡,365打卡!两个状态的,都可以使用Bitmaps!
Bitmaps位图,数据结构,都是操作二进制位来进行记录,就只有0和1
使用bitmap来记录周一到周日的打卡
1 | 127.0.0.1:6379> setbit sign 0 1 |
查看某一天是否打卡
1 | 127.0.0.1:6379> getbit sign 3 |
统计操作,统计打卡的天数
1 | 127.0.0.1:6379> bitcount sign # 统计这周的打卡记录 |
事务
Redis事务本质:一组命令的集合!一个事务中的所有命令都会被序列化,在事务执行过程中,会按照顺序执行!
一次性、顺序性、排他性!执行一系列的命令
1 | ----- 队列 set set set 执行 ----- |
Redis事务没有隔离级别的概念
所有的命令在事务中,并没有直接被执行!只有发起执行命令的时候才会执行
Redis单条命令是保存原子性的,但是事务不保证原子性的
redis的事务:
- 开启事务(multi)
- 命令入队(其他命令)
- 执行事务(exec)
正常执行事务
1 | 127.0.0.1:6379> multi # 开启事务 |
放弃事务
1 | 127.0.0.1:6379> multi |
编译型异常(代码有问题!命令有错),事务中所有的命令都不会被执行
1 | 127.0.0.1:6379> multi |
运行时异常(1/0),如果事务队列中存在语法性,那么执行命令的时候,其他命令是可以正常执行的,错误命令抛出异常
1 | 127.0.0.1:6379> set k1 "v1" |
监控
悲观锁:
- 很悲观,认为什么时候都会出问题,无论做什么都会加锁
乐观锁:
- 很乐观,认为什么时候都不会出问题,所以不会上锁,更新数据的时候去判断一下,在此期间是否有人修改过这个数据
- 获取version
- 更新的时候比较version
Redis监视测试
1 | 127.0.0.1:6379> set money 100 |
测试多线程修改值,使用watch可以当做redis的乐观锁操作
1 | 127.0.0.1:6379> watch money |
Jedis
使用Java来操作Redis
什么是Jedis时候Redis官方推荐的java连接开发工具,使用Java操作Redis中间件,如果你要使用java操作redis,那么一定要对Jedis十分的熟悉
Redis.conf详解
单位

- 配置文件unit单位对大小写不敏感
包含

可以把多个配置文件配置过来
网络
1 | bind 127.0.0.1 -::1 # 绑定的ip |
通用GENERAL
1 | daemonize yes # 以守护进程的方式运行,默认是no,需要手动配置为yes |
快照SNAPSHOTTING
持久化,在规定的时间内,执行多少次操作,则会持久化到文件
Redis是内存数据库,如果没有持久化,那么数据断电即失!
1 | # 如果3600内,如果至少有1个key进行了修改,我们就进行持久化操作 |
REPLICATION复制
SECURITY
可以在这里设置redis的密码,默认是没有密码的
1 | 127.0.0.1:6379> config get requirepass # 获取密码 |
限制CLIENTS
1 | maxclients 10000 # 默认最大客户端数量 |
APPEND ONLY 模式 aof配置
1 | appendonly no # 默认是不开启aof模式的,默认是使用rdb方式持久化的,在大部分的情况下,rdb完全够用 |
Redis持久化
面试和工作,持久化都是重点!
Redis是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出,服务器中的数据库状态也会消失,。所以Redis提供了持久化功能
RDB(Redis DataBase)
什么是RDB

在指定的时间间隔呢内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存里。
Redis会单独创建(fork)一个子进程类进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。我们默认的就是RDB,一般情况下不需要修改这个配置。
RDB配置保存的是dump.rdb,都是在我们的配置文件中快照中进行配置的


触发机制
- save的规则满足的情况下,会自动触发rdb规则
- 执行flushall命令,也会触发我们的rdb规则
- 退出redis,也会产生rdb文件
备份就会自动生成一个dump.rdb
恢复rdb文件
- 只需要将rdb文件放在我们redis启动目录就可以,redis启动的时候会自动检查dump.rdb恢复其中的数据
- 查看需要存放的位置
1 | 127.0.0.1:6379> config get dir |
优点:
- 适合大规模的数据恢复
- 对数据的完整性不高
缺点:
- 需要一定的时间间隔进程操作,如果redis意外宕机了,这个最后一次修改数据就没有了
- fork进程的时候,会占用一定的内容空间
AOF(Append Only File)
将我们的所有命令都记录下来,history,恢复的时候就把这个文件全部再执行一遍!
是什么

以日志的形式来记录每个写操作,将Redis执行过程的所有指令都记录下来(读操作不记录),只许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据,换言之,redis重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作
Aof保存的是appendonly.aof文件
append

默认是不开启的,需要手动改成yes
重启,redis就可以生效了
优点:
- 每次修改都同步,文件的完整或更好
- 每秒同步一次,可能会丢失一秒的数据
- 从不同步,效率最高的
缺点:
- 相对于数据文件来说,aof远远大于rdb,修复的速度也比rdb慢
- aof运行效率也要比rdb慢,所以我们redis默认的配置就是rdb持久化
扩展:
- RDB持久化方式能够在指定的时间间隔内对你的数据进行快照存储
- AOF持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以Redis协议追加保存每次写的操作到文件末尾,Redis还能对AOF文件进行后台重写,使得AOF文件的体积不至于过大
- 只做缓存,如果你只希望你的数据在服务器运行的时候存在,你也可以不适用任何持久化
- 同时开启两种持久化方式
- 在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整
- RDB的数据不实时,同时使用两者时服务器重启也只会找AOF文件,那要不要只使用AOF呢?作者建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),快速重启,而且不会有AOF可能潜在的Bug,留着作为一个万一的手段
- 性能建议
- 因为RDB文件只用做后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够了,只保留save 900 1这条规则
- 如果Enable AOF,好处是在最恶情况下也只会丢失不超过两秒数据,启动脚本较简单只load自己的AOF文件就可以了,代价一式带来了持续的IO,二是AOF rewrite的最后将rewrite过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite的频率,AOF重写的基础大小默认值64M太小了,可以设到5G以上,默认超过原大小100%大小重写可以改到适当的数值
- 如果不Enable AOF,仅靠Master-Slave Replication实现高可用性也可以,能省掉一大笔IO,也减少了rewrite时带来的系统波动。代价是如果Master/Slave同时倒掉,会丢失十几分钟的数据,启动脚本也要比较两个Master/Slave中的RDB问文件,载入新的那个,微博就是这种架构。
Redis发布订阅
Redis发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接受消息。
Redis客户端可以订阅任意数量的频道
订阅/发布消息图:
第一个:消息发送者;第二个:频道;第三个:消息订阅者

下图展示了频道channel1,以及订阅这个频道的三个客户端——client2、client5和client1之间的关系:

当有新消息通过PUBLISH命令发送给频道channel1时,这个消息就会被发送给订阅它的三个客户端:

命令
这些命令被广泛用于构建即时通信应用,比如网络聊天室(chatroom)和实时广播、实时提醒等。

测试
订阅端
1 | 127.0.0.1:6379> SUBSCRIBE codechen # 订阅一个频道 |
发送端
1 | 127.0.0.1:6379> PUBLISH codechen "hello,codechen" # 发布者发布消息到频道 |
原理
Redis是使用C实现的,通过分析Redis源码里的pubsub.c文件,了解发布和订阅机制的底层实现,籍此加深对Redis的理解。
Redis通过PUBLISH 、SUBSCRIBE和PSUBSCRIBE等命令实现发布和订阅功能。
通过SUBSCRIBE命令订阅某频道后,redis-server里维护了一个字典,字典的键就是一个个channel,而字典的值则是一个链表,链表中保存了所有订阅这个channel的客户端。SUBSCRIBE命令的关键,就是将客户端添加到给定 channel 的订阅链表中。
通过PUBLISH命令向订阅者发送消息,redis-server 会使用给定的频道作为键,在它所维护的channel字典中查找记录了订阅这个频道的所有客户端的链表,遍历这个链表,将消息发布给所有订阅者。
Pub/Sub从字面上理解就是发布( Publish )与订阅(Subscribe ),在Redis中,你可以设定对某一个key值进行消息发布及消息订阅,当一个key值上进行了消息发布后,所有订阅它的客户端都会收到相应的消息。这一功能最明显的用法就是用作实时消息系统,比如普通的即时聊天,群聊等功能。
使用场景
- 实时消息系统
- 实时聊天(频道当做聊天室,将消息显示给所有人即可)
- 订阅,关注系统都是可以的
稍微复杂的场景我们就会使用消息中间件MQ
Redis主从复制
概念
主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点(master/leader),后者称为从节点(slave/follower);数据的复制是单向的,只能由主节点到从节点。Master以写为主,Slave以读为主。
默认情况下,每台Redis服务器都是主节点;且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。
主从复制的作用主要包括:
- 数据冗余︰主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
- 故障恢复∶当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
- 负载均衡︰在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
- 高可用(集群)基石∶除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。
一般来说,要将Redis运用于工程项目中,只使用一台Redis是万万不能的(宕机),原因如下︰
从结构上,单个Redis服务器会发生单点故障,并且一台服务器需要处理所有的请求负载,压力较大;
从容量上,单个Redis服务器内存容量有限,就算一台Redis服务器内存容量为256G,也不能将所有内存用作Redis存储内存,一般来说,单台Redis最大使用内存不应该超过20G。
电商网站上的商品,一般都是一次上传,无数次浏览的,说专业点也就是”多读少写”。
对于这种场景,我们可以使用如下架构(一主三从):

主从复制,读写分离!80%的情况下都是在进行读操作!减缓服务器的压力,架构中经常使用,一主二从。
环境配置
只配置从库,不配置主库
1 | 127.0.0.1:6379> info replication # 查看当前库的信息 |
复制3个配置文件,然后修改对应的信息
- 端口
- pid名字
- log文件名字
- dump.rdb名字

修改后,启动三个redis服务器,通过进程查看。
一主二从
默认情况下,每台Redis服务器都是主节点;我们一般情况下只用配置从机就好了
一主(79)二从(80,81)
1 | 127.0.0.1:6380> SLAVEOF 127.0.0.1 6379 # SLAVEOF host 6379 |

真实的主从配置应该在配置文件中配置,这样才是永久的,命令配置是临时的。
细节
主机可以学,从机不能写,只能读。主机中的所有信息和数据,都会自动被从机保存!
主机写:

从机只能读取内容:

测试:主机断开连接,从机依旧连接到主机的,但是没有写操作,这个时候,主机如果回来了,从机依旧可以直接获取到主机写的信息!
如果是使用命令行配置的主从,这个时候如果重启了,就会变回主机!只要变为从机,立马就会从主机中获取值!
复制原理
Slave启动成功连接到master后会发送一个sync同步命令
Master接到命令,启动后台的存盘进程,同时收集所有接收到的用于修改数据集命令,在后台进程执行完毕之后,master将传送整个数据文件到slave,并完成一次完全同步。
全量复制:而slave服务在接收到数据库文件数据后,将其存盘并加载到内存中。
增量复制:Master继续将新的所有收集到的修改命令依次传给slave,完成同步
但是只要是重新连接master,一次完全同步(全量复制)将被自动执行
层层链路
上一个M连接下一个S

这个也可以完成我们的主从复制
如果没有老大了,这个时候能不能选择一个老大出来呢?
谋朝篡位
如果主机断开了连接,我们可以使用 SLAVEOF NO ONE让自己成为主机,其他的节点就可以手动连接到最新的这个主节点(手动)!如果这个时候老大修复了,那就重新连接
哨兵模式
(自动选举老大的模式)
概述
主从切换技术的方法是∶当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费事费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑哨兵模式。Redis从2.8开始正式提供了Sentinel (哨兵)架构来解决这个问题。
谋朝篡位的自动版,能够后台监控主机是否故障,如果故障了根据投票数自动将从库转换为主库。
哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待Redis服务器响应,从而监控运行的多个Redis实例。

这里的哨兵有两个作用
通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器。
当哨兵监测到master宕机,会自动将slave切换成master,然后通过发布订阅模式通知其他的从服务器,修改配置文件,让它们切换主机。
然而一个哨兵进程对Redis服务器进行监控,可能会出现问题,为此,我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式。

假设主服务器宕机,哨兵1先检测到这个结果,系统并不会马上进行failover过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象成为主观下线。当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover[故障转移]操作。切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这个过程称劝客观下线。
测试
目前是一主二从
配置哨兵配置文件sentinel.conf
1
2# sentinel monitor 被监控的名称 host port 1
sentinel monitor myredis 127.0.0.1 6379 1后面的这个数字1,代表主机挂了,slave投票决定让谁接替成为主机。
启动哨兵
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28[root@VM-24-12-centos cconfig]# redis-sentinel sentinel.conf
3512:X 21 Jan 2022 11:28:36.611 # oO0OoO0OoO0Oo Redis is starting oO0OoO0OoO0Oo
3512:X 21 Jan 2022 11:28:36.611 # Redis version=6.2.6, bits=64, commit=00000000, modified=0, pid=3512, just started
3512:X 21 Jan 2022 11:28:36.611 # Configuration loaded
3512:X 21 Jan 2022 11:28:36.612 * monotonic clock: POSIX clock_gettime
_._
_.-``__ ''-._
_.-`` `. `_. ''-._ Redis 6.2.6 (00000000/0) 64 bit
.-`` .-```. ```// _.,_ ''-._
( ' , .-` | `, ) Running in sentinel mode
|`-._`-...-` __...-.``-._|'` _.-'| Port: 26379
| `-._ `._ / _.-' | PID: 3512
`-._ `-._ `-./ _.-' _.-'
|`-._`-._ `-.__.-' _.-'_.-'|
| `-._`-._ _.-'_.-' | https://redis.io
`-._ `-._`-.__.-'_.-' _.-'
|`-._`-._ `-.__.-' _.-'_.-'|
| `-._`-._ _.-'_.-' |
`-._ `-._`-.__.-'_.-' _.-'
`-._ `-.__.-' _.-'
`-._ _.-'
`-.__.-'
3512:X 21 Jan 2022 11:28:36.612 # WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.
3512:X 21 Jan 2022 11:28:36.617 # Sentinel ID is 5f209051b2d5198664598db2478727744ac941c0
3512:X 21 Jan 2022 11:28:36.617 # +monitor master myredis 127.0.0.1 6379 quorum 1
3512:X 21 Jan 2022 11:28:36.618 * +slave slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
3512:X 21 Jan 2022 11:28:36.622 * +slave slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379如果master节点断开了,这个时候会从从机中随机选择一个服务器(有一个投票算法)

哨兵日志:

如果主机此时回来了,只能归并到新的主机下,当做从机,这就是哨兵模式的规则!
哨兵模式
优点:
- 哨兵集群,基于主从复制模型,所有的主从配置优点,它全有
- 主从可以切换,故障可以转移,系统的可用性就会更好
- 哨兵模式就是主从模式的升级,手动到自动,更加健壮
缺点:
- Redis不好在线扩容,集群容量一旦达到上限,在线扩容就十分麻烦
- 实现哨兵模式的配置其实是很麻烦的,里面有很多选择
哨兵模式的全部配置
Redis缓存穿透和雪崩
在这里我们不会详细的区分析解决方案的底层,(专题)
Redis缓存的使用,极大的提升了应用程序的性能和效率,特别是数据查询方面。但同时,它也带来了一些问题。其中,最要害的问题,就是数据的一致性问题,从严格意义上讲,这个问题无解。如果对数据的一致性要求很高,那么就不能使用缓存。
另外的一些典型问题就是,缓存穿透、缓存雪崩和缓存击穿。目前,业界也都有比较流行的解决方案
缓存穿透
概念
缓存穿透的概念很简单,用户想要查询一个数据,发现redis内存数据库没有,也就是缓存没有命中,于是向持久层数据库查询。发现也没有,于是本次查询失败。当用户很多的时候,缓存都没有命中,于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。
解决方案
布隆过滤器
布隆过滤器是一种数据结构,对所有可能查询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力;

缓存空对象
当存储层不命中后,即使返回的空对象也将其缓存起来,同时会设置一个过期时间,之后再访问这个数据将会从缓存中获取,保护了后端数据源;

但是这种方法会存在两个问题:
1、如果空值能够被缓存起来,这就意味着缓存需要更多的空间存储更多的键,因为这当中可能会有很多的空值的键;
2、即使对空值设置了过期时间,还是会存在缓存层和存储层的数据会有一段时间窗口的不一致,这对于需要保持一致性的业务会有影响。
缓存击穿(量太大,缓存过期)
概述
这里需要注意和缓存击穿的区别,缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞
当某个key在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,并且回写缓存,会导使数据库瞬间压力过大。
解决方案
设置热点数据永不过期
从缓存层面来看,没有设置过期时间,所以不会出现热点key过期后产生的问题。
加互斥锁
分布式锁︰使用分布式锁,保证对于每个key同时只有一个线程去查询后端服务,其他线程没有获得分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。
缓存雪崩
概念
缓存雪崩,是指在某一个时间段,缓存集中过期失效。Redis宕机!
产生雪崩的原因之一,比如在写本文的时候,马上就要到双十二零点,很快就会迎来一波抢购,这波商品时间比较集中的放入了缓存,假设缓存一个小时。那么到了凌晨一点钟的时候,这批商品的缓存就都过期了。而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力波峰。于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。

其实集中过期,倒不是非常致命,比较致命的缓存雪崩,是缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩,一定是在某个时间段集中创建缓存,这个时候,数据库也是可以顶住压力的。无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机,对数据库服务器造成的压力是不可预知的,很有可能瞬间就把数据库压垮。
解决方案
redis高可用
这个思想的含义是,既然redis有可能挂掉,那我多增设几台reds,这样一台挂掉之后其他的还可以继续工作,其实就是搭建的集群。
限流降级
这个解决方案的思想是,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。
数据预热
数据加热的含义就是在正式部署之前,我先把可能的数据先预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。
学习视频: