1. 缓存
热点数据(经常会被查询,但是不经常被修改或者删除的数据),首选是使用 Redis 缓存,毕竟强大的 QPS 和极强的稳定性不是所有类似工具都有的。
而且相比于 memcached 还提供了丰富的数据类型可以使用,另外,内存中的数据也提供了 AOF 和 RDB 等持久化机制可以选择,要冷、热的还是忽冷忽热的都可选。
结合具体应用需要注意一下:很多人用 spring 的 AOP 来构建 Redis 缓存的自动生产和清除,过程可能如下:
Select 数据库前查询 Redis,有的话使用 Redis 数据,放弃 select 数据库,没有的话,select 数据库,然后将数据插入 Redis
update 或者 delete 数据库前,查询 Redis 是否存在该数据,存在的话先删除 Redis 中数据,然后再 update 或者 delete 数据库中的数据
上面这种操作,如果并发量很小的情况下基本没问题,但是高并发的情况请注意下面场景:
为了 update 先删掉了 Redis 中的该数据,这时候另一个线程执行查询,发现 Redis 中没有,瞬间执行了查询 SQL,并且插入到 Redis 中一条数据,回到刚才那个 update 语句,这个悲催的线程压根不知道刚才那个该死的 select 线程犯了一个弥天大错!于是这个 Redis 中的错误数据就永远的存在了下去,直到下一个 update 或者 delete。
上面典型的脏缓存产生原因以及解决办法,可以参考陈皓写的一篇文章 《缓存更新的套路》, 从我个人的角度来讲,除了秒杀,如果业务上达到这个并发级别,相信可以从架构层面避免这个问题。
2. 计数器
诸如统计点击数等应用。由于单线程,可以避免并发问题,保证不会出错,而且 100% 毫秒级性能!爽。
命令:INCRBY
当然爽完了,别忘记持久化 (存到数据库或者本身 Redis 持久化),毕竟是 Redis 只是存了内存!
3. 队列
相当于消息系统,ActiveMQ,RocketMQ 等工具类似,但是个人觉得简单用一下还行,如果对于数据一致性要求高的话还是用 RocketMQ 等专业系统。
由于 Redis 把数据添加到队列是返回添加元素在队列的第几位,所以可以做判断用户是第几个访问这种业务
队列不仅可以把并发请求变成串行,并且还可以做队列或者栈使用
4. 位操作(大数据处理)
用于数据量上亿的场景下,例如几亿用户系统的签到,去重登录次数统计,某用户是否在线状态等等。
想想一下腾讯 10 亿用户,要几个毫秒内查询到某个用户是否在线,你能怎么做?千万别说给每个用户建立一个 key,然后挨个记(你可以算一下需要的内存会很恐怖,而且这种类似的需求很多,腾讯光这个得多花多少钱。。。)好吧。这里要用到位操作 —— 使用 setbit、getbit、bitcount 命令。
原理是:Redis 内构建一个足够长的数组,每个数组元素只能是 0 和 1 两个值,然后这个数组的下标 index 用来表示我们上面例子里面的用户 id(必须是数字哈),那么很显然,这个几亿长的大数组就能通过下标和元素值(0 和 1)来构建一个记忆系统,上面我说的几个场景也就能够实现。用到的命令是:setbit、getbit、bitcount
5. 分布式锁与单线程机制
验证前端的重复请求(可以自由扩展类似情况),可以通过 Redis 进行过滤:每次请求将 request Ip、参数、接口等 hash 作为 key 存储 Redis(幂等性请求),设置多长时间有效期,然后下次请求过来的时候先在 Redis 中检索有没有这个 key,进而验证是不是一定时间内过来的重复提交
秒杀系统,基于 Redis 是单线程特征,防止出现数据库 "爆破"
全局增量 ID 生成,类似 "秒杀"
6. 最新列表
例如新闻列表页面最新的新闻列表,如果总数量很大的情况下,尽量不要使用 select a from A limit 10 这种 low 货,尝试 Redis 的 LPUSH 命令构建 List,一个个顺序都塞进去就可以啦。不过万一内存清掉了咋办?也简单,查询不到存储 key 的话,用 mysql 查询并且初始化一个 List 到 Redis 中就好了。
7. 排行榜
谁得分高谁排名往上。命令:ZADD(有续集,sorted set)
其它常见的 web 应用场景
在主页中显示最新的项目列表
Redis 使用的是常驻内存的缓存,速度非常快。lpush 用来插入一个内容 id,作为关键字存储在列表头部。ltrim 用来限制列表中的项目数最多为 5000。如果用户需要的检索的数据量超越这个缓存容量,这时才需要把请求发送到数据库。
排行榜及相关问题
排行榜(leader board)按照得分进行排序。zadd 命令可以直接实现这个功能,而 zrevrange 命令可以用来按照得分来获取前 100 名的用户,zrank 可以用来获取用户排名,非常直接而且操作容易。
- 按照用户投票和时间排序
这就像 reddit 的排行榜,得分会随着时间变化。lpush 和 ltrim 命令结合运用,把文章添加到一个列表中。一项后台任务用来获取列表,并重新计算列表的排序,zadd 命令用来按照新的顺序填充生成列表。列表可以实现非常快速的检索,即使是负载很重的站点。