基础的数据结构（五种基础数据结构及应用场景）

缺爱的孩纸 2022-10-27 21:23:50

Redis 有 5 种基础数据结构，分别为：string (字符串)、list (列表)、set (集合)、hash (哈希) 和 zset (有序集合)。

基础的数据结构（五种基础数据结构及应用场景）(1)

一. string (字符串)

字符串 string 是 Redis 最简单的数据结构。Redis 所有的数据结构都是以唯一的 key 字符串作为名称，然后通过这个唯一 key 值来获取相应的 value 数据。不同类型的数据结构的差异就在于 value 的结构不一样。字符串结构使用非常广泛，一个常见的用途就是缓存用户信息。我们将用户信息结构体使用 JSON 序列化成字符串，然后将序列化后的字符串塞进 Redis 来缓存。同样，取用户信息会经过一次反序列化的过程。

1. string的常用操作（1）键值对

# 存入字符串键值对 set key value # 获取一个字符串键值对 get key # 删除 del key 复制代码

（2）批量操作键值对

可以批量对多个字符串进行读写，节省网络耗时开销

# 批量存储字符串键值对 mset ket value [key value .....] # 批量获取字符串键值对 mget key [key ......] 复制代码

（3）过期和 set 命令扩展

# 设置一个键(key)的过期时间(seconds) expire key seconds # setex 等价于 set expire setex key seconds value # 存入一个不存在的字符串键值对 setnx key value 复制代码

基础的数据结构（五种基础数据结构及应用场景）(2)

（4）原子操作

如果 value 值是一个整数，还可以对它进行自增操作。自增是有范围的，它的范围是 signed long 的最大最小值，超过了这个值，Redis 会报错

# 将 key 中存储的值加1 incr key # 将 key 中存储的值减1 decr key # 将 key 中存储的值加increment incrby key increment # 将 key 中存储的值减decrement decrby key decrement 复制代码

基础的数据结构（五种基础数据结构及应用场景）(3)

2. string的应用场景

Redis应用场景：常规key-value缓存应用、常规计数：微信公众号阅读次数，粉丝数等、分布式锁等

（1）单值缓存

set key value get key 复制代码

（2）对象缓存

基础的数据结构（五种基础数据结构及应用场景）(4)

set user:1 value(json格式数据) mset user:1:name zhuge user:1:balance 1888 mget user:1:name user:1:balance 复制代码

（3）计数器

基础的数据结构（五种基础数据结构及应用场景）(5)

incr article:readcount:{文章id} get article:readcount:{文章id} 复制代码

（4）分布式锁（5）web集群session共享

这里推荐王松大神的一篇文章： wangsong.blog.csdn.net/article/det…

（6）分布式系统全局序列号

redis批量生成序列号提升性能

二. hash (哈希)

String类型存储的困惑

对象类数据的存储如果具有较为频繁的更新需求，操作会显得笨重，存容易，改麻烦。
为了区别与Redis中的键值对的称呼，hash中的键成为field，而key特指Redis的键。

基础的数据结构（五种基础数据结构及应用场景）(6)

hash类型

新的存储需求：对一系列存储的数据进行编组，方便管理，典型应用存储对象信息
需要的内存结构：一个存储空间保存多少个键值对数据
hash类型：底层使用哈希表结构实现数据存储，相当于 Java 语言里面的 HashMap，它是无序字典。内部实现结构上同 Java 的HashMap 也是一致的，同样的数组链表二维结构。第一维 hash 的数组位置碰撞时，就会将碰撞的元素使用链表串接起来。

1. hash的常用操作（1）操作单个数据

# 添加修改数据 hset key field value # 获取数据 hget key field # 删除数据 hdel key field1 [field2 ...] 复制代码

（2）操作多个数据

# 添加/修改多个数据 hmset key field1 value1 field2 calue2 #获取多个数据 hmget key field1 field2 … # 获取哈希表key中field的数量 hlen key # 获取哈希表key中所有的键值 hgetall key # 获取哈希表中是否存在指定的字段 hexists key field 复制代码

（3）原子操作

# 将 field 中存储的值加 increment hincrby key field increment # float 值 hincrbyfloat key field increment 复制代码

2. hash的应用场景（1）对象缓存

基础的数据结构（五种基础数据结构及应用场景）(7)

hmset user {userId}:name value {userId}:balance value hmset user {1}:name zhuge {1}:balance 1888 复制代码

（2）购物车

业务场景：电商网站购物车的设计与实现。

基础的数据结构（五种基础数据结构及应用场景）(8)

解决方案：
以客户id作为key，每位用户创建一个hash存储结构存储对应的购物车信息。
将商品编号作为field，购买数量作为value进行存储。
添加商品：追加全新的field与value。 hset cart:101 1001 1
浏览：遍历hash。 hgetall cart:101
更改数量：自增/自减，设置value值。 hincrby cart:101 1001 1
删除商品：删除field。 hdel cart:101 1001
清空：删除key。

3. hash的优缺点

优点

同类数据归类整合储存，方便数据管理。
相比string操作消耗内存与cpu更小。
相比string储存更节省空间。

缺点

过期功能不能使用在field上，只能用在key上。
Redis集群架构下不适合大规模使用。

redis集群架构

基础的数据结构（五种基础数据结构及应用场景）(9)

三. List（列表）

数据存储需求：存储多个数据，并对数据进入存储空间的顺序进行区分
需要的存储数据：一个存储空间保存多个数据，且通过数据可以体现进入顺序
list类型：保存多个数据，底层使用 双向链表 存储结构实现

1. list的常用操作（1）添加/修改数据

# 将一个或多个值value插入到key列表的表头（最左边） lpush key value1 [value2 …] # 将一个或多个值value插入到key列表的表尾（最右边） rpush key value1 [value2 …] 复制代码

（2）获取并移除数据

# 移除并返回key列表的头元素 lpop key # 移除并返回key列表的尾元素 rpop key 复制代码

（3）获取数据

# 获取列表key中指定区间内的元素，从左数第start到stop个元素，从0开始 lrange key start stop # 查询第i个元素 lindex key index # list的长度 llen key 复制代码

（4）规定时间内获取并移除数据

# 从key列表表头弹出一个元素，若列表中没有元素，阻塞等待timeout秒，如果timeout=0，一直阻塞等待 blpop key1 [key2 ...] timeout # 从key列表表尾弹出一个元素，若列表中没有元素，阻塞等待timeout秒，如果timeout=0，一直阻塞等待 brpop key1 [key2 ...] timeout 复制代码

开两个客户端，一个设置15s内获取list1中的值，此时list1位空一直等待(阻塞)，在15秒内另一个客户端存入到list1中数据，此时就被获取到。

（5）移除指定数据

# 根据参数count的值，移除列表中与参数value相等的元素。count为移除的数量，value为移除哪个值 lrem key count value 复制代码

2. 常用数据结构

Stack(栈) = lpush lpop → filo
Queue(队列) = lpush rpop
Blocking MQ(阻塞队列) = lpush brpop

3. list的应用场景（1）最新消息的展示

业务场景

新浪微博、twitter中个人用于的关注列表需要按照用户的关注顺序进行展示，粉丝列表需要将最近关注的粉丝列在前面。
公众号、新闻、资讯类网站如何将最新的新闻或资讯按照发生的事件顺序展示。
企业运营过程中，系统将产生出大量的运营数据，如何保障堕胎服务器操作日志的统一顺序输出？

解决方案

依赖list的数据具有顺序的特征对信息进行管理。
使用队列模型解决多路信息汇总合并的问题。
使用栈模型解决最新消息的问题。

# 河北日报发了消息，消息id为1 lpush msg:user_id 1 # 央视网发了消息，消息id为2 lpush msg:user_id 2 # 查看最新公众号消息 lrange msg:user_id 0 5 复制代码

四. set（集合）

新的存储需求：存储大量的数据，在查询方面提供更高的效率
需要的存储结构：能够保存大量的数据，高效的内部存储机制，便于查询
set类型：与hash存储结构完全相同，仅存储键，不存储值（nil)，并且值是不允许重复的。也就是只有键没有值的hash

1. set的常用操作（1）添加数据

# 将一个或多个member元素加入到集合key当中，已经存在于集合的member元素将被忽略。若key不存在，则创建一个只包含member元素作成员的集合 sadd key member [member ...] 复制代码

（2）获取数据

# 获取集合 key 中的所有成员 smembers key # 获取集合key中元素的数量 scard key # 判断集合key中是否存在member元素 sismember key member # 获取集合key中的count个随机元素，并从集合key中移除 spop key [count] # 获取集合key中的count个随机元素，不从集合key中移除 srandmember key [count] 复制代码

（3）删除数据

# 移除集合 key 中的一个或多个 member 元素，不存在的 member 元素会被忽略 srem key member [member ...] 复制代码

2. set的运算操作（1）交集

返回一个集合的全部成员，该集合是所有给定集合的交集。 sinter key

代码示例：

redis> smembers group_1 1) "LI LEI" 2) "TOM" 3) "JACK" redis> smembers group_2 1) "HAN MEIMEI" 2) "JACK" redis> sinter group_1 group_2 1) "JACK" 复制代码

将交集结果保存到destination集合，如果destination集合已经存在，则将其覆盖。destination可以是key本身。 sinterstore destination key [key …]

代码示例：

redis> smembers songs 1) "good bye joe" 2) "hello,peter" redis> smembers my_songs 1) "good bye joe" 2) "falling" redis> sintrestore song_interset songs my_songs (integer) 1 redis> smembers song_interset 1) "good bye joe" 复制代码

（2）并集

返回一个集合的全部成员，该集合是所有给定集合的并集。 sunion key [key ...]

代码示例：

redis> smembers songs 1) "Billie Jean" redis> smembers my_songs 1) "Believe Me" redis> sunion songs my_songs 1) "Billie Jean" 2) "Believe Me" 复制代码

将并集结果保存到destination集合，如果destination集合已经存在，则将其覆盖。destination可以是key本身。 sunionstore destination key [key …]

代码示例：

redis> smembers NoSQL 1) "MongoDB" 2) "Redis" redis> smembers SQL 1) "sqlite" 2) "MySQL" redis> sunionstore db NoSQL SQL (integer) 4 redis> smembers db 1) "MySQL" 2) "sqlite" 3) "MongoDB" 4) "Redis" 复制代码

（3）差集

返回一个集合的全部成员，该集合是所有给定集合之间的差集。 sdiff key [key ...]

代码示例：

redis> smembers peters_movies 1) "bet man" 2) "start war" 3) "2012" redis> smembers joes_movies 1) "hi, lady" 2) "Fast Five" 3) "2012" redis> sdiff peters_movies joes_movies 1) "bet man" 2) "start war" 复制代码

将差集结果保存到destination集合，如果destination集合已经存在，则将其覆盖。destination可以是key本身。 sdiffstore destination key [key …]

代码示例：

redis> smembers joes_movies 1) "hi, lady" 2) "Fast Five" 3) "2012" redis> smembers peters_movies 1) "bet man" 2) "start war" 3) "2012" redis> sdiffstore joe_diff_peter joes_movies peters_movies (integer) 2 redis> smembers joe_diff_peter 1) "hi, lady" 2) "Fast Five" 复制代码

3. set的应用场景（1）微信抽奖小程序

基础的数据结构（五种基础数据结构及应用场景）(10)

点击参加抽奖加入set集合

sadd key {user_id} 复制代码

查看参与抽奖所有用户

smembers key 复制代码

抽取count名中奖者

srandmember key [count] / spop key [count] 复制代码

（2）随机推荐

redis应用于随机推荐类信息检索，例如热点歌单推荐，热点新闻推荐，热点旅游线路，应用APP推荐，大V推荐等。

业务场景：

每位用户首次使用进入头条时候会设置3项爱好的内容，但是后期为了增加用户的活跃度，兴趣点，必须让用户对其他信息类别逐渐产生兴趣，增加客户留存度，如何实现？

业务分析：

系统分析出各个分类的最新或最热点信息条目并组织成set集合
随机挑选其中部分信息
配合用户关注信息分类中的热点信息组织展示的全信息集合

解决方案：

随机获取集合中指定数量的数据

srandmember key [count] 复制代码

随机获取集合中的某个数据并将该数据移出集合

spop key 复制代码

（3）共同好友

脉脉为了促进用户间的交流，保障业务成单率的提升，需要让每位用户拥有大量的好友，事实上职场新人不具有更多的职场好友，如何快速为用户积累更多的好友？
新浪微博为了增加用户热度,提高用户留存性，需要微博用户在关注更多的人，以此获得更多的信息或热门话题，如何提高用户关注他人的总量？
QQ新用户入网年龄越来越低，这些用户的朋友圈交际圈非常小，往往集中在一所学校甚至一个班级中，如何帮助用户快速积累好友用户带来更多的活跃度？
微信公众号是微信信息流通的渠道之一，增加用户关注的公众号成为提高用户活跃度的一种方式，如何帮助用户积累更多关注的公众号？
美团外卖为了提升成单量，必须帮助用户挖掘美食需求，如何推荐给用户最适合自己的美食？解决方案：

# 我关注的人 redis> smembers mySet 1) "zhuge" 2) "yangguo" 3) "sima" # 杨过关注的人 redis> smembers yangguoSet 1) "zhuge" 2) "sima" 3) "luban" 4) "guojia" # 司马关注的人 redis> smembers simaSet 1) "zhuge" 2) "yangguo" 3) "guojia" 4) "luban" 5) "xunyu" 复制代码

共同关注

# 我和杨过共同关注 redis> sinter yangguoSet mySet 1) "zhuge" 2) "sima" 复制代码

我关注的人也关注他

# 我关注的人也关注杨过 redis> sismember simaSet yangguo (integer) 1 复制代码

我可能认识的人

redis> sdiff mySet yangguoSet 1) "luban" 2) "guojia" 复制代码

（4）访问量统计去重

公司对旗下新的网站做推广，统计网站的PV (访问量)，UV (独立访客)，IP (独立IP)。

PV：网站被访问次数，可通过刷新页面提高访问量。
UV：网站被不同用户访问的次数，可通过cookie统计访问量，相同用户切换IP地址，UV不变。
IP：网站被不同IP地址访问的总次数，可通过IP地址统计访问量，相同IP不同用户访问，IP不变。

解决方案：

针对不同的统计类型有不同的数据存储方式：

利用set集合的数据去重特征，记录各种访问数据
建立string类型数据，利用incr统计日访问量（PV)
建立set模型，记录不同cookie数量（UV)
建立set模型，记录不用IP数量（IP)

（5）黑白名单黑名单：

资讯类信息类网站追求高访问量，但是由于其信息的价值，往往容易被不法分子利用，通过爬虫技术，快速获取信息，个别特种行业网站信息通过爬虫获取分析后，可以转换成商业机密进行出售。例如第三方火车票、机票、酒店刷票代购软件、电商刷评论、刷好评。同时爬虫带来的伪流量也会给经营者带来错觉，产生错误的决策，有效避免网站被爬虫反复爬取成为每个网站都要考虑的基本问题。在基于技术层面区分出爬虫用户后，需要将此类用户进行有效的屏蔽，这就是黑名单的典型应用。 ps：不是说爬虫一定做摧毁性的工作，有些小型网站需要爬虫为其带来一些流量。

白名单：

对于安全性更高的应用访问，仅仅靠黑名单是不能解决安全问题的，此时需要设定可访问的用户群体，依赖白名单做更为苛刻的访问验证。

解决方案：

基于经营战略设定问题用户发现、鉴别规则
周期性更新满足规则的用户黑名单，加入set集合
用户行为信息达到后与黑名单进行比对，确认行为去向
黑名单过滤IP地址：应用于开放游客访问权限的信息源
黑名单过滤设备信息：应用于限定访问设备的信息源
黑名单过滤用户：应用于基于访问权限的信息源

五. sorted_set（有序集合）

新的存储需求：根据排序有利于数据的有效显示，需要提供一种可以根据自身特征进行排序的方式。
需要的存储结构：新的存储模型，可以保存可排序的数据。
zset类型：在set的存储结构基础上添加可排序字段。

1. sorted_set的常用操作（1）添加数据

# 将一个或多个 member 元素及其 score 值加入到有序集 key 当中。 zadd key score member [[score member] [score member] …] 复制代码

如果某个 member 已经是有序集的成员，那么更新这个 member 的 score 值，并通过重新插入这个 member元素，来保证该 member 在正确的位置上。
score 值可以是整数值或双精度浮点数。
如果 key 不存在，则创建一个空的有序集并执行 ZADD 操作。
当 key 存在但不是有序集类型时，返回一个错误。

（2）获取数据

# 获取有序集 key 中，成员 member 的 score 值 zscore key member # 获取有序集 key 的成员的数量。 zcard key # 获取有序集 key 中， score 值在 min 和 max 之间(默认包括 score 值等于 min 或 max )的成员的数量。 zcount key min max 复制代码

# 正序（从小到大）获取有序集 key 中，指定区间内[start到stop]的成员。 zrange key start stop [WITHSCORES] # 倒序（从大到小）获取有序集 key 中，指定区间内[start到stop]的成员。 zrevrange key start stop [WITHSCORES] 复制代码

下标参数 start 和 stop 都以 0 为底，也就是说，以 0 表示有序集第一个成员，以 1 表示有序集第二个成员，以此类推。你也可以使用负数下标，以 -1 表示最后一个成员， -2 表示倒数第二个成员，以此类推。
超出范围的下标并不会引起错误。比如说，当 start 的值比有序集的最大下标还要大，或是 start > stop 时， zrange命令只是简单地返回一个空列表。另一方面，假如 stop 参数的值比有序集的最大下标还要大，那么 Redis 将 stop 当作最大下标来处理。

（3）删除数据

# 移除有序集 key 中的一个或多个成员，不存在的成员将被忽略。 zrem key member [member …] 复制代码

条件删除

# 移除有序集 key 中，指定排名(rank)区间内的所有成员。 zremrangebyrank key start stop # 移除有序集 key 中，所有 score 值介于 min 和 max 之间(包括等于 min 或 max )的成员。 zremrangebyscore key min max 复制代码

示例：

redis> ZADD salary 2000 jack (integer) 1 redis> ZADD salary 5000 tom (integer) 1 redis> ZADD salary 3500 peter (integer) 1 redis> ZREMRANGEBYRANK salary 0 1 # 移除下标 0 至 1 区间内的成员 (integer) 2 redis> ZRANGE salary 0 -1 WITHSCORES # 有序集只剩下一个成员 1) "tom" 2) "5000" 复制代码

redis> ZRANGE salary 0 -1 WITHSCORES # 显示有序集内所有成员及其 score 值 1) "tom" 2) "2000" 3) "peter" 4) "3500" 5) "jack" 6) "5000" redis> ZREMRANGEBYSCORE salary 1500 3500 # 移除所有薪水在 1500 到 3500 内的员工 (integer) 2 redis> ZRANGE salary 0 -1 WITHSCORES # 剩下的有序集成员 1) "jack" 2) "5000" 复制代码

（4）原子操作

# 为有序集 key 的成员 member 的 score 值加上增量 increment 。 zincrby key increment member 复制代码

示例：

redis> ZSCORE salary tom "2000" redis> ZINCRBY salary 2000 tom # tom 加薪啦！ "4000" 复制代码

2. sorted_set集合操作（1）并集

# 计算给定的一个或多个有序集的并集，其中给定 key 的数量必须以 numkeys 参数指定，并将该并集(结果集)储存到 destination 。 zunionstore destination numkeys key [key …] 复制代码

示例：

redis> ZRANGE programmer 0 -1 WITHSCORES 1) "peter" 2) "2000" 3) "jack" 4) "3500" 5) "tom" 6) "5000" redis> ZRANGE manager 0 -1 WITHSCORES 1) "herry" 2) "2000" 3) "mary" 4) "3500" 5) "bob" 6) "4000" redis> ZUNIONSTORE salary 2 programmer manager WEIGHTS 1 3 # 公司决定加薪。。。除了程序员。。。 (integer) 6 redis> ZRANGE salary 0 -1 WITHSCORES 1) "peter" 2) "2000" 3) "jack" 4) "3500" 5) "tom" 6) "5000" 7) "herry" 8) "6000" 9) "mary" 10) "10500" 11) "bob" 12) "12000" 复制代码

（2）交集

# 计算给定的一个或多个有序集的交集，其中给定 key 的数量必须以 numkeys 参数指定，并将该交集(结果集)储存到 destination 。 zinterstore destination numkeys key [key …] 复制代码

示例：

redis > ZADD mid_test 70 "Li Lei" (integer) 1 redis > ZADD mid_test 70 "Han Meimei" (integer) 1 redis > ZADD mid_test 99.5 "Tom" (integer) 1 redis > ZADD fin_test 88 "Li Lei" (integer) 1 redis > ZADD fin_test 75 "Han Meimei" (integer) 1 redis > ZADD fin_test 99.5 "Tom" (integer) 1 redis > ZINTERSTORE sum_point 2 mid_test fin_test (integer) 3 redis > ZRANGE sum_point 0 -1 WITHSCORES # 显示有序集内所有成员及其 score 值 1) "Han Meimei" 2) "145" 3) "Li Lei" 4) "158" 5) "Tom" 6) "199" 复制代码

3. sorted_set应用场景（1）排行榜

基础的数据结构（五种基础数据结构及应用场景）(11)

解决方案：

点击新闻，点击量 1

zincrby hotNews:20210104 1 特朗普通话语音曝光复制代码

展示当日排行前十

zrevrange hotNews:20210104 0 9 WITHSCORES 复制代码

七日搜索榜单计算

zunionstore hotNews:20210104-2021010110 7 hotNews:20210104 hotNews:20210105 ... hotNews:20210110 复制代码

展示七日排行前十

zrevrange hotNews:20210104-2021010110 0 9 WITHSCORES 复制代码

（2）会员短期体验之过期失效

基础服务增值服务类网站会设定各位会员的试用，让用户充分体验会员优势。例如观影试用VIP、游戏VIP体验、云盘下载体验VIP、数据查看体验VIP，当VIP体验到期后，如何有效管理此类信息。即便对于正式VIP用户也存在对应的管理方式。网站会定期开启投票、讨论,限时进行,逾期作废。如何有效管理此类过期信息。

解决方案：

对于基于时间线限定的任务处理，将处理时间记录为score值，利用排序功能区分处理的先后顺序
记录下一个要处理的事件，当对比系统时间发现当然仍后到期后移除redis中的记录，并记录下一个要处理的时间
当新任务加入时，判定并更新当前下一个要处理的任务时间
为提升sorted_set的性能，通常将任务根据特征存储成若干个sorted_set.例如1小时内，1天内，年度等，操作时逐渐提升，将即将操作的若干个任务纳入到1小时内处理队列中
time命令获取当前系统时间

展开全文

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。文章投诉邮箱：anhduc.ph@yahoo.com

秒懂生活

基础的数据结构（五种基础数据结构及应用场景）

猜您喜欢

国家税务局云南电子税务总局（一文了解云南省电子税务局）

什么软件可以广播剧配音（广播剧配音用什么软件）

三亚地区楼盘价格（海南三亚热门楼盘现场最新）

手机电量下降太快了怎么办（手机电量扛不住）

一线系统门窗十大品牌（全国一线系统门窗品牌排行前十）

无线网卡挑主板么（让台式机也更加自由）

手机相机图标没了怎么找回（手机自带的相机不见了）

热门推荐

排行榜