Redis 的数据类型|个人学习笔记

简介

Redis是一个开源的，内存中的数据结构存储系统，它可以用做数据库，缓存和消息中间件，支持多种类型的数据结构：

字符串 strings
散列 hashes
列表 lists
集合 sets
有序集合 sorted sets
bitmaps
hyperloglogs
geospatial

String

简介

String是Redis中最基本的数据类型，一个key对应一个value，一个Redis中字符串value最多可以是512M

String类型是二进制安全的。意味着Redis的String可以包含任何数据。如jpg图片或序列化的对象

常用命令

--添加键值对
--EX：key的超时秒数
--NX：当数据库中key不存在时，可以将key-value添加数据库
--XX：当数据库中key存在时，可以将key-value添加数据库，与NX参数互斥
--PX：key的超时毫秒数，与EX互斥
set <key> <value> [EX seconds|PX milliseconds|KEEPTTL] [NX|XX]

--只有在key不存在时设置 key 的值
setnx <key> <value>

--同时设置一个或多个key-value对
mset <key1> <value1> <key2> <value2> ..... 

--同时设置一个或多个key-value对，当且仅当所有给定key都不存在
--原子性，有一个失败则都失败
msetnx <key1> <value1> <key2> <value2> .....

--设置键值的同时，设置过期时间，单位秒
setex <key> <过期时间> <value>

--用<value>覆写<key>所储存的字符串值，从<起始位置>开始(索引从0开始)
setrange <key> <起始位置> <value>

--将给定的 <value> 追加到原值的末尾
append <key> <value>

--查询对应键值
get <key>

--同时获取一个或多个value
mget <key1> <key2> <key3> .....

--以新换旧，设置了新值同时获得旧值
getset <key> <value>

--获得值的范围，类似java中的substring，前包，后包
getrange <key> <起始位置> <结束位置>

--获得值的长度
strlen <key>

--将key中储存的数字值增1，只能对数字值操作，如果为空，新增值为1
--该操作为原子性操作
incr <key>

--将key中储存的数字值减1，只能对数字值操作，如果为空，新增值为-1
decr <key>

--将key中储存的数字值增减。自定义步长
--increment：增减的步长
incrby/decrby <key> <increment>

数据结构

String的数据结构为简单动态字符串(Simple Dynamic String,缩写SDS)。是可以修改的字符串，内部结构实现上类似于Java的ArrayList，采用预分配冗余空间的方式来减少内存的频繁分配

如图中所示，内部为当前字符串实际分配的空间capacity一般要高于实际字符串长度len。当字符串长度小于1M时，扩容都是加倍现有的空间，如果超过1M，扩容时一次只会多扩1M的空间。需要注意的是字符串最大长度为512M

List

简介

List是简单的字符串列表，按照插入顺序排序。你可以添加一个元素到列表的头部（左边）或者尾部（右边）

List的底层实际是个双向链表，对两端的操作性能很高，通过索引下标的操作中间的节点性能会较差

常用命令

--从左边/右边插入一个或多个值
lpush/rpush <key> <value1> <value2> <value3> ....

--从左边/右边取出一个值。当值全部取出后键会消失
lpop/rpop <key>

--从<key1>列表右边吐出一个值，插到<key2>列表左边
rpoplpush <key1> <key2>

--按照索引下标获得元素(从左到右)
lrange <key> <start> <stop>

--0左边第一个，-1右边第一个，（0 -1表示获取所有）
lrange mylist <0 -1>   

--按照索引下标获得元素(从左到右)
lindex <key> <index>

-- 获得列表长度
llen <key>

--在<value>的后面插入<newvalue>插入值
linsert <key> before <value> <newvalue>

--从左边删除n个value(从左到右)
lrem <key> <n> <value>

--将列表key下标为index的值替换成value
lset <key> <index> <value>

数据结构

List的数据结构为快速链表quickList

在列表元素较少的情况下会使用一块连续的内存存储，这个结构是ziplist，也即是压缩列表，它将所有的元素紧挨着一起存储，分配的是一块连续的内存，当数据量比较多的时候才会改成quicklist

因为普通的链表需要的附加指针空间太大，会比较浪费空间。比如这个列表里存的只是int类型的数据，结构上还需要两个额外的指针prev和next

Redis将链表和ziplist结合起来组成了quicklist。也就是将多个ziplist使用双向指针串起来使用。这样既满足了快速的插入删除性能，又不会出现太大的空间冗余

Set

简介

Set对外提供的功能与list类似是一个列表的功能，特殊之处在于set是可以自动排重的，当你需要存储一个列表数据，又不希望出现重复数据时，set是一个很好的选择，并且set提供了判断某个成员是否在一个set集合内的重要接口，这个也是list所不能提供的

Set是string类型的无序集合。它底层其实是一个value为null的hash表，所以添加，删除，查找的复杂度都是O(1)

常用命令

--将一个或多个value元素加入到集合key中，已经存在的value元素将被忽略
sadd <key> <value1> <value2> ..... 

--取出该集合的所有值
smembers <key>

--判断集合<key>是否为含有该<value>值，有1，没有0
sismember <key> <value>

--返回该集合的元素个数
scard <key>

--删除集合中的某个元素
srem <key> <value1> <value2> .... 

--随机从该集合中取出一个值
spop <key>

--随机从该集合中获得n个值。不会从集合中删除 
srandmember <key> <n>

--把<key1>集合中<value>移动到<key2>集合
smove <key1> <key2> <value>

--返回两个集合的交集元素
sinter <key1> <key2>

--返回两个集合的并集元素
sunion <key1> <key2>

--返回两个集合的差集元素(key1中的，不包含key2中的)
sdiff <key1> <key2>

数据结构

Set数据结构是dict字典，字典是用哈希表实现的

Java中HashSet的内部实现使用的是HashMap，只不过所有的value都指向同一个对象。Redis的set结构也是一样，它的内部也使用hash结构，所有的value都指向同一个内部值

Hash

简介

Redis中Hash是一个键值对集合

Redis中Hash是一个string类型的field和value的映射表，hash特别适合用于存储对象，类似Java里面的Map<String,Object>

用户ID为查找的key，存储的value用户对象包含姓名，年龄，生日等信息，如果用普通的key/value结构来存储，主要有以下存储方式：

将对象序列化为String

每次修改用户的某个属性需要，先反序列化改好后再序列化回去。开销较大
将对象拆分存储

用户ID数据冗余
使用Hash存储

通过 key(用户ID) + field(属性标签) 就可以操作对应属性数据了，既不需要重复存储数据，也不会带来序列化和并发修改控制的问题

常用命令

--给<key>集合中的<field>键赋值<value>
hset <key> <field> <value>

--从<key>集合<field>取出value 
hget <key> <field>

--批量设置hash的值
hmset <key1> <field1> <value1> <field2> <value2> ... 

--查看哈希表<key>中，给定域<field>是否存在
hexists <key> <field> 

--列出该hash集合的所有field
hkeys <key>

--列出该hash集合的所有value
hvals <key>

--为哈希表<key>中的域，<field>的值加上增量(increment：步长)
hincrby <key> <field> <increment>

--将哈希表<key>中的域<field>的值设置为<value>，当且仅当域<field>不存在才可执行
hsetnx <key> <field> <value>

数据结构

Hash类型对应的数据结构是两种：ziplist（压缩列表），hashtable（哈希表）。当field-value长度较短且个数较少时，使用ziplist，否则使用hashtable

ZSet

简介

Redis有序集合zset与普通集合set非常相似，是一个没有重复元素的字符串集合

不同之处是有序集合的每个成员都关联了一个评分（score）,这个评分（score）被用来按照从最低分到最高分的方式排序集合中的成员。集合的成员是唯一的，但是评分可以是重复了

因为元素是有序的, 所以你也可以很快的根据评分（score）或者次序（position）来获取一个范围的元素

访问有序集合的中间元素也是非常快的,因此你能够使用有序集合作为一个没有重复成员的智能列表

常用命令

--将一个或多个<value>元素及其<score>值加入到有序集<key>当中。
zadd  <key> <score1> <value1> <score2> <value2> ...

--返回有序集 key 中，下标在<start><stop>之间的元素(0 -1获取所有)
--带WITHSCORES，可以让分数一起和值返回到结果集
zrange <key> <start> <stop>  [WITHSCORES]   

--返回有序集<key>中，所有score值介于<min>和<max>之间(包括等于<min>或<max>)的成员。有序集成员按score值递增(从小到大)次序排列。 
zrangebyscore key <min> <max> [withscores] [limit offset count]

--同上，改为从大到小排列 
zrevrangebyscore key <max> <min> [withscores] [limit offset count]               

--为<value>元素的score加上增量（increment：步长）
zincrby <key> <increment> <value>     
 
--删除该集合下，指定值的元素 
zrem <key> <value>

--统计该集合，分数区间内的元素个数 
zcount <key> <min> <max>

--返回该值在集合中的排名，从0开始
zrank <key> <value>

数据结构

SortedSet(zset)是Redis提供的一个非常特别的数据结构，一方面它等价于Java的数据结构Map<String, Double>，可以给每一个元素value赋予一个权重score，另一方面它又类似于TreeSet，内部的元素会按照权重score进行排序，可以得到每个元素的名次，还可以通过score的范围来获取元素的列表

zset底层使用了两个数据结构

hash：hash的作用就是关联元素value和权重score，保障元素value的唯一性，可以通过元素value找到相应的score值
跳跃表：跳跃表的目的在于给元素value排序，根据score的范围获取元素列表

Bitmaps

简介

现代计算机用二进制（位）作为信息的基础单位，1个字节等于8位，例如“abc”字符串是由3个字节组成，但实际在计算机存储时将其用二进制表示，“abc”分别对应的ASCII码分别是97、98、99，对应的二进制分别是01100001、01100010和01100011，如下图：

合理地使用操作位能够有效地提高内存使用率和开发效率，Redis提供了Bitmaps这个“数据类型”可以实现对位的操作：

Bitmaps本身不是一种数据类型，实际上它就是字符串（key-value），但是它可以对字符串的位进行操作
Bitmaps单独提供了一套命令，所以在Redis中使用Bitmaps和使用字符串的方法不太相同。可以把Bitmaps想象成一个以位为单位的数组，数组的每个单元只能存储0和1，数组的下标在Bitmaps中叫做偏移量

补充：在第一次初始化Bitmaps时，假如偏移量非常大，那么整个初始化过程执行会比较慢，可能会造成Redis的阻塞

常用命令

--设置Bitmaps中某个偏移量的值（0或1）
--offset：偏移量
setbit <key> <offset> <value>

--获取Bitmaps中某个偏移量的值
getbit <key> <offset>

--统计字符串从start字节到end字节比特值为1的数量
bitcount <key> [start end]

--bitop是一个复合操作， 它可以做多个Bitmaps的and（交集）、or（并集）、not（非）、xor（异或）操作并将结果保存在destkey中
bitop  and(or/not/xor) <destkey> [key…]

HyperLogLog

简介

在工作当中，我们经常会遇到与统计相关的功能需求，比如统计网站PV（PageView页面访问量），可以使用Redis的incr、incrby轻松实现
但像UV（UniqueVisitor，独立访客）、独立IP数、搜索记录数等需要去重和计数的问题如何解决？这种求集合中不重复元素个数的问题称为基数问题。
解决基数问题有很多种方案：

数据存储在MySQL表中，使用distinct count计算不重复个数
使用Redis提供的hash、set、bitmaps等数据结构来处理

以上的方案结果精确，但随着数据不断增加，导致占用空间越来越大，对于非常大的数据集是不切实际的

HyperLogLog是用来做基数统计的算法，HyperLogLog 的优点是，在输入元素的数量或者体积非常非常大时，计算基数所需的空间总是固定的、并且是很小的

在Redis里面，每个HyperLogLog键只需要花费12KB内存，就可以计算接近2^64个不同元素的基数。这和计算基数时，元素越多耗费内存就越多的集合形成鲜明对比，但是，因为HyperLogLog只会根据输入元素来计算基数，而不会储存输入元素本身，所以HyperLogLog不能像集合那样，返回输入的各个元素

补充：什么是基数? 比如数据集 {1, 3, 5, 7, 5, 7, 8}，那么这个数据集的基数集为 {1, 3, 5 ,7, 8}, 基数(不重复元素)为5。基数估计就是在误差可接受的范围内，快速计算基数

常用命令

--添加指定元素到HyperLogLog中
--如果执行命令后HLL估计的近似基数发生变化，则返回1，否则返回0
pfadd <key> <element> [element ...]   

--计算HLL的近似基数，可以计算多个HLL，比如用HLL存储每天的UV，计算一周的UV可以使用7天的UV合并计算即可
pfcount<key> [key ...] 

--将一个或多个HLL合并后的结果存储在另一个HLL中，比如每月活跃用户可以使用每天的活跃用户来合并计算可得
pfmerge <destkey> <sourcekey> [sourcekey ...]

Geospatial

简介

Redis 3.2 中增加了对GEO类型的支持。GEO，Geographic，地理信息的缩写。该类型，就是元素的2维坐标，在地图上就是经纬度。redis基于该类型，提供了经纬度设置，查询，范围查询，距离查询，经纬度Hash等常见操作

常用命令

--添加地理位置（经度，纬度，名称）
--有效的经度从 -180 度到 180 度。有效的纬度从 -85.05112878 度到 85.05112878 度，当坐标位置超出指定范围时，该命令将会返回一个错误。
--已经添加的数据，是无法再次往里面添加的
geoadd <key> < longitude> <latitude> <member> [longitude latitude member ...]

--获得指定地区的坐标值
geopos <key> <member> [member...]

--获取两个位置之间的直线距离
--m 表示单位为米[默认值]。
--km 表示单位为千米。
--mi 表示单位为英里。
--ft 表示单位为英尺。
--如果用户没有显式地指定单位参数，那么GEODIST默认使用米作为单位
geodist <key> <member1> <member2> [m|km|ft|mi] 

--以给定的经纬度为中心，找出某一半径内的元素
georadius <key> < longitude> <latitude> radius [m|km|ft|mi]

参考文档

https://www.bilibili.com/video/BV1Rv41177A

简介

String

简介

常用命令

数据结构

List

简介

常用命令

数据结构

Set

简介

常用命令

数据结构

Hash

简介

常用命令

数据结构

ZSet

简介

常用命令

数据结构

Bitmaps

简介

常用命令

HyperLogLog

简介

常用命令

Geospatial

简介

常用命令

参考文档

Redis 实现分布式锁

MySQL的锁机制

xxy