通过exHash实现广告频控业务方案概述
exHash类型是一种支持Field过期的新型数据类型,它在原先的Hash类型基础上进行了扩展:在支持Hash类型的通用功能以外,exHash类型还支持为Field设置过期时间和版本,增强了数据结构的灵活性,从而简化了很多复杂场景下的业务开发工作。
本文以两种常见的场景(频控场景&购物车场景)为例,通过使用GeminiDB Redis接口中的exHash类命令来实现复杂的业务,简化开发难度。
exHash命令介绍
exHash命令详细介绍请参考exHash命令列表。
应用场景
- 频控场景
频控指的是对用户在一定时间内(例如一天、一周、一个月)进行某种操作的次数进行限制,可以控制特定广告或信息在一定时间内在特定平台上的展示次数,以避免过度曝光和广告疲劳,同时优化广告效果和用户体验;对于广告来说,也可以提高广告的效果和转化率。此外,频控还可以避免恶意行为,如刷流量、刷评论、刷点赞等。
频控的3个要素包含用户ID、广告ID、触发次数;以用户ID为key,广告ID为field,指定时间内的触发次数为value,恰好构成频控的三要素。先配置好各个广告的指定频控策略,如下图所示即可根据如下的方式来实现频控:
图1 频控Hash方案
- 最左边通过Hash类型来实现,通过expire命令设置User_1的过期时间为一天,每推送一次通过hincrby来增加指定广告的推送次数,每次推送指定广告前在一天内的推送次数则可以通过hget获取进行判断,一天后该用户的数据自动过期无需手动清理,这样便可以简单地实现频控。但这个方案的缺点在于对于每个用户(即每个key)只能设置一个过期时间,无法做到例如8小时3次这样指定时间段内的灵活的频控策略。
- 为了做到对每个广告都配置指定时间段内的灵活频控,如中间图所示可以通过将时间戳拼接在value里的方式用Hash类型来实现,但这种方案无疑是增加了业务侧开发的工作量。
- 如最右图所示,支持给field设置过期时间的exHash类型可以很完美地解决Hash类型面对频控场景的缺点。由于Field支持过期时间设置,那么该场景下,平台可以给每个广告都配置不同时间段内的频次要求,假设此时给AD_2配置的频控策略为8小时内2次,那么如图所示在下一次再准备给User_1推送AD_2广告前,先通过exhget User_1 AD_2命令获取到了该值已经是2时,便可以判断出此时根据平台频控策略,不应该再给User_1推送AD_2广告了。而当8小时一过,User_1的AD_2这个field过期后,exhget无法再获取到这个field的信息,则可以继续给User_1推送AD_2广告了。
- 购物车场景
双十一期间,相信很多同学购物车里都填满了各种想要清空的宝贝,这里就以购物车场景为例介绍该场景的几种不同Redis类型的实现,并比较这几种实现方案的优缺点。
- 基于String实现购物车功能
如图图2所示,基于String可以轻松地实现各个用户的购物车功能,该方案需要将用户ID与商品ID进行拼接作为key,例如User_1#Earphones_1,key对应的value为购物车中用户准备购买的数量,其中可能有部分商品为限时特购,所以有过期时间,为key对应的过期时间。
- 涉及命令如下:
incrby User_N#Product_N [Number] # 增加商品数量 set User_N#Product_N [Number] # 设置商品数量 expire User_N#Product_N Time_N # 设置指定用户购物车中指定物品的过期时间 get User_N#Product_N # 获取商品数量 scan 0 match User_N* # 查找所有User_N下的所有商品 del User_N#Product_N # 删除指定用户购物车中的指定商品
- 该方案会存在如下问题:
- 额外拼接增加编、解码开发工作量。
- 某个用户获取自己的购物车清单时还需要通过scan命令前缀匹配扫描所有key,并通过get命令去获取对应的值。
- 想要直接获取清单长度时,仍然需要遍历整个前缀key的数目,方法复杂。
- 存在大量重复的用户名前缀,浪费存储空间。
- 涉及命令如下:
- 基于Hash实现购物车功能
可以根据如图3所示的Hash类型来实现购物车的管理,用户ID作为key,商品ID作为field,value为购物车中对应商品的数量。其中对于部分限时特购的商品,其过期时间通过拼接的方式放到field对应的value里。
- 涉及命令如下:
hset User_N Product_N [Number#Time_N] # 设置指定用户购物车中指定商品的数量和过期时间 hincrby User_N Product_N [Number] # 增加指定用户购物车中的指定商品数量 hgetUser_N Product_N # 获取指定用户购物车中指定商品的信息 hgetall User_N # 获取指定用户的所有商品信息 hlen User_N # 获取指定用户购物车中的总商品数量 hdel User_N Product_N # 删除指定用户购物车中的指定商品
- 该方案相对于String类型的方案有了不少优化:
- 获取某个用户购物车中的所有商品清单仅需要一个hgetall命令即可。
- 获取某个用户的清单长度时直接hlen获取即可。
- 不存在大量重复的用户名前缀问题。
然而该方案仍存在一个明显的缺点,即对于部分限时特购的商品处理起来复杂:对于User_1的Keyboard_1商品,如果要再加一个数量,不能直接使用hincrby,而是需要先hget获取Keyboard_1商品的值并解码,再加上指定的数量再编码后hset对应的值。
- 涉及命令如下:
- 基于exHash实现购物车功能
根据如图4所示的exHash类型来实现购物车的管理,同Hash类型一样,用户ID作为key,商品ID作为field,value为购物车中对应商品的数量。其中对于部分限时特购的商品,由于exHash类型可以为Field设置过期时间,其过期时间可通过hset命令直接设置。
- 涉及命令如下:
exhset User_N Product_N ex Time_N # 设置指定用户购物车中指定商品的数量和过期时间 exhincrby User_N Product_N [Number] keepttl # 增加指定用户购物车中的指定商品数量,保留原先过期时间exhget User_N Product_N # 获取指定用户购物车中指定商品的信息 exhgetall User_N # 获取指定用户的所有商品信息 exhlen User_N # 获取指定用户购物车中的总商品数量 exhdel User_N Product_N # 删除指定用户购物车中的指定商品 del User_N # 清空指定用户的购物车
- 该方案相对于Hash类型的优化主要体现在可以直接为各field设置过期时间,使业务侧使用起来简单又高效。可以看到exHash类型相关的命令和Hash类型是类似的,使用起来学习成本很低,业务侧改造成本相对也比较低。
- 涉及命令如下:
- 基于String实现购物车功能
广告频控业务代码示例
import redis import datetime import os def get_cur_time(): return "[" + datetime.datetime.utcnow().strftime('%Y-%m-%d %H:%M:%S.%f')[:-3] + "]" def get_redis(): """ 该方法用于连接redis实例。 * host:redis实例连接地址。 * port:redis实例的端口号,默认为6379。 * password:redis实例的密码。 """ # 认证用的用户名和密码直接写到代码中有很大的安全风险,建议在配置文件或者环境变量中存放(密码应密文存放、使用时解密),确保安全 # 本示例以用户名和密码保存在环境变量中为例,运行本示例前请先在本地环境中设置环境变量(环境变量名称请根据自身情况进行设置)EXAMPLE_USERNAME_ENV和EXAMPLE_PASSWORD_ENV password = os.getenv('EXAMPLE_PASSWORD_ENV') return redis.Redis(host='***', port=6379, password=password) '''全局的频控策略,广告1策略为3秒内最多2次,广告2策略为5秒内最多5次''' frequency_stratege = {"ad_1" : [2, 3], "ad_2" : [5, 5]} def push_ad_to_user(userId: str, adId: str): ''' 该方法用于推送指定广告给指定用户。 * userId:用户ID * adId:广告ID ''' # 没有设置对该广告的频控策略,则直接投放 if adId not in frequency_stratege: print("no need control frequency, push ", adId, "to", userId) return True # 根据用户Id和广告ID获取该广告在某个用户上的投放次数 # 命令用法:EXHGET key field cnt = get_redis().execute_command("EXHGET " + userId + " " + adId) # 该用户没有这个广告的投放记录,则直接投放 if cnt == None: # 命令用法:EXHINCRBY key field num [EX time] # 使用说明:EXHINCRBY 用户ID 广告ID 投放次数(1) EX 该广告的过期时间 cmd = "EXHINCRBY " + userId + " " + adId + " 1 EX " + str(frequency_stratege[adId][1]) cur_cnt = get_redis().execute_command(cmd) print(get_cur_time(),"push", adId, "to", userId, "first time during", str(frequency_stratege[adId][1]), "seconds") return True # redis-py返回的结果是bytes类型,转换成str后转int类型 cnt = int(cnt.decode("utf-8")) if cnt < frequency_stratege[adId][0]: # 命令用法:EXHINCRBY key field num KEEPTTL 保持field原先的过期时间 cmd = "EXHINCRBY " + userId + " " + adId + " 1 KEEPTTL" cur_cnt = get_redis().execute_command(cmd) print(get_cur_time(), "push", adId, "to", userId, "current cnt:", cur_cnt) return True print(get_cur_time(), "Control frequency, can't push", adId, "to", userId, ", max cnt:", frequency_stratege[adId][0]) return False if __name__ == "__main__": for i in range(3): push_ad_to_user("usr_1", "ad_1") for i in range(6): push_ad_to_user("usr_1", "ad_2") for i in range(3): push_ad_to_user("usr_1", "ad_1") for i in range(12): push_ad_to_user("usr_1", "ad_2")
脚本运行输出:
其中由于python脚本本身运行较慢,广告2的过期时间设置得只有5s,所以当第一次投放广告2的时间2023-12-15 07:09:51.349的5s之后,也就是2023-12-15 07:09:56.530时间点再次给这个用户推送广告2时就可以推送成功了。
[2023-12-15 07:09:50.086] push ad_1 to usr_1 first time during 3 seconds [2023-12-15 07:09:50.503] push ad_1 to usr_1 current cnt: 2 [2023-12-15 07:09:50.794] Control frequency, can't push ad_1 to usr_1 , max cnt: 2 [2023-12-15 07:09:51.349] push ad_2 to usr_1 first time during 5 seconds [2023-12-15 07:09:51.745] push ad_2 to usr_1 current cnt: 2 [2023-12-15 07:09:52.128] push ad_2 to usr_1 current cnt: 3 [2023-12-15 07:09:52.889] push ad_2 to usr_1 current cnt: 4 [2023-12-15 07:09:53.417] push ad_2 to usr_1 current cnt: 5 [2023-12-15 07:09:53.632] Control frequency, can't push ad_2 to usr_1 , max cnt: 5 [2023-12-15 07:09:54.120] push ad_1 to usr_1 first time during 3 seconds [2023-12-15 07:09:54.769] push ad_1 to usr_1 current cnt: 2 [2023-12-15 07:09:54.915] Control frequency, can't push ad_1 to usr_1 , max cnt: 2 [2023-12-15 07:09:55.211] Control frequency, can't push ad_2 to usr_1 , max cnt: 5 [2023-12-15 07:09:55.402] Control frequency, can't push ad_2 to usr_1 , max cnt: 5 [2023-12-15 07:09:55.601] Control frequency, can't push ad_2 to usr_1 , max cnt: 5 [2023-12-15 07:09:55.888] Control frequency, can't push ad_2 to usr_1 , max cnt: 5 [2023-12-15 07:09:56.087] Control frequency, can't push ad_2 to usr_1 , max cnt: 5 [2023-12-15 07:09:56.530] push ad_2 to usr_1 first time during 5 seconds [2023-12-15 07:09:57.133] push ad_2 to usr_1 current cnt: 2 [2023-12-15 07:09:57.648] push ad_2 to usr_1 current cnt: 3 [2023-12-15 07:09:58.107] push ad_2 to usr_1 current cnt: 4 [2023-12-15 07:09:58.623] push ad_2 to usr_1 current cnt: 5 [2023-12-15 07:09:58.865] Control frequency, can't push ad_2 to usr_1 , max cnt: 5 [2023-12-15 07:09:59.096] Control frequency, can't push ad_2 to usr_1 , max cnt: 5
本文介绍了GeminiDB Redis接口的exHash类型的特性、使用方法及应用场景。为客户提供了一种语法与原生Redis Hash类型类似、和Hash类型的使用相互隔离、支持给Field单独设置过期时间和版本的exHash类型作为各种复杂场景的解决方案。未来,GeminiDB Redis接口将持续致力于开发更多好用的企业级特性,帮助客户轻松运维,高效开发。