SpringBoot+Redis实现布隆过滤器的示例代码

简述

关于布隆过滤器的详细介绍，我在这里就不再赘述一遍了

我们首先知道：BloomFilter使用长度为m bit的字节数组，使用k个hash函数，增加一个元素: 通过k次hash将元素映射到字节数组中k个位置中，并设置对应位置的字节为1。查询元素是否存在: 将元素k次hash得到k个位置，如果对应k个位置的bit是1则认为存在，反之则认为不存在。

Guava 中已经有具体的实现，而在我们实际生产环境中，本地的存储往往无法满足我们实际的需求。所以在这时候，就需要我们使用 redis 了。

Redis 安装 Bloom Filter

								
									 git clone https:  //github  .com  /RedisLabsModules/redisbloom  .git 

									 cd   redisbloom 

									 make   # 编译 

									 vi   redis.conf 

									 ## 增加配置 

									 loadmodule   /usr/local/web/redis/RedisBloom-1  .1.1  /rebloom  .so 

									 ##redis 重启 

									 #关闭 

									 .  /redis-cli   -h 127.0.0.1 -p 6379   shutdown 

									 #启动 

									 .  /redis-server   ..  /redis  .conf &

基本指令

#创建布隆过滤器，并设置一个期望的错误率和初始大小

bf.reserve userid 0.01 100000

#往过滤器中添加元素

bf.add userid 'sbc@163.com'

#判断指定key的value是否在bloomfilter里存在，存在：返回1，不存在：返回0

bf.exists userid 'sbc@163.com'

结合 SpingBoot

搭建一个简单的 springboot 框架

方式一

配置

								
									 <?  xml   version  =  "1.0"   encoding  =  "UTF-8"  ?> 

									 <  project   xmlns  =  "http://maven.apache.org/POM/4.0.0" 

									            xmlns:xsi  =  "http://www.w3.org/2001/XMLSchema-instance" 

									           xsi:schemaLocation  =  "http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"  > 

									       <  modelVersion  >4.0.0</  modelVersion  > 

									       <  groupId  >com.bloom</  groupId  > 

									       <  artifactId  >test-bloomfilter</  artifactId  > 

									       <  version  >1.0-SNAPSHOT</  version  > 

									       <  parent  > 

									           <  groupId  >org.springframework.boot</  groupId  > 

									           <  artifactId  >spring-boot-starter-parent</  artifactId  > 

									           <  version  >1.5.8.RELEASE</  version  > 

									           <  relativePath  />   <!-- lookup parent from repository --> 

									       </  parent  > 

									       <  dependencies  > 

									           <  dependency  > 

									               <  groupId  >org.springframework.boot</  groupId  > 

									               <  artifactId  >spring-boot-starter</  artifactId  > 

									           </  dependency  > 

									           <  dependency  > 

									               <  groupId  >org.apache.commons</  groupId  > 

									               <  artifactId  >commons-lang3</  artifactId  > 

									               <  version  >3.0.1</  version  > 

									           </  dependency  > 

									       </  dependencies  > 

									 </  project  >

redis本身对布隆过滤器就有一个很好地实现，在 java 端，我们直接导入 redisson 的 jar包即可

< dependency >

< groupId >org.redisson</ groupId >

< artifactId >redisson</ artifactId >

< version >3.8.2</ version >

</ dependency >

将 Redisson实例注入 SpringIOC 容器中

								
									 @Configuration 

									 public   class   RedissonConfig { 

									       @Value  (  "${redisson.redis.address}"  ) 

									       private   String address; 

									       @Value  (  "${redisson.redis.password}"  ) 

									       private   String password; 

									       @Bean 

									       public   Config redissionConfig() { 

									           Config config =   new   Config(); 

									           SingleServerConfig singleServerConfig = config.useSingleServer(); 

									           singleServerConfig.setAddress(address); 

									           if   (StringUtils.isNotEmpty(password)) { 

									               singleServerConfig.setPassword(password); 

									           } 

									           return   config; 

									       } 

									       @Bean 

									       public   RedissonClient redissonClient() { 

									           return   Redisson.create(redissionConfig()); 

									       } 

									 }

配置文件

1 2	redisson.redis.address=redis://127.0.0.1:6379 redisson.redis.password=

最后测试我们的布隆过滤器

								
									 @SpringBootApplication 

									 public   class   BloomApplication { 

									       public   static   void   main(String[] args) { 

									           ConfigurableApplicationContext context = SpringApplication.run(BloomApplication.  class  , args); 

									           RedissonClient redisson = context.getBean(RedissonClient.  class  ); 

									           RBloomFilter bf = redisson.getBloomFilter(  "test-bloom-filter"  ); 

									           bf.tryInit(100000L,   0.03  ); 

									           Set<String> set =   new   HashSet<String>(  1000  ); 

									           List<String> list =   new   ArrayList<String>(  1000  ); 

									         //向布隆过滤器中填充数据，为了测试真实，我们记录了 1000 个 uuid，另外 9000个作为干扰数据 

									           for   (  int   i =   0  ; i <   10000  ; i++) { 

									              String uuid = UUID.randomUUID().toString(); 

									             if  (i<  1000  ){ 

									               set.add(uuid); 

									               list.add(uuid); 

									             } 

									              bf.add(uuid); 

									           } 

									           int   wrong =   0  ;   // 布隆过滤器误判的次数 

									           int   right =   0  ;  // 布隆过滤器正确次数 

									           for   (  int   i =   0  ; i <   10000  ; i++) { 

									               String str = i %   10   ==   0   ? list.get(i /   10  ) : UUID.randomUUID().toString(); 

									               if   (bf.contains(str)) { 

									                   if   (set.contains(str)) { 

									                       right++; 

									                   }   else   { 

									                       wrong++; 

									                   } 

									               } 

									           } 

									           //right 为1000 

									           System.out.println(  "right:"   + right); 

									           //因为误差率为3%，所以一万条数据wrong的值在30左右 

									           System.out.println(  "wrong:"   + wrong); 

									             //过滤器剩余空间大小 

									           System.out.println(bf.count()); 

									       } 

									 }

以上使我们使用 redisson 的使用方式，下面介绍一种比较原始的方式，使用lua脚本的方式

方式二

bf_add.lua

local bloomName = KEYS[1]

local value = KEYS[2]

local result = redis.call('BF.ADD',bloomName,value)

return result

bf_exist.lua

local bloomName = KEYS[1]

local value = KEYS[2]

local result = redis.call('BF.EXISTS',bloomName,value)

return result

								
									 @Service 

									 public   class   RedisBloomFilterService { 

									       @Autowired 

									       private   RedisTemplate redisTemplate; 

									       //我们依旧用刚刚的那个过滤器 

									       public   static   final   String BLOOMFILTER_NAME =   "test-bloom-filter"  ; 

									       /** 

									        * 向布隆过滤器添加元素 

									        * @param str 

									        * @return 

									        */ 

									       public   Boolean bloomAdd(String str) { 

									           DefaultRedisScript<Boolean> LuaScript =   new   DefaultRedisScript<Boolean>(); 

									           LuaScript.setScriptSource(  new   ResourceScriptSource(  new   ClassPathResource(  "bf_add.lua"  ))); 

									           LuaScript.setResultType(Boolean.  class  ); 

									           //封装传递脚本参数 

									           List<String> params =   new   ArrayList<String>(); 

									           params.add(BLOOMFILTER_NAME); 

									           params.add(str); 

									           return   (Boolean) redisTemplate.execute(LuaScript, params); 

									       } 

									       /** 

									        * 检验元素是否可能存在于布隆过滤器中 * @param id * @return 

									        */ 

									       public   Boolean bloomExist(String str) { 

									           DefaultRedisScript<Boolean> LuaScript =   new   DefaultRedisScript<Boolean>(); 

									           LuaScript.setScriptSource(  new   ResourceScriptSource(  new   ClassPathResource(  "bf_exist.lua"  ))); 

									           LuaScript.setResultType(Boolean.  class  ); 

									           //封装传递脚本参数 

									           ArrayList<String> params =   new   ArrayList<String>(); 

									           params.add(BLOOMFILTER_NAME); 

									           params.add(String.valueOf(str)); 

									           return   (Boolean) redisTemplate.execute(LuaScript, params); 

									       } 

									 }

最后我们还是用上面的启动器执行测试代码

								
									 @SpringBootApplication 

									 public   class   BloomApplication { 

									       public   static   void   main(String[] args) { 

									           ConfigurableApplicationContext context = SpringApplication.run(BloomApplication.  class  , args); 

									           RedisBloomFilterService filterService = context.getBean(RedisBloomFilterService.  class  ); 

									           Set<String> set =   new   HashSet<String>(  1000  ); 

									           List<String> list =   new   ArrayList<String>(  1000  ); 

									           //向布隆过滤器中填充数据，为了测试真实，我们记录了 1000 个 uuid，另外 9000个作为干扰数据 

									           for   (  int   i =   0  ; i <   10000  ; i++) { 

									               String uuid = UUID.randomUUID().toString(); 

									               if   (i <   1000  ) { 

									                   set.add(uuid); 

									                   list.add(uuid); 

									               } 

									               filterService.bloomAdd(uuid); 

									           } 

									           int   wrong =   0  ;   // 布隆过滤器误判的次数 

									           int   right =   0  ;  // 布隆过滤器正确次数 

									           for   (  int   i =   0  ; i <   10000  ; i++) { 

									               String str = i %   10   ==   0   ? list.get(i /   10  ) : UUID.randomUUID().toString(); 

									               if   (filterService.bloomExist(str)) { 

									                   if   (set.contains(str)) { 

									                       right++; 

									                   }   else   { 

									                       wrong++; 

									                   } 

									               } 

									           } 

									           //right 为1000 

									           System.out.println(  "right:"   + right); 

									           //因为误差率为3%，所以一万条数据wrong的值在30左右 

									           System.out.println(  "wrong:"   + wrong); 

									       } 

									 }

相比而言，个人比较推荐第一种，实现的原理都是差不多，redis 官方已经为我封装好了执行脚本，和相关 api，用官方的会更好一点

到此这篇关于SpringBoot+Redis实现布隆过滤器的示例代码的文章就介绍到这了,更多相关SpringBoot Redis布隆过滤器内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

原文链接：https://juejin.cn/post/7075115527219183646

声明：本文来自网络，不代表【好得很程序员自学网】立场，转载请注明出处：http://www.haodehen.cn/did194276

更新时间：2023-04-26 阅读：17次