敏感詞系列
sensitive-word-admin 敏感詞控臺 v1.2.0 版本開源
sensitive-word-admin v1.3.0 發布 如何支持分布式部署?
01-開源敏感詞工具入門使用
02-如何實現一個敏感詞工具?違禁詞實現思路梳理
03-敏感詞之 StopWord 停止詞優化與特殊符號
04-敏感詞之字典瘦身
05-敏感詞之 DFA 算法(Trie Tree 算法)詳解
06-敏感詞(臟詞) 如何忽略無意義的字符?達到更好的過濾效果
v0.10.0-臟詞分類標簽初步支持
v0.11.0-敏感詞新特性:忽略無意義的字符,詞標簽字典
v0.12.0-敏感詞/臟詞詞標簽能力進一步增強
v0.13.0-敏感詞特性版本發布 支持英文單詞全詞匹配
v0.16.1-敏感詞新特性之字典內存資源釋放
業務背景
[功能]建議增加IP地址過濾 #43
請求增加一個過濾IP地址的功能,可以避免掉一些鏈接發不出去改發IP的
https://github.com/houbb/sensitive-word/issues/43
IP 的檢測
說明
支持版本:v0.17.0
我適合使用在避免一些用戶繞過網址檢測,輸入 ip 的場景。
使用方式
final String text = "個人網站,如果網址打不開可以訪問 127.0.0.1。";
final SensitiveWordBs sensitiveWordBs = SensitiveWordBs
.newInstance()
.enableIpv4Check(true)
.init();List<String> wordList = sensitiveWordBs.findAll(text);
Assert.assertEquals("[127.0.0.1]", wordList.toString());
啟用方式
通過引導類 enableIpv4Check 開關控制,默認為關閉。
小結
ip 的檢測相對比較復雜一點。
雖然技術的發展,ipv6 也逐漸投入使用。
最好是可以把這個定義的能力放開,后續可以考慮。
開源代碼
敏感詞 https://github.com/houbb/sensitive-word
敏感詞 https://github.com/houbb/sensitive-word-admin