-
jieba-fenci 03 结巴分词与繁简体转换 segment
拓展阅读
DFA 算法详解
为了便于大家学习,项目开源地址如下,欢迎 fork+star 鼓励一下老马~
敏感词 sensitive-word
分词 segment
分词系列专题
jieba-fenci 01 结巴分词原理讲解 segment
jieba-fenci 02 结巴分词原理讲解之数据归一化 segment
jieba-fenci 03 结巴分词与繁...
2020-01-08 02:09:32 |
Java
-
jieba-fenci 02 结巴分词原理讲解之数据归一化 segment
拓展阅读
DFA 算法详解
为了便于大家学习,项目开源地址如下,欢迎 fork+star 鼓励一下老马~
敏感词 sensitive-word
分词 segment
分词系列专题
jieba-fenci 01 结巴分词原理讲解 segment
jieba-fenci 02 结巴分词原理讲解之数据归一化 segment
jieba-fenci 03 结巴分词与繁...
2020-01-08 02:09:32 |
NLP
-
jieba-fenci 01 结巴分词原理讲解 segment
拓展阅读
DFA 算法详解
为了便于大家学习,项目开源地址如下,欢迎 fork+star 鼓励一下老马~
敏感词 sensitive-word
分词 segment
分词系列专题
jieba-fenci 01 结巴分词原理讲解 segment
jieba-fenci 02 结巴分词原理讲解之数据归一化 segment
jieba-fenci 03 结巴分词与繁...
2020-01-08 02:09:32 |
Java
-
敏感词 v0.27.0 新特性之词库独立拆分
创作背景
大家好,我是老马。
敏感词初期在实现的时候,为了用户开箱即用将词库与核心算法库放在一起。
有一些用户希望只用自己的词库,于是内置了各种自定义的策略方法。
但是还是不够,比如有些 andriod 研发希望内置包的信息是干净的,不要有任何敏感信息。
为了保障开箱即用+支持将文件排除,我们在将敏感词库独立为另外一个项目。
系统内置词库及如何排除
内置词库文件说明
v0.2...
2020-01-07 02:09:32 |
Java
-
敏感词 v0.25.1 新特性之返回匹配词,修正 tags 标签
开源项目
敏感词核心 https://github.com/houbb/sensitive-word
敏感词控台 https://github.com/houbb/sensitive-word-admin
版本特性
大家好,我是老马。
敏感词以前在实现的时候,没有返回底层实际匹配的词,有时候问题排查非常耗费时间。
同时如果使用了一些字符的转换+跳过等,得到了一个匹...
2020-01-07 02:09:32 |
Java
-
敏感词 v0.25.0 新特性之 wordCheck 策略支持用户自定义
开源项目
敏感词核心 https://github.com/houbb/sensitive-word
敏感词控台 https://github.com/houbb/sensitive-word-admin
版本特性
大家好,我是老马。
敏感词一开始了内置了多种检验策略,但是很多用户在使用的过程中希望可以自定义策略。
所以 v0.25.0 开始,支持用户对部分策略进...
2020-01-07 02:09:32 |
Java
-
敏感词 v0.24.0 新特性支持标签分类,内置实现多种策略
开源项目
敏感词核心 https://github.com/houbb/sensitive-word
敏感词控台 https://github.com/houbb/sensitive-word-admin
版本特性
大家好,我是老马。
敏感词标签分类一直是大家比较想要的一个功能特性,v0.24.0 了开始内置支持标签分类,同时实现了多种策略。
快速开始
mave...
2020-01-07 02:09:32 |
Java
-
sensitive-word 敏感词 v0.23.0 结果条件拓展,内置支持链式+单词标签
开源项目
敏感词核心 https://github.com/houbb/sensitive-word
敏感词控台 https://github.com/houbb/sensitive-word-admin
版本特性
大家好,我是老马。
有时候我们得到敏感词以后,想要进一步处理。比如只关心某些标签的敏感词,要如何实现呢?
V0.23.0 针对结果处理做了进一步增强。...
2020-01-07 02:09:32 |
Java