-
jieba-fenci 05 结巴分词之简单聊一聊
拓展阅读
DFA 算法详解
为了便于大家学习,项目开源地址如下,欢迎 fork+star 鼓励一下老马~
敏感词 sensitive-word
分词 segment
分词系列专题
jieba-fenci 01 结巴分词原理讲解 segment
jieba-fenci 02 结巴分词原理讲解之数据归一化 segment
jieba-fenci 03 结巴分词与繁...
2020-01-08 02:09:32 |
NLP
-
jieba-fenci 04 结巴分词之词性标注实现思路 speechTagging segment
拓展阅读
DFA 算法详解
为了便于大家学习,项目开源地址如下,欢迎 fork+star 鼓励一下老马~
敏感词 sensitive-word
分词 segment
分词系列专题
jieba-fenci 01 结巴分词原理讲解 segment
jieba-fenci 02 结巴分词原理讲解之数据归一化 segment
jieba-fenci 03 结巴分词与繁...
2020-01-08 02:09:32 |
NLP
-
jieba-fenci 03 结巴分词与繁简体转换 segment
拓展阅读
DFA 算法详解
为了便于大家学习,项目开源地址如下,欢迎 fork+star 鼓励一下老马~
敏感词 sensitive-word
分词 segment
分词系列专题
jieba-fenci 01 结巴分词原理讲解 segment
jieba-fenci 02 结巴分词原理讲解之数据归一化 segment
jieba-fenci 03 结巴分词与繁...
2020-01-08 02:09:32 |
Java
-
jieba-fenci 02 结巴分词原理讲解之数据归一化 segment
拓展阅读
DFA 算法详解
为了便于大家学习,项目开源地址如下,欢迎 fork+star 鼓励一下老马~
敏感词 sensitive-word
分词 segment
分词系列专题
jieba-fenci 01 结巴分词原理讲解 segment
jieba-fenci 02 结巴分词原理讲解之数据归一化 segment
jieba-fenci 03 结巴分词与繁...
2020-01-08 02:09:32 |
NLP
-
jieba-fenci 01 结巴分词原理讲解 segment
拓展阅读
DFA 算法详解
为了便于大家学习,项目开源地址如下,欢迎 fork+star 鼓励一下老马~
敏感词 sensitive-word
分词 segment
分词系列专题
jieba-fenci 01 结巴分词原理讲解 segment
jieba-fenci 02 结巴分词原理讲解之数据归一化 segment
jieba-fenci 03 结巴分词与繁...
2020-01-08 02:09:32 |
Java
-
敏感词 v0.27.0 新特性之词库独立拆分
创作背景
大家好,我是老马。
敏感词初期在实现的时候,为了用户开箱即用将词库与核心算法库放在一起。
有一些用户希望只用自己的词库,于是内置了各种自定义的策略方法。
但是还是不够,比如有些 andriod 研发希望内置包的信息是干净的,不要有任何敏感信息。
为了保障开箱即用+支持将文件排除,我们在将敏感词库独立为另外一个项目。
系统内置词库及如何排除
内置词库文件说明
v0.2...
2020-01-07 02:09:32 |
Java
-
敏感词 v0.25.1 新特性之返回匹配词,修正 tags 标签
开源项目
敏感词核心 https://github.com/houbb/sensitive-word
敏感词控台 https://github.com/houbb/sensitive-word-admin
版本特性
大家好,我是老马。
敏感词以前在实现的时候,没有返回底层实际匹配的词,有时候问题排查非常耗费时间。
同时如果使用了一些字符的转换+跳过等,得到了一个匹...
2020-01-07 02:09:32 |
Java
-
敏感词 v0.25.0 新特性之 wordCheck 策略支持用户自定义
开源项目
敏感词核心 https://github.com/houbb/sensitive-word
敏感词控台 https://github.com/houbb/sensitive-word-admin
版本特性
大家好,我是老马。
敏感词一开始了内置了多种检验策略,但是很多用户在使用的过程中希望可以自定义策略。
所以 v0.25.0 开始,支持用户对部分策略进...
2020-01-07 02:09:32 |
Java