-
各大平台连敏感词库都没有的吗?sensitive-word java 开源敏感词工具入门使用
拓展阅读
01-开源敏感词工具入门使用
02-如何实现一个敏感词工具?违禁词实现思路梳理
03-敏感词之 StopWord 停止词优化与特殊符号
04-敏感词之字典瘦身
05-敏感词之 DFA 算法(Trie Tree 算法)详解
06-敏感词(脏词) 如何忽略无意义的字符?达到更好的过滤效果
v0.10.0-脏词分类标签初步支持
v0.11.0-敏感词新特性:忽略无意义的字...
2020-01-07 02:09:32 |
Java
-
Regex 正则表达式原理-03-NFA 转 DFA
绕不过去的坎
原来尝试学习写 Regex,写了一半都来放弃了。
最近在看《编译原理》,发现书中提到了正则表达式。
最近在刷 leetcode,刚好到 regular-expression-matching。
可见困难是必须要面对的。
本篇文章转载自 CSDN,感觉写的很好,此处仅作为记录。
为什么需要 NFA 转 DFA
Regex 正则表达式原理及如何从零实现 中我们已经构建...
2020-01-07 02:09:32 |
Java
-
Regex 正则表达式原理及如何从零实现
有限状态机
有限状态机(Finite-state machine),也被称为有限状态自动机(finite-state automation),是表示有限个状态以及在这些状态之间的转移和动作等行为的数学计算模型(From 维基百科 状态机) 。
听起来晦涩难懂,我用大白话描述一遍,状态机其实就是用图把状态和状态之间的关系描述出来,状态机中的一个状态可以在某些给定条件下变成另外一种状态。
...
2020-01-07 02:09:32 |
Java
-
Regex 正则表达式与 DFA
业务背景
我希望通过 DFA 算法验证一个字符串中是否包含 url/邮箱/数字 等信息,这些直接使用 regex 判断起来比较简单。
因为复杂的事情已经被 regex 处理了,但是个人是在处理 DFA,就不想依赖 regex。
所以就学习下,如何将 regex 转换为 DFA 进行处理。
问题概述
随着计算机语言的结构越来越复杂,为了开发优秀的编译器,人们已经渐渐感到将词法分析独立...
2020-01-07 02:09:32 |
Java
-
java 发送邮件
如何使用IMAP服务?
首先介绍一些邮件发送的基础知识,如果你已经知道可以跳过。
直接到 Email 邮件发送实现的部分。
IMAP是什么?
IMAP,即Internet Message Access Protocol(互联网邮件访问协议),您可以通过这种协议从邮件服务器上获取邮件的信息、下载邮件等。
IMAP与POP类似,都是一种邮件获取协议。
IMAP和POP有什么区别?
...
2019-12-25 08:57:12 |
Java
-
java 搭建属于自己的邮件服务器
目的
有时候处于安全的考虑,我们需要有属于自己的邮件服务器。
使用本地服务器搭建一个邮箱,这样就可以脱离qq或者其他企业邮箱的限制,即可以做到节省成本,又可以得到收发邮件的一个保密性。
准备:
一个顶级域名:国内国外的都可以,当然也可以不需要顶级域名,前提是这个域名需要解析到你的服务器ip上
frp 内网穿透(包含公网ip的服务器):这个方便本地调试(如果不是很懂也可以查看上篇微信...
2019-12-25 08:57:12 |
Java
-
java 发送邮件 css-style 样式丢失错乱问题,有解决方案
问题描述
使用 email 发送邮件时,发现所有的 css 样式丢失。
感觉有些奇怪,看了下邮件设置也是 html 格式。
后来一想就知道原因了,其实邮箱也是基于 css 显示的,如果邮件内容有全局格式,肯定会导致显示,甚至安全问题。
所以去查了下相关原因,并且记录下自己的解决方案。
问题原因
使用java发送html到qq邮箱后,发现采用“外部样式表”的css都没有
外部样式...
2019-12-25 08:57:12 |
Java
-
java 中文标点符号判断
背景
最近需要处理一些文本,发现想细化一些分类,以前的知识短板就暴露出来了。
这一篇主要是针对网上的资料收集整理。
偏于以后学习查阅。
中文标点符号判断
Java Character 实现Unicode字符集介绍 CJK中文字符和中文标点判断
主要内容:
Java Character 类介绍;
Unicode 简介及 UnicodeBloc...
2019-12-25 08:57:12 |
Java