个人简介

Echo Blog


江湖无名 安心练剑
  • NLP 英文拼写算法,如果提升 100W 倍的性能?
    拼写纠正系列 NLP 中文拼写检测实现思路 NLP 中文拼写检测纠正算法整理 NLP 英文拼写算法,如果提升 100W 倍的性能? NLP 中文拼写检测纠正 Paper java 实现中英文拼写检查和错误纠正?可我只会写 CRUD 啊! 一个提升英文单词拼写检测性能 1000 倍的算法? 单词拼写纠正-03-leetcode edit-distance 72.力扣编辑距离 N...
    2020-01-20 02:09:32 | Data-Struct
  • NLP 中文拼写检测纠正算法整理
    拼写纠正系列 NLP 中文拼写检测实现思路 NLP 中文拼写检测纠正算法整理 NLP 英文拼写算法,如果提升 100W 倍的性能? NLP 中文拼写检测纠正 Paper java 实现中英文拼写检查和错误纠正?可我只会写 CRUD 啊! 一个提升英文单词拼写检测性能 1000 倍的算法? 单词拼写纠正-03-leetcode edit-distance 72.力扣编辑距离 N...
    2020-01-20 02:09:32 | Data-Struct
  • NLP 中文拼写检测实现思路
    拼写纠正系列 NLP 中文拼写检测实现思路 NLP 中文拼写检测纠正算法整理 NLP 英文拼写算法,如果提升 100W 倍的性能? NLP 中文拼写检测纠正 Paper java 实现中英文拼写检查和错误纠正?可我只会写 CRUD 啊! 一个提升英文单词拼写检测性能 1000 倍的算法? 单词拼写纠正-03-leetcode edit-distance 72.力扣编辑距离 N...
    2020-01-20 02:09:32 | Data-Struct
  • NLP 中文形近字相似度计算思路
    汉字相似度的计算思路 汉字本身的结构非常的复杂,可以通过结构进行计算。 汉字的结构 相似度计算算法 实现方式 首先人工做基本的 level 相似度分组,然后在这个基础之上,进行全自动识别。 汉字的形式化描述 汉字部件 在国家颁发的 GB13000.1字符集汉字部首归部规范 , 列出了20902 个汉字的部件表 , 对这些汉字进行了逐个拆分 。 从 中选定了5...
    2020-01-20 02:09:32 | NLP
  • java 如何计算两个汉字的相似度?如何获得一个汉字的相似汉字?
    计算汉字相似度 情景 有时候我们希望计算两个汉字的相似度,比如文本的 OCR 等场景。用于识别纠正。 实现 引入 maven <dependency> <groupId>com.github.houbb</groupId> <artifactId>nlp-hanzi-similar</artifactId>...
    2020-01-20 02:09:32 | NLP
  • NLP 中文人名印章生成
    基本功能要求 类型 阴刻 阳刻 字体 可以指定不同的字体 结果 自动生成一张图片,最后背景透明。 基本技术 图片的处理 当然实现比较繁琐,可以直接参考已有的实现。 字体,水印。 容易操作性 结合基本的 jar,生成一个简单易用的页面。 拓展阅读 图片处理工具-thumbnailator 参考文章 印章生成工具:使用Java Graphics2D生成各类圆形/...
    2020-01-20 02:09:32 | NLP
  • NLP 中文人名打分的实现思路
    个人理解 一个好的名字,某种程度上要有历史文化气息。 好名字 五行圆满(类似于传统迷信的部分) 文化底蕴(诗词歌赋,历史渊源) 读音朗朗上口 这个可以 pinyin 去判断 ,但是什么名字才会比较好呢?平仄吗? 笔画 个人觉得笔画太多其实不是好事,小时候孩子不好写名字,别人也懒得写,记不住。挺尴尬。 比如司...
    2020-01-20 02:09:32 | NLP
  • 名字,名称打分策略之三才五格
    1.天格 1)单姓,姓氏笔划+1,如“丁”姓,天格数理为2+1=3. 2)复姓,姓氏笔划数相加,如“司马”姓,司5+马10=15. 天格是由姓氏决定的,姓氏又是祖先传下来的,其数理对人影响不大。 例子 如司马光,司马是复姓,天格是5+10=15;李刚,李是单姓,天格是7+1=8。天格乃祖先留下来的,其数理对人影响不大。 2.人格 人格为人的主运,是整个姓名的中心点,可以推断人一...
    2020-01-20 02:09:32 | NLP