-
NLP 开源形近字算法补完计划(完结篇)
前言
所有的故事都有开始,也终将结束。
本文将作为 NLP 汉字相似度的完结篇,为该系列画上一个句号。
起-NLP 中文形近字相似度计算思路
承-中文形近字相似度算法实现,为汉字 NLP 尽一点绵薄之力
转-当代中国最贵的汉字是什么?
不足之处
之所以有本篇,是因为上一次的算法实现存在一些不足。
巴别塔
《圣经》中有关于巴别塔建造,最终人们因为语言问题而停工的故事。
...
2020-01-20 02:09:32 |
NLP
-
当代中国最贵的汉字是什么?
最贵的汉字
“你说,当代中国最贵的汉字是什么?”,有一天同事忽然问我。
“【诺】,因为一诺千金”,我脱口而出。
“不对。”
“【字】,一字千金?”
同事摇头。
“爱?”
“这个是无价的,不算。”
“人才。不是说 21 世纪最贵的是人才吗?”
“一个字,你这不算。你咋不说家书抵万金呢?”
“算了,不猜了。”,我脑海里为数不多的几个字转了一圈,没有一个符合的。
我有些疑惑地...
2020-01-20 02:09:32 |
NLP
-
GPT2-Chinese 中文版 GPT2 训练代码,使用 BERT 分词器。
GPT2-Chinese
中文的GPT2训练代码,使用BERT的Tokenizer或Sentencepiece的BPE model(感谢kangzhonghua的贡献,实现BPE模式需要略微修改train.py的代码)。
可以写诗,新闻,小说,或是训练通用语言模型。支持字为单位或是分词模式或是BPE模式(需要略微修改train.py的代码)。支持大语料训练。
项目状态
在本项目公布时...
2020-01-20 02:09:32 |
NLP
-
中文拼写纠正-06-CSC 聊一聊 java 初步实现
拼写纠正系列
NLP 中文拼写检测实现思路
NLP 中文拼写检测纠正算法整理
NLP 英文拼写算法,如果提升 100W 倍的性能?
NLP 中文拼写检测纠正 Paper
java 实现中英文拼写检查和错误纠正?可我只会写 CRUD 啊!
一个提升英文单词拼写检测性能 1000 倍的算法?
单词拼写纠正-03-leetcode edit-distance 72.力扣编辑距离
开...
2020-01-20 02:09:32 |
Data-Struct
-
单词拼写纠正-05-2452.力扣 距离字典两次编辑距离以内的单词
拼写纠正系列
NLP 中文拼写检测实现思路
NLP 中文拼写检测纠正算法整理
NLP 英文拼写算法,如果提升 100W 倍的性能?
NLP 中文拼写检测纠正 Paper
java 实现中英文拼写检查和错误纠正?可我只会写 CRUD 啊!
一个提升英文单词拼写检测性能 1000 倍的算法?
单词拼写纠正-03-leetcode edit-distance 72.力扣编辑距离
开...
2020-01-20 02:09:32 |
Data-Struct
-
单词拼写纠正-04-161.力扣 相隔为 1 的编辑距离
拼写纠正系列
NLP 中文拼写检测实现思路
NLP 中文拼写检测纠正算法整理
NLP 英文拼写算法,如果提升 100W 倍的性能?
NLP 中文拼写检测纠正 Paper
java 实现中英文拼写检查和错误纠正?可我只会写 CRUD 啊!
一个提升英文单词拼写检测性能 1000 倍的算法?
单词拼写纠正-03-leetcode edit-distance 72.力扣编辑距离
开...
2020-01-20 02:09:32 |
Data-Struct
-
单词拼写纠正-03-72.力扣编辑距离 4 种解法 leetcode edit-distance
拼写纠正系列
NLP 中文拼写检测实现思路
NLP 中文拼写检测纠正算法整理
NLP 英文拼写算法,如果提升 100W 倍的性能?
NLP 中文拼写检测纠正 Paper
java 实现中英文拼写检查和错误纠正?可我只会写 CRUD 啊!
一个提升英文单词拼写检测性能 1000 倍的算法?
单词拼写纠正-03-leetcode edit-distance 72.力扣编辑距离
开...
2020-01-20 02:09:32 |
Data-Struct
-
一个提升英文单词拼写检测性能 1000 倍的算法?
拼写纠正系列
NLP 中文拼写检测实现思路
NLP 中文拼写检测纠正算法整理
NLP 英文拼写算法,如果提升 100W 倍的性能?
NLP 中文拼写检测纠正 Paper
java 实现中英文拼写检查和错误纠正?可我只会写 CRUD 啊!
一个提升英文单词拼写检测性能 1000 倍的算法?
单词拼写纠正-03-leetcode edit-distance 72.力扣编辑距离
开...
2020-01-20 02:09:32 |
Data-Struct