缩写

我们在中文中经常会有各种缩写。

我觉得本缩写词库可以有几层:

(1)基本词库。缩写词固定

根据 key 获取 value,或者反过来。

(2)英文词库

拓展词库,可以获取对应的英文缩写。

(3)训练

根据缩写词+原始词的词性等进行训练,初期可以采用简单的方式。

后期学习更好的算法,可以进行替换。

词库

中文系统词库

中文自定义词库

v0.0.1

基本的映射关系处理

参考资料

guava wiki

funNLP

中文公司名称

人名语料库