NLP ASR 语音转文本-03-AI 深度学习
机器学习并不总是一个黑盒
如果你知道神经机器翻译是如何工作的,那么你可能会猜到,我们可以简单地将声音送入神经网络中,并训练使之生成文本:
一个大问题是语速不同。
一个人可能很快地说出「hello!」而另一个人可能会非常缓慢地说「heeeelllllllllllllooooo!」。
这产生了一个更长的声音文件,也产生了更多的数据。
这两个声音文件都应该被识别为完全相同的文本「hell...
2020-01-20 02:09:32 |
NLP
NLP ASR 语音转文本-02-发展历史
浅析语音识别技术的工作原理及发展
语音是人类最自然的交互方式。
计算机发明之后,让机器能够“听懂”人类的语言,理解语言中的内在含义,并能做出正确的回答就成为了人们追求的目标。
我们都希望像科幻电影中那些智能先进的机器人助手一样,在与人进行语音交流时,让它听明白你在说什么。
语音识别技术将人类这一曾经的梦想变成了现实。
语音识别就好比“机器的听觉系统”,该技术让机器通过识别和理解,把...
2020-01-20 02:09:32 |
NLP
NLP ASR 语音转文本-01-概览
整体流程
我们知道声音实际上是一种波。
常见的mp3、wmv等格式都是压缩格式,必须转成非压缩的纯波形文件来处理,比如Windows PCM文件,也就是俗称的wav文件。wav文件里存储的除了一个文件头以外,就是声音波形的一个个点了。
下图是一个波形的示例。
1. VAD-静音切除
在开始语音识别之前,有时需要把首尾端的静音切除,降低对后续步骤造成的干扰。
这个静音切除的操作...
2020-01-20 02:09:32 |
NLP
NLP 中文整体规划设计应用
前沿
NLP 可以做很多事情,可以非常的简单,但是效果却非常的好。
概率
SA 情感分析
文本分类
性别推断
垃圾邮件识别
基本语料(chinese-basic)
字
词
成语
相关基础工具
拼音
繁简体
形近字
词语拓展
同义词、近义词、反义词、否定词、停顿词
敏感词
【汉字拆字】
【汉字词语缩写】
应用
拼写纠正:基于困惑集+编辑距离,结合中文的...
2020-01-20 02:09:32 |
NLP
ML 机器学习概览-01-overview
机器学习领域,除了 NLP,opencv 还有哪些主要研究方向?
机器学习领域除了自然语言处理(NLP)和计算机视觉(如使用OpenCV库进行图像处理)之外,还包括多个主要研究方向,这些方向不断推动着人工智能技术的发展和应用。以下是一些核心的机器学习研究方向:
深度学习(Deep Learning):深度学习是机器学习的一个子领域,主要研究如何使用深层神经网络进行数据分析...
2020-01-20 02:09:32 |
ML
maven 打包成可执行的文件 jar
业务背景
直接生成一个可执行的 jar,而不是一个麻烦的 war 包之类的。
maven 打包方式
配置
pom.xml
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://w...
2020-01-09 02:09:32 |
Devops
maven 打包报错 Return code is 501 , ReasonPhrase:HTTPS Required.
报错场景
今天 maven 打包,报错如下:
[ERROR] Failed to execute goal on project pinyin: Could not resolve dependencies for project com.github.houbb:pinyin:jar:0.0.2-SNAPS
HOT: Failed to collect dependencies at ...
2020-01-09 02:09:32 |
Devops
如何解决分词的繁简体问题?
分词的繁简体问题
分词是基本所有 nlp 的基础,那么分词中的繁简体如何解决?
方案1-HMM预测
不依赖字典,直接根据繁题的字频预测。
优点:降低内存消耗
缺点:不知道 jieba 有没有对应的繁体字频统计。
而且我想在 HMM 服务降级的时候依然可以支持。
方案2-繁体字典预处理
基于 jieba-fenci + opencc4j 首先做一次预处理。
将所有的繁体词组处...
2020-01-09 02:09:32 |
Search