蒙特卡罗方法 Monte Carlo method
蒙特·卡罗方法(Monte Carlo method)
蒙特·卡罗方法(Monte Carlo method),也称统计模拟方法,是二十世纪四十年代中期由于科学技术的发展和电子计算机的发明,而被提出的一种以概率统计理论为指导的一类非常重要的数值计算方法。
是指使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。与它对应的是确定性算法。
蒙特·卡罗方法在金融工程学,宏观经济学,计算...
2020-01-28 02:09:32 |
Math
矩阵乘法简介 Matrix multiplication
矩阵乘法
矩阵相乘最重要的方法是一般矩阵乘积。
它只有在第一个矩阵的列数(column)和第二个矩阵的行数(row)相同时才有意义。
一般单指矩阵乘积时,指的便是一般矩阵乘积。
一个m×n的矩阵就是m×n个数排成m行n列的一个数阵。
由于它把许多数据紧凑地集中到了一起,所以有时候可以简便地表示一些复杂的模型,如电力系统网络模型。
定义
基本性质
乘法结合律...
2020-01-28 02:09:32 |
Math
马尔科夫链
马尔科夫链
马尔可夫链(Markov Chain, MC)是概率论和数理统计中具有马尔可夫性质(Markov property)且存在于离散的指数集(index set)和状态空间(state space)内的随机过程(stochastic process。
适用于连续指数集的马尔可夫链被称为马尔可夫过程(Markov process),但有时也被视为马尔可夫链的子集,即连续时间马尔可夫...
2020-01-28 02:09:32 |
Math
最大熵和对数线性模型-实现中文词性标注
上一讲主要内容回顾(Last time):
基于转换的标注器(Transformation-based tagger)
基于隐马尔科夫模型的标注器(HMM-based tagger)
遗留的内容(Leftovers):
a) 词性分布(POS distribution)
i. 在Brown语料库中按歧义程度排列的词型数目(The numbe...
2020-01-28 02:09:32 |
Math
隐马尔可夫(HMM)实现中文词性标注 MIT 笔记
基本介绍
a) 标注问题(Tagging)
i. 任务(Task): 在句子中为每个词标上合适的词性(Label each word in a sentence with its appropriate part of speech)
ii. 输入(Input): Our enemies are innovative and resourceful , and so are we....
2020-01-28 02:09:32 |
Math
隐马尔可夫(HMM)实现中文词性标注
词性标注
词性标注(Part-of-Speech tagging 或 POS tagging)是指对于句子中的每个词都指派一个合适的词性,也就是要确定每个词是名词、动词、形容词或其他词性的过程,又称词类标注或者简称标注。
词性标注是自然语言处理中的一项基础任务,在语音识别、信息检索及自然语言处理的许多领域都发挥着重要的作用。
因此,在关于自然语言处理的书籍中,都会将词性标注单列一章重点...
2020-01-28 02:09:32 |
Math
隐马尔可夫(HMM)实现中文分词
中文分词
HMM 的应用场景有很多,我们首先来谈一谈如何实现中文分词。
本文假设读者已经对HMM有所了解,很多地方会直接提出相关概念。
理解前向算法,维特比算法是关键,关于无监督学习HMM的Baum-Welch算法在本文中没有使用,至少了解它的作用即可。
中文分词的难处
总所周知,在汉语中,词与词之间不存在分隔符(英文中,词与词之间用空格分隔,这是天然的分词标记),词本身也缺乏明显...
2020-01-28 02:09:32 |
Math
一些有趣的考验反应能力的题目
序章
收集一些有趣的小问题,活跃一些思维。
一道著名的毒酒问题
题目
有1000 桶酒,其中1 桶有毒。而一旦吃了,毒性会在1 周后发作。
现在我们用小老鼠做实验,要在1 周内找出那桶毒酒,问最少需要多少老鼠。
思路
需要10只老鼠就可以。
10只老鼠按从左到右的顺序编好号1-10,同时每桶酒通过二进制的方式编上号。编号需要写满10位,不够十位数的前面添度0补满。分别取数位和...
2020-01-23 02:09:32 |
Interview