shuaijiang's blog

Paper Reading：《DEEP MIXTURE DENSITY NETWORKS FOR ACOUSTIC MODELING IN STATISTICAL PARAMETRIC SPEECH SYNTHESIS》

论文信息作者：Heiga Zen, Andrew Senior 单位：Google 会议：ICASSP 发表日期： 2014 论文链接：https://wiki.inf.ed.ac.uk/twiki/pub/CSTR/Speak13To14/p3872-zen.pdf 简介利用深层神经网络（DNNs）的参数语音合成（SPSS），被证明具有生成自然的合成语音的能力。然而，语音合成中基于DNN的声

12月 13 2014

#语音合成 #PaperReading

Paper Reading:《STATISTICAL PARAMETRIC SPEECH SYNTHESIS USING DEEP NEURAL NETWORKS》

论文信息作者：Heiga Zen, Andrew Senior, Mike Schuster 单位：Google 会议：ICASSP 发表日期： 2013 论文链接：http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=6639215 简介利用深层神经网络（Deep Neural Network,DNN）取代基于隐马尔科夫模型（Hidden

12月 10 2014

#语音合成 #PaperReading

深度学习——在信号与信息处理中的应用

介绍自从2006以来，深层结构学习，或者通常叫做深度学习（deep learning）、层次化学习（hierarchical learning），已经作为一个新的领域从机器学习中分离出来。深度学习有很多不同的定义：

11月 3 2014

#机器学习

朴素贝叶斯（naive Bayes）

简介朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。其基本的思路是：对于给定的训练数据集，首先基于特征条件独立假设学习输入和输出的联合概率分布，然后基于该模型，对于给定的输入x，利用贝叶斯定理求出后验概率最大的输出y。朴素贝叶斯法实现简单，学习和预测的效率都很高，是一种比较常用的方法。朴素贝叶斯法朴素贝叶斯法是典型的生成学习方法。输入空间$X$，输出空间$Y$，由训练数据学习联合概率分

10月 28 2014

#机器学习

K近邻法与k-means

简介K近邻法（knn）是一种基本的分类与回归方法。k-means是一种简单而有效的聚类方法。虽然两者用途不同、解决的问题不同，但是在算法上有很多相似性，于是将二者放在一起，这样能够更好地对比二者的异同。算法描述knn算法思路：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。 k近邻模型的三个基本要素： k值的选择：k值的选择会对

10月 18 2014

#机器学习

Perl过滤、复制文件

功能从指定的目录中，根据文件列表，将文件复制到指定的目录中。注意：文件列表没有指定文件后缀，输入参数中要指定文件后缀。核心部分：复制文件样例（demo）use File::Copy; copy("sourcefile","destinationfile") or die "Copy failed: $!"; 介绍（descripti

10月 16 2014

#Perl

《信息简史》读书笔记

起因之前就有人推荐《信息简史》这本书，趁京东周年庆打折，就买了下来。作为计算机方向的小硕，自然不能错过了这方面的好书。有很多业内知名人士推荐，有的还做了序，但是这些都掩盖不了原作者的低调和内涵。引子从香农的信息论开始说起。香农提出了比特这一概念，是用来测量信息的基本单位。从此之后，人类社会与以往任何时候大大不同了，人类迈入了影响至今的信息时代。

6月 4 2014

#信息浪潮

浅谈语音合成方法

引言从整个语音合成的发展历史来看，早期的机械式语音合成器反映了人们对语音产生机理了解得比较粗略，现代语音合成方法基本上都是采用一种语音模型来合成语音。近期的语音合成方法可以归纳为四种：1.物理机理语音合成；2.源-滤波器语音合成；3.基于波形拼接技术的语音合成；4.可训练的语音合成。5.基于神经网络的语音合成。

5月 21 2014

#语音合成

基于DTW的孤立词语音识别

引言近年来，语音识别已经成为一个非常活跃的研究领域。目前，语音识别技术已经作为一种重要的人机交互手段，辅助传统的键盘、鼠标等输入设备，在个人计算机上进行文字录入和操作控制。而在平板电脑、智能家电、工业现场控制等应用场合，语音识别技术则有更为广阔的发展前景。在特定人孤立词语音识别中，最为简单有效的方法是采用动态时间规整(Dynamic Time Warping,DTW) 算法，该算法基于动态规划的

5月 20 2014

#语音识别

人性之恶

昨天晚上在百讲看了北大爱雅玛雅剧团《请君入瓮》，不说是精彩纷呈，也算是发人深省；几位学生演员虽不是最专业，却一定是最投入的。当然，其中所揭示的道理，简单而又深刻，不得不引起大家的共鸣和反思。戏剧中的游戏是对一个人的审判，更是对人性的审判，让我们每个人都反思自己的人性，反思整个人类的丑与恶。我不想加入“人之初，性本善”与“人之初，性本恶”的争论之中，也不想惊叹人类千年所创造的文明。我只想反思人性之

5月 16 2014

#随笔