word2vec:词表示

前言

介绍

word2vec 是Google 2013年创建的一个项目, 其是“Tool for computing continuous distributed representations of words”。

word2vec 的安装非常简单,得到源码后,直接“make”即可。

原理

针对(大)语料,通过神经网络的训练,得到词表示。

网络结构

  • skipgram
  • cbow

实验

下面就动手做下实验。

总结