HMM(隐马尔科夫)是用来对序列数据X做标注Y的生成模型,用马尔科夫链(Markov Chain)对联合概率\(P(X,Y)\)建模: \(P(X,Y)= \Pi_{t} P(y_t|y_{t-1})P(x_t|y_t)\) 然后通过Viterbi算法求解P(Y|X)的最大值。

ReadMore »



在使用jupyter notebook开发过程中难免会遇到文件回退、历史文件对比等操作,如果手动对原始文件备份或者单纯靠记忆恢复历史版本总不容易想起细节问题,那么倘若Notebook可以像IDE那样使用版本控制就完美了。下面就介绍一种notebook 版本控制插件。

ReadMore »



中文分词是中文自然语言处理中关键基础技术之一。目前,传统机器学习分词算法依赖人工特征工程,该方法需要大量人工验证特征的有效性;基于神经网络的深度学习能使模型自动学习特征成为可能,并能对长距离信息依赖有效建模。

ReadMore »



针对大规模结构化预测问题的模型常常容易面临过拟合问题。过拟合问题是指模型在训练集上错误率很低,但在测试数据集上错误率偏高。要解决模型过拟合问题,我们需要对模型引入惩罚项以降低模型复杂度。具体有以下常用方法:

ReadMore »



论文 ON LARGE-BATCH TRAINING FOR DEEP LEARNING: GENERALIZATION GAP AND SHARP MINIMA

神经网络训练问题是非凸优化的重要内容,可用以下公式表示:

\[min_{x \in R^n} f(x) := \frac{1}{M}\sum_{i=1}^Mf_i(x)\]

ReadMore »