jupyter notebook版本控制扩展nbdime
在使用jupyter notebook开发过程中难免会遇到文件回退、历史文件对比等操作,如果手动对原始文件备份或者单纯靠记忆恢复历史版本总不容易想起细节问题,那么倘若Notebook可以像IDE那样使用版本控制就完美了。下面就介绍一种notebook 版本控制插件。
在使用jupyter notebook开发过程中难免会遇到文件回退、历史文件对比等操作,如果手动对原始文件备份或者单纯靠记忆恢复历史版本总不容易想起细节问题,那么倘若Notebook可以像IDE那样使用版本控制就完美了。下面就介绍一种notebook 版本控制插件。
中文分词是中文自然语言处理中关键基础技术之一。目前,传统机器学习分词算法依赖人工特征工程,该方法需要大量人工验证特征的有效性;基于神经网络的深度学习能使模型自动学习特征成为可能,并能对长距离信息依赖有效建模。
针对大规模结构化预测问题的模型常常容易面临过拟合问题。过拟合问题是指模型在训练集上错误率很低,但在测试数据集上错误率偏高。要解决模型过拟合问题,我们需要对模型引入惩罚项以降低模型复杂度。具体有以下常用方法:
论文 ON LARGE-BATCH TRAINING FOR DEEP LEARNING: GENERALIZATION GAP AND SHARP MINIMA
神经网络训练问题是非凸优化的重要内容,可用以下公式表示:
\[min_{x \in R^n} f(x) := \frac{1}{M}\sum_{i=1}^Mf_i(x)\]1、先读文献摘要
摘要部分是对paper内容高度抽象浓缩,既可以帮助对要讨论的内容的建立把握、认识,也能帮助从众多论文中筛选优质内容节省时间。对于不是自己关注研究领域,仅读摘要部分也不失为一种开阔视野的方法。
2、明确所在研究领域的大问题
站在更高的视角上,明确所在研究领域的大问题,而不是着急地去考究这一篇论文在阐述什么。