面试题快问 快答

HMM 概念原理(Viterbi算法)
BEMS序列组合
P(E|B) = 0.851, P(M|B) = 0.149,说明当我们处于一个词的开头时,下一个字是结尾的概率
要远高于下一个字是中间字的概率,符合我们的直觉,因为二个字的词比多个字的词更常见

Viterbi算法

KNN 概念
kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性

NLTK 中文进度

CF(协同过滤)

CW(模型概念)

PMI值 的计算
衡量两个词的共现程度:PMI (Point mutual information) .

问神经网络的实现机制、目标函数的选取、怎么优化的、怎么处理文本、自然语言处理的方法、tesorflow的细节问题等

机器学习和数据挖掘常用的模型和公式,比如回归、HMM等。

Leave a Reply

Your email address will not be published. Required fields are marked *