以下是今年题,因为这些题可能会造成误解,所以加粗部分是手抄下来和考试基本一字未改,所以不用怀疑题目抄错
造成歧义,除非期末题本身出现歧义。和往年题有不少重复(极度怀疑老师看我们在群里问什么,他就拿什么作为考题,因为他也不知道考什么了,他之前还说要改变题啥的。。。)
* 请说明参数正则化和参数先验之间的关系,并解释机器模型参数估计为什么有时候使用正则化 (6分)
* 条件熵定义,举例,并说明有什么好处,给出直观解释(8分)
* NB的基本假设,有什么好处,如果在实际应用中满足,是否可以称为在出错概率意义下的最优分类器,为什么。(8分)
* 简述K-means算法和GMM模型EM算法的相同与不同点,并说明优势与劣势,GMM参数估计,E步更新的公式是什么,在该公式下,M步所最大化的期望是什么
。(8分)
* 线性可分下,SVM优化目标、约束,并写出解的形式(数学公式表达),以上公式可以直接优化求解,为什么要使用对偶,好处是什么。(8分)
* EM优化GMM模型时,有时会出现类条件分布的参数协方差矩阵不可逆,分析其原因,你一般如何解决。(6分)
* 逻辑回归所求的分类器是线性分类器吗,如果是,请说明原因,如果不是,请说明理由。(8分)
* 向量(或函数)内积在《机器学习》课程中多次出现,请举出三个例子,并解释。(8分)
<>
ps:如果,往年期末是训练集,真正期末是测试集,那么学的过拟合也挺好的,没必要剪枝,而且说不定比你自己瞎学分还高。最后这测试集出得太la了,亏他还是教ML的,而且其实课堂去不去都无所谓了,自学即可。。。