您的位置:首页 > 职场人生

BAT机器学习面试题及解析(261-265题)

2017-12-11 00:00 489 查看
[b][b][b][b][b][b][b]

[/b][/b][/b][/b][/b][/b][/b]本系列作为国内首个AI题库,囊括绝大部分机器学习和深度学习的笔试面试题、知识点,可以作为机器学习自测题,也可以当做查漏补缺的资料库。前260题已发(链接见文末),后续请关注本公众号。
关于如何学习机器学习,最推荐机器学习集训营系列(点击文末“阅读原文”)。从Python基础、数据分析、爬虫,到数据可视化、spark大数据,最后实战机器学习、深度学习等一应俱全。261.以下哪个图是KNN算法的训练边界  ? 

A) BB) AC) DD) CE) 都不是点击下方空白处可显示答案答案: BKNN算法肯定不是线性的边界, 所以直的边界就不用考虑了。另外这个算法是看周围最近的k个样本的分类用以确定分类,所以边界一定是坑坑洼洼的。262.如果一个训练好的模型在测试集上有100%的准确率, 这是不是意味着在一个新的数据集上,也会有同样好的表现? :A. 是的,这说明这个模型的范化能力已经足以支持新的数据集合了B. 不对,依然后其他因素模型没有考虑到,比如噪音数据点击下方空白处可显示答案
答案: B
没有一个模型是可以总是适应新数据的。我们不可能可到100%准确率。263.下面的交叉验证方法 :
i. 有放回的Bootstrap方法ii. 留一个测试样本的交叉验证iii. 5折交叉验证iv. 重复两次的5折教程验证当样本是1000时,下面执行时间的顺序,正确的是:A. i > ii > iii > ivB. ii > iv > iii > iC. iv > i > ii > iiiD. ii > iii > iv > i点击下方空白处可显示答案
答案: B
Boostrap方法是传统地随机抽样,验证一次的验证方法,只需要训练1次模型,所以时间最少。

留一个测试样本的交叉验证,需要n次训练过程(n是样本个数),这里,要训练1000个模型。

5折交叉验证需要训练5个模型。

重复2次的5折交叉验证,需要训练10个模型。

264.变量选择是用来选择最好的判别器子集, 如果要考虑模型效率,我们应该做哪些变量选择的考虑? :
1. 多个变量其实有相同的用处
2. 变量对于模型的解释有多大作用
3. 特征携带的信息
4. 交叉验证A. 1 和 4B. 1, 2 和 3C. 1,3 和 4D. 以上所有点击下方空白处可显示答案答案: C注意, 这题的题眼是考虑模型效率,所以不要考虑选项2.265.对于线性回归模型,包括附加变量在内,以下的可能正确的是 :
1. R-Squared 和 Adjusted R-squared都是递增的
2. R-Squared 是常量的,Adjusted R-squared是递增的
3. R-Squared 是递减的, Adjusted R-squared 也是递减的
4. R-Squared 是递减的, Adjusted R-squared是递增的A. 1 和 2B. 1 和 3C. 2 和 4D. 以上都不是点击下方空白处可显示答案
答案: DR-squared不能决定系数估计和预测偏差,这就是为什么我们要估计残差图。但是,R-squared有R-squared 和 predicted R-squared 所没有的问题。
每次你为模型加入预测器,R-squared递增或不变.详细请看这个链接:https://discuss.analyticsvidhya.com/t/difference-between-r-square-and-adjusted-r-square/264/3
《BAT机器学习面试1000题系列》往期题目:BAT机器学习面试1000题系列(第1~60题)

BAT机器学习面试1000题系列(第61~100题)
BAT机器学习面试1000题系列(第101~200题)
BAT机器学习面试1000题系列(第201~250题)
BAT机器学习面试1000题系列(第251~255题)
BAT机器学习面试1000题系列(第256~260题)




点击下方“阅读全文”,预约机器学习集训营
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: