BAT机器学习面试题及解析(261-265题)
2017-12-11 00:00
489 查看
[b][b][b][b][b][b][b]
[/b][/b][/b][/b][/b][/b][/b]本系列作为国内首个AI题库,囊括绝大部分机器学习和深度学习的笔试面试题、知识点,可以作为机器学习自测题,也可以当做查漏补缺的资料库。前260题已发(链接见文末),后续请关注本公众号。
关于如何学习机器学习,最推荐机器学习集训营系列(点击文末“阅读原文”)。从Python基础、数据分析、爬虫,到数据可视化、spark大数据,最后实战机器学习、深度学习等一应俱全。261.以下哪个图是KNN算法的训练边界 ?
A) BB) AC) DD) CE) 都不是点击下方空白处可显示答案答案: BKNN算法肯定不是线性的边界, 所以直的边界就不用考虑了。另外这个算法是看周围最近的k个样本的分类用以确定分类,所以边界一定是坑坑洼洼的。262.如果一个训练好的模型在测试集上有100%的准确率, 这是不是意味着在一个新的数据集上,也会有同样好的表现? :A. 是的,这说明这个模型的范化能力已经足以支持新的数据集合了B. 不对,依然后其他因素模型没有考虑到,比如噪音数据点击下方空白处可显示答案
答案: B
没有一个模型是可以总是适应新数据的。我们不可能可到100%准确率。263.下面的交叉验证方法 :
i. 有放回的Bootstrap方法ii. 留一个测试样本的交叉验证iii. 5折交叉验证iv. 重复两次的5折教程验证当样本是1000时,下面执行时间的顺序,正确的是:A. i > ii > iii > ivB. ii > iv > iii > iC. iv > i > ii > iiiD. ii > iii > iv > i点击下方空白处可显示答案
答案: B
Boostrap方法是传统地随机抽样,验证一次的验证方法,只需要训练1次模型,所以时间最少。
留一个测试样本的交叉验证,需要n次训练过程(n是样本个数),这里,要训练1000个模型。
5折交叉验证需要训练5个模型。
重复2次的5折交叉验证,需要训练10个模型。
264.变量选择是用来选择最好的判别器子集, 如果要考虑模型效率,我们应该做哪些变量选择的考虑? :
1. 多个变量其实有相同的用处
2. 变量对于模型的解释有多大作用
3. 特征携带的信息
4. 交叉验证A. 1 和 4B. 1, 2 和 3C. 1,3 和 4D. 以上所有点击下方空白处可显示答案答案: C注意, 这题的题眼是考虑模型效率,所以不要考虑选项2.265.对于线性回归模型,包括附加变量在内,以下的可能正确的是 :
1. R-Squared 和 Adjusted R-squared都是递增的
2. R-Squared 是常量的,Adjusted R-squared是递增的
3. R-Squared 是递减的, Adjusted R-squared 也是递减的
4. R-Squared 是递减的, Adjusted R-squared是递增的A. 1 和 2B. 1 和 3C. 2 和 4D. 以上都不是点击下方空白处可显示答案
答案: DR-squared不能决定系数估计和预测偏差,这就是为什么我们要估计残差图。但是,R-squared有R-squared 和 predicted R-squared 所没有的问题。
每次你为模型加入预测器,R-squared递增或不变.详细请看这个链接:https://discuss.analyticsvidhya.com/t/difference-between-r-square-and-adjusted-r-square/264/3
《BAT机器学习面试1000题系列》往期题目:BAT机器学习面试1000题系列(第1~60题)
BAT机器学习面试1000题系列(第61~100题)
BAT机器学习面试1000题系列(第101~200题)
BAT机器学习面试1000题系列(第201~250题)
BAT机器学习面试1000题系列(第251~255题)
BAT机器学习面试1000题系列(第256~260题)
点击下方“阅读全文”,预约机器学习集训营
[/b][/b][/b][/b][/b][/b][/b]本系列作为国内首个AI题库,囊括绝大部分机器学习和深度学习的笔试面试题、知识点,可以作为机器学习自测题,也可以当做查漏补缺的资料库。前260题已发(链接见文末),后续请关注本公众号。
关于如何学习机器学习,最推荐机器学习集训营系列(点击文末“阅读原文”)。从Python基础、数据分析、爬虫,到数据可视化、spark大数据,最后实战机器学习、深度学习等一应俱全。261.以下哪个图是KNN算法的训练边界 ?
A) BB) AC) DD) CE) 都不是点击下方空白处可显示答案答案: BKNN算法肯定不是线性的边界, 所以直的边界就不用考虑了。另外这个算法是看周围最近的k个样本的分类用以确定分类,所以边界一定是坑坑洼洼的。262.如果一个训练好的模型在测试集上有100%的准确率, 这是不是意味着在一个新的数据集上,也会有同样好的表现? :A. 是的,这说明这个模型的范化能力已经足以支持新的数据集合了B. 不对,依然后其他因素模型没有考虑到,比如噪音数据点击下方空白处可显示答案
答案: B
没有一个模型是可以总是适应新数据的。我们不可能可到100%准确率。263.下面的交叉验证方法 :
i. 有放回的Bootstrap方法ii. 留一个测试样本的交叉验证iii. 5折交叉验证iv. 重复两次的5折教程验证当样本是1000时,下面执行时间的顺序,正确的是:A. i > ii > iii > ivB. ii > iv > iii > iC. iv > i > ii > iiiD. ii > iii > iv > i点击下方空白处可显示答案
答案: B
Boostrap方法是传统地随机抽样,验证一次的验证方法,只需要训练1次模型,所以时间最少。
留一个测试样本的交叉验证,需要n次训练过程(n是样本个数),这里,要训练1000个模型。
5折交叉验证需要训练5个模型。
重复2次的5折交叉验证,需要训练10个模型。
264.变量选择是用来选择最好的判别器子集, 如果要考虑模型效率,我们应该做哪些变量选择的考虑? :
1. 多个变量其实有相同的用处
2. 变量对于模型的解释有多大作用
3. 特征携带的信息
4. 交叉验证A. 1 和 4B. 1, 2 和 3C. 1,3 和 4D. 以上所有点击下方空白处可显示答案答案: C注意, 这题的题眼是考虑模型效率,所以不要考虑选项2.265.对于线性回归模型,包括附加变量在内,以下的可能正确的是 :
1. R-Squared 和 Adjusted R-squared都是递增的
2. R-Squared 是常量的,Adjusted R-squared是递增的
3. R-Squared 是递减的, Adjusted R-squared 也是递减的
4. R-Squared 是递减的, Adjusted R-squared是递增的A. 1 和 2B. 1 和 3C. 2 和 4D. 以上都不是点击下方空白处可显示答案
答案: DR-squared不能决定系数估计和预测偏差,这就是为什么我们要估计残差图。但是,R-squared有R-squared 和 predicted R-squared 所没有的问题。
每次你为模型加入预测器,R-squared递增或不变.详细请看这个链接:https://discuss.analyticsvidhya.com/t/difference-between-r-square-and-adjusted-r-square/264/3
《BAT机器学习面试1000题系列》往期题目:BAT机器学习面试1000题系列(第1~60题)
BAT机器学习面试1000题系列(第61~100题)
BAT机器学习面试1000题系列(第101~200题)
BAT机器学习面试1000题系列(第201~250题)
BAT机器学习面试1000题系列(第251~255题)
BAT机器学习面试1000题系列(第256~260题)
点击下方“阅读全文”,预约机器学习集训营
相关文章推荐
- BAT机器学习面试题及解析(256-260题)
- BAT机器学习面试题及解析(296-300题)
- BAT机器学习面试题及解析(266-270题)
- BAT机器学习面试题及解析
- BAT机器学习面试题及解析(296-300题)
- BAT机器学习面试题及解析(276-280题)
- BAT Android工程师面试流程解析+还原最真实最完整的一线公司面试题
- BAT机器学习面试题1000题(321~325题)
- BAT机器学习面试题
- BAT机器学习面试题1000题(201~300题)
- BAT机器学习面试题1000题(311~315题)
- BAT面试题精选 | 一个完整机器学习项目的流程(视频)
- BAT机器学习面试题1000题(306~310题)
- 《良心之作》BAT|无线工程师面试流程详细解析|还原最真实最完整的一线公司面试题
- 深入理解 js this 绑定 (尾部有总结和面试题解析 )
- 嵌入式linux面试题解析(一)——ARM部分二
- BAT机器学习面试题及解析(301-305题)
- 剑指 offer代码解析——面试题39判断平衡二叉树
- 2017年初BAT的JAVA面试题汇集
- 一道“简单”的面试题_自动装箱和拆箱源码解析