百度NLP二面-电话面
2013-09-26 15:26
225 查看
实验室项目:1.实验室方向
2.用两分钟介绍自己的项目,创新点在哪里
个人项目: 1.自己实现的贝叶斯分类器,目的,怎么做的
2.怎么计算各个分类的先验。(因为我使用的训练预料是每个分类10篇,没有分类的先验)
3 每个主题有10篇文档,假设有1W篇文档,如何分到不同的主题中(我答的是计算与每个文档中其它文章的相似度,每个doc用一个term数组来表示,数组中每位表示的是这个文档中该单词 出现的个数(过滤掉停用词), 面试官提示会有漏掉的停用词,我说用出现的次数除于TF, 面试官说这就是TF-IDF)
算法: 1.STL中set怎么实现的,假设有“I like love”三个词,如何存。每个节点是直接指向这个单词的指针吗)
2.假设有100W个单词,如何存储(我答的是trie树,面试官问每个节点会有很多子节点,每个子节点是一个指针,占用8个字节,如何节省空间,我说不知道,面试官提示双数组trie树)
3.假设一个文档,连续的K个词,认为是一个时间窗口,一个时间窗口的词有关系,如何得到所有的时间窗口。(当时记得有个算法,但是忘了,应该是k-shingle算法)
4. 很多单词,如何计算单词之间的相似度(或者对单词进行分类)
C++ : 1.程序有错误如何调试(回答打log,如何段错误,gdb调试core文件)
2.如何用gdb调试core文件,
3.如何想让变量a=100的时候中断,如何写gdb代码
4. Makefile文件,提示未定义的引用,是什么原因(我答的是使用C库忘记加extern,其实应该是没有在makefile指定编译顺序)
5. g++中-L,-I,-l的作用,有什么区别。-l指定链接库的时候,如何a库依赖b库,是否a库必须放在b库前面
2.用两分钟介绍自己的项目,创新点在哪里
个人项目: 1.自己实现的贝叶斯分类器,目的,怎么做的
2.怎么计算各个分类的先验。(因为我使用的训练预料是每个分类10篇,没有分类的先验)
3 每个主题有10篇文档,假设有1W篇文档,如何分到不同的主题中(我答的是计算与每个文档中其它文章的相似度,每个doc用一个term数组来表示,数组中每位表示的是这个文档中该单词 出现的个数(过滤掉停用词), 面试官提示会有漏掉的停用词,我说用出现的次数除于TF, 面试官说这就是TF-IDF)
算法: 1.STL中set怎么实现的,假设有“I like love”三个词,如何存。每个节点是直接指向这个单词的指针吗)
2.假设有100W个单词,如何存储(我答的是trie树,面试官问每个节点会有很多子节点,每个子节点是一个指针,占用8个字节,如何节省空间,我说不知道,面试官提示双数组trie树)
3.假设一个文档,连续的K个词,认为是一个时间窗口,一个时间窗口的词有关系,如何得到所有的时间窗口。(当时记得有个算法,但是忘了,应该是k-shingle算法)
4. 很多单词,如何计算单词之间的相似度(或者对单词进行分类)
C++ : 1.程序有错误如何调试(回答打log,如何段错误,gdb调试core文件)
2.如何用gdb调试core文件,
3.如何想让变量a=100的时候中断,如何写gdb代码
4. Makefile文件,提示未定义的引用,是什么原因(我答的是使用C库忘记加extern,其实应该是没有在makefile指定编译顺序)
5. g++中-L,-I,-l的作用,有什么区别。-l指定链接库的时候,如何a库依赖b库,是否a库必须放在b库前面
相关文章推荐
- 百度NLP二面
- 百度电话二面
- 【百度】生态质量部 测试开发实习生 电话二面
- 2017年暑假实习面经: 去哪儿网(一面, 二面, HR面, Offer), 腾讯IEG(一面, GG...), 百度(一面, 二面, 三面, offer)
- 20170605_WPSC++实习_电话二面
- 2013.10.14(天津站)百度研发二面总结
- 百度二面时候的一道题
- 百度电话面试PHP职位
- 利用百度nlp 来进行 各种自然语言分析和 文本分析
- 百度PHP电话面试之十问
- 百度2015校招二面coding面试题
- 20170605_WPSC++实习_电话二面
- 技术面试问题汇总第007篇:腾讯管家反病毒工程师-电话二面
- 2013.9月,百度电话面试经验
- 百度二面
- 谨纪念第一次面试,电话面试,百度一面。。
- 如果没有接起百度的电话(搞笑)
- 百度NLP架构与应用
- 2014年百度实习电话面试
- [读书笔记]百度在NLP领域做了哪些工作