设为首页 加入收藏

TOP

2013年百度机器学习/数据挖掘工程师面试题集
2014-11-23 21:40:15 来源: 作者: 【 】 浏览:104
Tags:2013年 百度 机器 学习 数据挖掘 工程师 试题集

面试部分:


1. 根据简历问我研究生阶段做的东西。我说基因微阵列缺失点的重建,用到了矩阵填充、最小二乘法求系数等。然后他让我解释一下矩阵填充,我说是以矩阵的 低秩为假设条件和优化目标的,他问为什么会低秩。


2. 问我这个低秩的目标是怎么实现的,我说了两个方法,svt和ALM


3. 问我做东西主要用什么语言,我说matlab、c++和c#,他就问了c++中的虚函数是干 嘛的,我慌忙中竟然没想起来那个词叫什么,说了句“动态连接”,然后说什么编译的时候不决定执行那个函数,到执行的时候才决定运行指向的函数,后来想出来 这不是“动态连接”,而是“动态绑定”


4. 信号量机制是怎么实现的


5. 了解哪些聚类算法,我说k-means和层次聚类


6. 用过哪些分类算法?


笔试部分:


一、简答题(30分)
1、简述数据库操作的步骤(10分)
2、TCP/IP的四层结构(10分)
3、什么是MVC结构,简要介绍各层结构的作用(10分)
二、算法与程序设计(45分)
1、由a-z、0-9组成3位的字符密码,设计一个算法,列出并打印所有可能的密码组合(可用伪代码、C、C++、Java实现)(15分)
2、实现字符串反转函数(15分)
3、百度凤巢系统,广告客户购买一系列关键词,数据结构如下:(15分)
User1 手机 智能手机 iphone 台式机 …
User2 手机 iphone 笔记本电脑 三星手机 …
User3 htc 平板电脑 手机 …
(1)根据以上数据结构对关键词进行KMeans聚类,请列出关键词的向量表示、距离公式和KMeans算法的整体步骤
(2)计算给定关键词与客户关键词的文字相关性,请列出关键词与客户的表达符号和计算公式
三、系统设计题(25分)
一维数据的拟合,给定数据集{xi,yi}(i=1,…,n),xi是训练数据,yi是对应的预期值。拟使用线性、二次、高次等函数进行拟合
线性:f(x)=ax+b
二次:f(x)=ax^2+bx+c
三次:f(x)=ax^3+bx^2+cx+d
(1)请依次列出线性、二次、三次拟合的误差函数表达式(2分)
(2)按照梯度下降法进行拟合,请给出具体的推导过程。(7分)
(3)下图给出了线性、二次和七次拟合的效果图。请说明进行数据拟合时,需要考虑哪些问题。在本例中,你选择哪种拟合函数。(8分)
(4)给出实验方案(8分)


】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到: 
上一篇阿里巴巴面试题及面试经历 下一篇上海期货面试题

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容: