机器学习、数据分析类面经分享

菜鸟一枚,记录一下实习、秋招经历的较大公司面经,成功失败都是经历,写给自己,写给需要的同学,持续更新…

招聘信息来源:我个人关注牛客网、赛码网、应届生论坛、学院招聘、智联招聘、前程无忧、拉勾网、大街网、实习僧,以及公众号:

 

 

一、顺丰科技_秋招_校招_20170922

岗位:数据分析与运营

(一面)
20号下午笔试完,21号晚上六点半收到面试通知,22号一大早就来武汉面试了,进门签到,十点半左右开始等,闲着没事,一直跟旁边的刚产品一面完的小帅哥聊着,使劲吐槽他们专业工资低,羡慕计算机的,内心有点小庆幸和小窃喜,等到十一点十几分的样子,开始正式面试,进门好多个小桌子,挨得也比较紧,都是一对一面着,有点小吵

(1)自我介绍,我说了下姓名,学校,项目,论文和实习
(2)剩下的面试时间基本都是在聊项目,很多东西他都没具体问,都是我自己主动说的,大概包括:项目时长,时间分配,数据采集,特征计算,算法选择,效果提升等。

详细说说:

中间面试官会穿插着问特别多小细节,幸亏项目是自己亲生的,我自己也主动补充了很多,具体记不清,大概问了:


正负样本不均衡怎么处理(我说的是三大类:增加正样本(正样本复制等)、减少负样本(拆分成N份做交叉验证)、修改代价函数(如“对正样本误判为负样本的”惩罚加大)这三类,答完他问我还有吗,我想半天没答到他预期的点上,他又帮我补充了一下,说可以利用正样本生成新的正样本,比如样本均值等)

核函数怎么选择(当时没全部记起来,回来看书补充一下:

 

设特征量为A,样本数为B

建议

1

A>>B

线性核

2

A<<B

RBF或者LIBLINEAR(设置-s 2)

参考:http://www.cnblogs.com/baiting/p/5246877.html

3

A大,且A==B,

线性核,且LIBLINEAR比LIBSVM快

4

A<B

添加特征,回到第三种情况

5

A小,B正常

RBF

 

我当时只说了可以根据特征数量与样本数量的比值选,他听完没补充,但说了一点,说其他核函数选择很重要什么的,不记得了,好像是说参数问题,说svm不像其他Adaboost什么的,效果不好你可以甩锅说是算法问题,而SVM 不行,这个没太听懂,可惜了)

项目定位:我的科研项目自己定位是二分类问题,他问其实除了是二分类问题,这还可以是个什么问题?还可以怎么解决或应用到哪?我没听懂,他给我举了个观众与电影的例子,预测观众可能对哪些他们没打分的电影感兴趣,感觉他这个想法蛮好的,将项目扩展一下到其他应用领域,值得思考。我讲解项目数据的三个网络的时候,他还用电影那个例子给了我个思考点,比如电影和电影间的信息其实也可以利用到电影和观众的关系处理间,也不错,思维给力

AUC:期间我自己主动谈到实习内容,但他好像不咋感兴趣,仍旧接着问我项目,问我的auc具体提高到了多少,我把我百分之九十几报出来后,他问了个我曾经和导师讨论过的问题,为什么auc这么高?记得邓老师当时好像是说AUC太高可能和其他网络的密度大有关系

大致就这些,和暑假在顺丰科技内推面的机器学习岗不同,没问算法原理,没问数据结构,操作系统什么的,一直在聊那个科研项目,因为自己比较熟悉,所以基本上我自己话也蛮多,又因为面试官实在太nice!各种给我补充和建议,还扩展了很多知识和内容,感觉收获满满,纯粹当做一个和前辈的学习讨论

其他:后来,他问我有啥问题,我说您觉得我能进下一面吗?或者我有没有哪方面的知识需要再强化一下的?然后,他说我们都过分关注这个结果如何,其实,公司与人才之间是一个匹配的过程,面试通不通过只能说明合不合适。至于我的能力补充方面的话,问我会不会sql查询,我就提到了昨天笔试好多sql,不知道写对了没,他说昨天的笔试题都是他们一个个人工打分的。然后,让我说说“找出班上最高的男生女生信息”的查询思路,其实蛮简单,可惜当时脑子锈掉,答得支支吾吾,说了top1,group by,感觉面试官不太满意,也没说我啥,只告诉我他是咋查的,然后就结束了,让我出去先等会。(好像"先等会"的意思是有下一轮,"回去等通知"的意思是挂了)

运气好,碰到的面试官真的太nice,说话措辞很讲究,给我纠正错误或扩展知识的时候,说的话都让人听着很舒服,类似“具体不记得没关系,你讲讲思路就好”“我不是指你的错了,我只是觉得怎样怎样会更好”“其实你这里可以再发散一下”…

(二面)
出去等了几分钟,正在网上搜HR面经,就来叫我了,HR面就在我那个技术面的隔壁桌,刚坐下还和上个面试官不小心对视上了,本来想笑一下又没来得及笑,额,有点小尴尬。
HR面开始也是自我介绍,问科研项目是几个人做的,职业规划如何,为什么选这个岗位,还投了什么公司(这个没回答好),你和其他人比差距在哪里,你有啥问的。

中间我自己也补充了很多,反正就各种暗戳戳地表明顺丰很牛B,很想留深圳啥的,最后说下周出结果,让我回去等通知。

 

二、顺丰科技_秋招_内推_20170830

岗位:机器学习与人工智能

8月16号内推,投了两个岗位,机器学习与人工智能+数据运营与分析,29号接到电话约30号电话面试,约的时间是09:00~09:30,到点后迟迟没来电话,十点多发邮件问了下,下午两点正式开始面,大概问了些如下内容:

1、学校:本科专业学什么,本科专业什么时候开通的(他说没听说过),硕士上什么课,学什么
2、论文实验:数据来源,特征如何计算出来的,libsvm算法实现的细节(CG值如何确定、L1、L2正则化等)
3、机器学习算法:就问了一个k-means,我说了下算法流程,K值选取,聚类中心确定,度量值,空簇,噪声处理等
4、python:dataframe的列类型是什么(series)
5、数据结构、操作系统:有哪些数据结构(二叉树、链表、数组等),判断单链表是否成环,死锁的四个条件,TCP-IP的三次握手

他还解释了下为啥要问我数据结构,大概是检验一下你的知识体系,基本都是本科学过的东西,大部分都实在是记不得了

最后,我问了下面试官工作地点,表达了我想去深圳的意愿,然后岗位选择,他说具体岗位都是入职后再决定的,其实面哪个岗位不是很重要,整个过程约半小时

自我感觉就是有点紧张,中间卡壳了好几次,无论如何,打响秋招面试第一枪,加油复习吧

 

三、阿里_春招_内推_20170328

补充一个春招的时候阿里内推面经
岗位:算法工程师-机器学习
23号左右,同学师兄内推,27号下午打电话说要面试,我改到28号上午。
1.自我介绍,有没有项目或比赛经验,有没有自己实现的算法,有的话主要问你实现过的,不会问具体计算公式,都是问含义、思路、背景和意义等,主要看你是不是真的理解这种算法,知道每个过程背后的含义。
2.K means(算法都是自己先讲过程,再讨论问题)如果聚类中心一直变化,如何停止迭代;初始中心如何确定;
3.KNN和朴素贝叶斯。脑子锈掉,半天没憋出来,本来期望面试官问我问题我来答,结果都被他直接跳过去了(尴尬),所以,算法最好私下嘴巴也练练,最好像老师给学生讲课一样,能说出来,不要变成哑巴知识
4.决策树,信息增益是什么,有啥作用,一般如果问的一两个问题都答不上来,这个算法就PASS了,估计就是评估为:不及格。
5.SVM,什么是支持向量,超平面如何确定的,核函数作用,核函数与超平面关系,啥都能聊几句才能多问你点,不然一下就问完了,我面试时间估计只有别人的一般,怪自己学得不扎实,实践又少,又不会说╮(╯▽╰)╭
6.Hadoop,MapReduce过程,作用
7.估计是看我啥都不太懂,让我自己补充,说一下自己了解的点,然而我也一个都想不起来,所以,就这样结束了,over。
简直惨不忍睹,不过还是写出来,没关系,慢慢来,一次会比一次好
感觉面试官应该是面了太多人,不太想说话,所以问问题都很简洁(比如:你讲讲KNN吧),主要靠你说,自己要多发挥,知道的都聊聊,我是感觉电话面不说话的话,很尴尬,所以想不起来的话,我就直接说太紧张了,一下子记不起,能不能让我想想之类的,面试官也很nice,一直让我不要紧张,慢慢来
忠告:一切都还是要学扎实!要了解知识背后的意义,多练习一下把知识说出来

赞 (0) 评论 分享 ()