数据分析面经(头条/拼多多/携程/网易/银联/招行卡)

作者:为什么邮箱还是空的。。

今日头条-数据分析师(三面挂)
参加的是18的春招。一共面了三面,最后挂在了leader面上,三面下来整体感觉就是很不舒服,挺多问题答得比较牵强。头条的数据分析岗位在产品类下,因此问得非常偏产品,而我的产品相关经历也比较少,平时也不爱用不爱钻研。各家的数据分析岗需求还是挺不一样,确实需要针对性的准备。
笔试
数学题,好像都是排列组合、概率统计计算等等,没有相关技术问题,也没有代码
 
一面-2018.05  约45分钟
我当时在海外错过了专场了,后来HR给我发邮件约视频面试
1. 自我介绍+数据分析项目经历:答了自己在学校做的企业咨询项目,业务背景是法律的,面试官似乎不太感兴趣
2. 开始问产品经历:用过什么产品、体验怎么样、有没有优化建议。平时确实不怎么玩产品,有时间基本都刷网课、打比赛了,为了迎合一下公司勉强答了抖音。面试官以后就开始问抖音的使用体验了,有没有产品优化建议。之后我俩围绕抖音视频没有进度条这个问题讨论了挺多的。
3. 突然问我想做技术还是业务我怕答得不对口,敷衍了一下说都行;面试官坚持要我答,说了技术(面试官沉默了一下)
4. 问了点业务场景问题,印象比较深的一个是抖音要在直播和问答中选一个功能在产品里重点推广,怎么选?当时回答的不太好,后来想想应该设计一个A/B test
5. 面试官最后说了他做的东西偏业务,问我有没有什么想问的:没有了,感觉有点凉了。。
 
二面-2018.05[b] 约60分钟[/b]
之后一周左右吧,参加二面
1. 自我介绍+数据分析项目经历:还是说和上面同一个项目,对面依旧不怎么感兴趣
2. 因为项目里用了很多模型,就问了几个,比如解释K-means和随机森林的原理
3. 由RF又说到了决策树,问了前剪枝和后剪枝:后剪枝那部分答得一般,因为平时基本都用控制参数,后剪枝不太熟练
4. 问了Python,不是让写代码,就是简单说说dict、list还有tuple这些
5. 接着问了点实际业务问题:估计客户终身价值(CLV)、产品设计(还是A/B test场景)、如何估算中国新闻市场总容量(case类问题)、估算下月月活(建模预测,问了怎么选特征)等等
 
三面-2018.05  约40分钟
面之前HR告诉我这是技术面,面试官是leader。事实上面试官确实是leader,但是......
1. 自我介绍+数据分析项目经历:还是同一个项目,对面依旧不感兴趣.....所以我反应过来一个问题,项目介绍还是得选些和面试官经历比较贴近的说
2. 接着问产品了,平时用什么产品、体验之类的:说了知乎和抖音
3. 开始着重问知乎,和百度有什么区别(......)、有没有观察过版本更新等等:这些问题至少聊了15分钟,以我的一句“我平时确实用得比较少”而告终。聊到这感觉基本凉了,也丝毫没看出这是个数据分析岗面试
4. 最后开始问代码了,Python写了个Z-score转化函数(当然是不许调包的)、SQL问了什么忘了就是GROUP BY一下就好了,两个问题都非常简单
5. 到了我问的环节:1) 这个岗位做什么?主要偏产品,岗位就在产品类下,基本要求面试者有一定产品基础;2) 上海的数据分析岗和北京有不同吗?没有,上海的分析师就要辅助上海这些产品了,比如新收购的musical.ly
应该过了这面就能见HR了,不过挂了
 
 
拼多多-数据分析师(三面offer)
投简历的时间有点奇怪,大概是6月份左右,HR本来想给算18批,后来面试之后说加入19批吧,因为入职时间太晚了。面了两轮技术、一轮HR,技术面很重视SQL,另外项目经历会挖得比较深,会问技术问题,基本没碰到应用场景问题。
笔试
5道SQL题,有难度,不过给了两个小时,时间很充分
 
一面-2018.06  约20+60(写代码)分钟
微信远程面试,不知道是面试官话比较少,还是对我的背景实在没什么兴趣,大概也就说了20分钟,剩下的时间都写代码了
1. 项目经历:这次吸取之前面试头条的教训,准备说一个电商场景的项目,但面试官点名问了其他一个咨询项目。不过后来也问了电商项目了,相当于介绍了两个数据分析项目经历
2. 因为写了用过Pyspark,所以问了数据倾斜。确实是答不出来,因为我都是直接写rdd***作,环境都搭建好的。对面表示理解,估计也没算减分项。
3. 写SQL,题目我觉得挺难的,比笔试难一些,一个是根据用户浏览页面的数据计算页面转化率,另一个是查找二度好友
4. 问了面试官:公司数据分析都得用Spark和Hive吗?说基本是的
 
二面-2018.06  约60分钟
 
大概一周之后给二面消息,聊了挺久的,整个面试基本都是围绕着一个数据挖掘项目展开的
1. 项目经历:自己说了Kaggle的项目,后来面试官又简单问了电商项目
2. 具体讨论kaggle比赛,提特征、预处理、选特征、调参基本都问了
3. 这几年大家都用xgb吧,这个lgb比xgb厉害在哪? 我也说不太好,主流问法不是xgb比GBDT改进在哪么..(捂脸)。就诚实的回答速度快,但我不太理解为什么。能说清楚的区别是leaf-wise的生长策略和cat feature的处理
4. SQL题,比一面简单,根据商品交易记录找商品销量的中位数,然后对于销量超过中位数的商品找出超过中位数的时间点。就给10分钟时间,没写完就打断了,简单看一下思路继续问别的
5. 面试官又问回kaggle比赛了,还有时间你会做哪些改进?说了点提其他特征的想法,又说了点ensemble的东西
问了点职业规划,说说数据分析和数据挖掘的区别。和面试官聊得比较投缘,最后也寻求了一些数据分析师成长路径的建议
 
三面(HR)-2018.06  约25分钟
 
面试的HR就是一直和我联系的HR,其实对她的印象一直都非常好,问题都回复的比较及时,而且交流态度也非常友善。
就是简单交流下个人情况:期待工作地点、期待薪资、最早入职时间、理想工作状态和职业规划。HR也给介绍了公司福利状况,问问对公司比较特殊的工作时间(11am-9pm)能不能接受,等等。
好像也就是面试的后一天,告诉我面试没问题,但是毕业时间太晚了,所以跟着19批一起处理。感觉HR挺nice的,整个招聘流程都是和她联系的,效率很高。
 
携程-大数据分析工程师(两面offer)
秋招第一面~内推后一个星期左右,收到HR邮件约去总部现场面试,内推是免笔的。机票BG,两面,没有HR面。之前看这个岗位面经都很偏建模,也是按偏挖掘的方向准备的,但今天去了问的十分偏业务分析
 
面试前
携程楼太多了真不好找,建议提前一会去,进楼后填了个超长超长的表。面试之前和HR在等候室聊了一会,吐槽了一下春招过笔试之后,没安排远程面试的惨剧,HR尴尬地说推荐选onsite呀,远程也影响互相了解。之后,HR看了我简历,说一会应该来个技术的,让我稍等会
 
一面-[b]2018.08.10 约40分钟[/b]
 
但是,进来了个商业产品数据分析团队的负责人。。
1. 自我介绍
2. 项目经历:对面先问我觉得自己的项目里觉得最有价值的是哪一个,我说了kaggle的比赛,然后详细介绍了一下
3. 对方表示说的可以,成绩也还可以,但是。。。我不做挖掘,所以我们今天不聊挖掘,她比较关注我的航班查询项目(。。我一直感觉是个水项目,没怎么准备)
4. 说一下用户分群和RFM模型 (简历里写了,做过电商分群)
5. 业务场景:机票的成交转化率下降了,怎么分析。这个问得很细,一步一步模拟场景的,互动很多,聊了10分钟
6. 还是业务场景:航班公司觉得自己的某个航线经营状况不好,怎么利用我们的数据帮助他们找原因,还是说了10多分钟
7. 最后说我应该问一个SQL,但是不问了。首先觉得你应该会写,再者说不会写也比较容易学,结束了
8. Q&A:你们使什么工具啊?SQL最多,Python和R需要会一个,偏向R因为大老板用R
 
二面-[b]2018.08.10 约40分钟[/b]
休息一会,又进来一位,这位应该是机票BG数据类的负责人了,自己主要带一个算法团队,兼负责BG所有数据业务
1. 看了简历,问问为什么投携程?说了数据量大,也是数据导向公司(从校招专门设立数据类岗看出)
2. 携程在搜索引擎买了30000个关键词,后来没钱想砍到剩3000,怎么删?不太会,还是从投入收益比分析的,因为这个东西不是投入越高rank越高,也不是rank越高收益越明显
3. 衍生问题:1块广告赚100,和1W广告赚10W,咋选?一脸懵逼。。。瞎答吧:把1块的升一点看看,涨幅是不是1:100的比例,如果收缩趋势明显就还是1W赚10W吧
4. 问个SQL,其实非常简单:写了个window function,但是对面说不可以用window function,那我写个子查询吧。。。
5. 基本不问了,开始聊携程的战略愿景。说说现在公司的战略规划,数据团队在其中的作用,数据分析团队和算法挖掘的配合这些;顺便也说了携程技术的问题,说至少机票这个团队的技术能力是没有问题。有宣传自己团队的成分,这个有兴趣的同学私聊吧,有些不适合公开
6. 本来想问机器学习,但是看项目应该是懂机器学习的,而且你面的团队机器学习是加成不是刚需,所以又结束了。
最后,走之前被HR说了一句预期薪资有点高。。。
 
 
银联-数据挖掘风险方向(二面挂)
 
内推提前批笔试没过,正式批再次刮彩票,中奖!上海现场面试。
笔试
内推和正式批笔试内容差不多:数学+逻辑+英文+金融+专业题,题目特别杂,专业题可以说出的十分没水平。整体来说比较无聊的笔试。
 一面-[b]2018.09.21 约40分钟[/b]
群面,这大概是我见过最蠢的方式了23333。题目:人工智能是否会造成大幅度失业,提出3条建议。
感觉选人也是生成随机数吧,反正除了固定陈述外,我就再也没说过完整的一句话了。
但是我过了,可能人家觉得我沉稳?
 
二面-[b]2018.09.21 约20分钟[/b]
专业面,感觉大多数同学都是聊项目的,少部分技术岗也能聊到战略23333嗯,理解不了。20分钟时间不长,但信息量不小,整体氛围十分欢乐。
1. 自我介绍
2. Q:你以前学管理的吗?咋做技术?A:我们学管理的也会啊,该学的也都学呢,编程、高数线代概率统计运筹,啥的都学啊!!!
Q:真的?A:是啊,再说这研究生不是转专业了么。。
2. Q:聊聊数据挖掘,缺失值、极端值咋处理?A:缺失值xxxxx,极端值嘛,我一般都用tree-based。。
3. Q:聊下学校的咨询项目,你看你简历这是不是写错了,要不然你这建模不合逻辑啊?A:哦哦对,这个标点符号用得有歧义,实质上改下你就好理解了
Q:感觉你这非监督学习,整得跟监督似的?A:对呗,客户法律行业的,不太懂,我也觉得不科学,但就这样吧
4. Q:说说kaggle,模型融合是啥意思啊?A:就是xxxxxxxxxxx
Q:怎么感觉是为了打比赛才用啊,平常谁用这?A:(卧槽,老哥你很有眼光啊)
5. Q:GBDT和随机森林区别?A:RFxxxxx,GBDTxxxxx
6. Q:会写SQL吗?A:你问吧
Q:问啥你都能写出来?A:那前提是,你别故意难为我啊。。。
7. Q:你怎么看银联,给offer来的概率大不?A:银联好啊,加班少啊!来啊!
8. Q:你还有啥问我的?
我Q:你们数据挖掘啥应用场景?对面A:反欺诈
我Q:这面完了还有没?对面A:没了,等消息吧,1、2天(hhh我不信)
我Q:最后一个问题,你是东北人吗?对面A:不是。。。。
全程欢乐,银联面试整体水,这个大家基本达到共识了。但至少对面的面试官,平时的工作确实很数据挖掘,看得出来比较懂、也比较熟练。
 
 
 
红书-数据分析师(二面挂)
[b]笔试 [/b]
 
 
笔试很简单也很良心,填空+选择+简答,和数据分析内容非常相关,半小时的题量。
一面-[b]2018.09.23 约20分钟[/b]
自我介绍,再分别聊了我做的两个项目。之后问了一个开放题,P2P金融产品,发现用户数下降了怎么分析。
二面-[b]2018.09.23 约40分钟[/b]
校招参加过多次面试了,最不爽的一次,面试官真是一杠到底。。
自我介绍完了,先出了两个SQL题,都比较简单,第一个类似pivot table,join就能写,case when也能写;第二个找前十,一个rank函数就解决了。
之后是两个场景题,一个销售额下降分析,一个DAU下降分析。
然后,亮点来了,这里看吧。。https://www.nowcoder.com/discuss/116607
体验相当糟糕的一场面试。我很理解公司的岗位是一个业务类岗位,全程也都没有主动提自己的数据挖掘项目。另外,我简历上也有业务类项目,你大可以聊这些,这两个数据挖掘项目有那么刺眼么。。
不想争论数据分析究竟多少技术成分、多少业务成分,单是这种对自己不熟悉领域的排斥性,就十分反感。
网易(考拉)-数据分析师(二面挂)
 
提前批邮箱事业部笔试挂,又是秉着在哪跌倒在哪爬起的原则再投,不过长了心眼换成考拉23333,这次笔试过了。
杭州现场面试,应该是个专场,排队叫号那种。感觉是纯粹的业务方向数据分析,两面挂了,但是面试体验不错。
笔试
提前批基本都是排列组合和概率统计问题,附带了一道SQL和一道业务;正式批的选择题加了几道机器学习,主观题类型差不多没变。
一面-[b]2018.09.26 约20分钟[/b]
1. 自我介绍+项目介绍:问了两个数据挖掘项目,面试官都想细挖了一下,特征重要性、模型怎么用的、结果怎么样。不过感觉面试官其实并不是很懂
2. 是否了解考拉,考拉做什么业务
3. 问了句市场、品类和物流,哪个比较感兴趣?答了市场,所以问了个市场的业务场景:如果考拉在好声音投放广告如何复盘投放效果
4. Q&A:数据分析团队怎么构建?答市场方向、商品类目方向,就和刚才问得差不多,没有技术方向。工具?Excel SQL。
二面-[b]2018.09.26 约40分钟[/b]
1. 自我介绍+两个项目:一个数据挖掘,一个用户分群,也都问得非常细。即使数据挖掘项目也是挖业务方面的问题,可见确实是个业务类数分团队。
2. 业务问题:考拉的竞品有哪些,如何做竞品分析?提了天猫、京东的海淘业务,还有小红书。
3. 你做数据分析有什么优势?如何用生活例子证明你数据敏感。
4. 业务问题:销售量下降如何分析?
5. 为什么出国,又为什么回国?我始终觉得觉得这对归国留学生还是蛮敏感的,不过面试官确实没有challenge的意思。我不觉得我的回答逻辑有什么问题,但能看出面试官并不太满意。大概她还是觉得我的学时有点短,怎么说呢,我也不会期待别人都认可我的观点。
6. Q&A:讨论下如何发展和提升,我问了挺久的,面试官也解答的十分耐心,感觉有收获,给面试官点个赞!
感觉聊得不错,出来也挺有信心的,然而过了大概10分钟,发现凉了。哎,气得我一把抓走了他们四个蛋糕!不过面试体验不错,网易面试官很有素质。
 
招行信用卡 - IT类数据挖掘(一面挂)
笔试
 
招行卡的题很数据挖掘,基本都是考数据挖掘的常规步骤操作和机器学习算法,大题都是简单,不涉及编程。一面-[b]2018.10.12 约30分钟[/b]
 
第一次遇见二对一的面试,两位面试官应该都30岁以上了,非常有素质,进出门都是起立接送,交流也很愉快
1. 自我介绍,说了10秒钟就示意我直接说项目吧,可能时间有点赶紧2. 接着项目问了预处理,特征筛选和缺失值填补怎么做?问得比较细。
3. GBDT和XGBOOST的区别?很经典的问题了。你为什么喜欢LGB胜过XGB?速度快,方便迭代
4. 会不会深度学习?不会,我懂神经网络,但我不觉得我做的可以叫深度学习
5. Kaggle是什么水平的比赛?说实话这个问题我还是蛮惊讶的,做数据挖掘即使不玩kaggle,名字应该还是听过的
6. 本科完全不相关,机器学习怎么起步的?这里还是不能虚,把看过的中英文各种书和网课往上一拍,并且说大三就开始关注了。
7. 职业规划大概怎么样?说了对技术的忠诚,最起码8~10年再考虑业务或管理的可行性
8. 地点和行业?上海,互联网或金融。追问了有互联网offer了吧,我们也发你怎么比?这里其实答得有点不好,没有明显跪舔,有点后悔。
9. 有工行实习简历里为什么不写?因为我不觉得那实习对我有啥意义。。
10. Q&A:业务场景?跟项目走,有时候纯金融,有时候也有产品项目
主要工作?两部分,做数据挖掘项目是肯定的,其实还负责开发框架,类似于傻瓜应用,让公司所有人都能轻松做数据挖掘。
总结一下,招行卡的两位面试官很有素质,功底可以肯定,绝不是国企混日子的。但我觉得交谈中也可以看出面试官也不是典型的奋斗派,应该是努力工作,回家休息的类型吧。
感觉劳逸结合的很好,对志趣相近的同学是个好去处!

0 个评论

要回复文章请先登录注册