首页文章详情

大厂面经：Uber数据科学岗

魏柳杨

2022-07-13 14:08:38

人浏览

美好向往，11实现月度精彩...

了解详情

一站式留学评测留学快人一步

了解详情

申请顶尖院校必备！教你如何提...

了解详情

第二外语选什么小语种吃香？

了解详情

Uber Data Scientist的面试流程是什么样的？针对常见现场面试题目，面试者又应该如何回答？

Uber数据科学岗招聘流程

一位曾经面试过Uber数据科学家的网友分享了他所经历的招聘流程，供大家进行参考：

（1）收到招聘人员的电子邮件

应聘者投递简历两周之内，会收到招聘人员的电子邮件。 邮件内会提供一份非常详细的文件 ，其中包括具体的面试时间表以及其他有用的面试资源。

（2）两次视频面试

两次视频面试时长都在45分钟左右，并且大致流程相同。 首先面试官会介绍他自己，接下来面试者进行自我介绍。

第一次视频面试包括两个部分： 案例研究和编码

案例研究： 案例研究包括一个类似于UberEats的相关开放式问题。面试官和应聘者讨论了问题的各个方面，比如理解目标、收集数据、进行探索性数据分析、扩展系统、问题的重要KPI、底层机器学习解决方案、部署解决方案，以及将其集成到现有系统中。 本案例研究的目的是评估面试者处理大规模机器学习问题的方法。

编码： 第二部分 包括一个通过CoeSignal的媒体编码问题 。面试者可以选择他喜欢的语言进行作答。面试官在解释问题时非常清楚。面试者需要在给定的时间内以最佳方式解决这个问题。

第二次视频面试同样分为两个部分： 机器学习基础和有关机器学习的案例研究

机器学习基础： 面试者回答了 一些与机器学习相关的基础到中级问题 ，如反向传播、机器学习图像、集成方法、消失梯度、精度与回忆、偏差-方差权衡等。

机器学习案例研究： 与第一次面试类似，讨论了一个与UberEats相关的开放式案例研究， 但是这个案例研究要复杂得多，而且更加面向机器学习和统计学 。

面试者被要求为一个相关的基于产品的问题设计一个基于机器学习的解决方案。面试官在每一步都提出了相关的详细问题。

讨论从简单的逻辑回归模型开始，到稍微复杂的支持向量机和决策树，最后甚至到复杂的机器学习图像模型。同时面试过程中还讨论了可用数据集的重要特征，以及如何使用它们来解决问题。

（3）现场面试

现场采访包括6轮，总时间为5-6小时，有两次15分钟的休息时间。

下图是总体面试流程的概括：

Uber现场面试题目分类

根据所问问题的性质，这六轮面试的问题大致可以分为以下几类：

（1）设计问题

这次面试包括一个与设计一家在线杂货店有关的开放式案例研究。

面试者需要完成数据收集、探索性数据分析、特征选择、特征转换、机器学习模型选择、模型培训以及选择正确的KPI来分析绩效等过程。

这一轮更注重整体的思路和逻辑，面试官感兴趣的是面试者对问题的高层次理解，而不是有关算法的技术细节。

（2）编码

编码面试的重点是面试者对统计学的理解，与LeetCoe类型问题有一些不同，因此面试者 在准备面试时不仅仅需要掌握LeetCoe类型的问题，还需要准备有关统计学的知识。 同时，在问完一个编码类问题后，面试官大概率还会接着这个问题继续问下去。

（3）科研

面试的这一部分仅包括面试者之前的科研经验。如果是博士，面试官会让面试者解释其具体的博士研究项目，并提出后续问题。 面试者需要能够详细解释项目的目标、过程中遇到的困难以及最终的产出。

（4）行为问题

根据面试者的过往研究、实习、工作等经历，面试官还会问一些行为问题。 这些问题围绕着面试者的领导才能、时间管理能力、与同事打交道的能力，以及解决冲突的能力等方面展开。

（5）机器学习/统计

这个主题是 关于Uber产品的开放式讨论 。面试官将从一个案例研究出发，考察面试者将如何利用机器学习知识解决这个问题。

在整个面试过程中，涉及到各种机器学习基本概念、机器学习图像模型、嵌入、损失函数等问题。

（6）案例研究

这与设计问题和机器学习/统计相似，但所涉及的的Uber产品不同。面试官感兴趣的是 面试者为给定问题设计解决方案的高层次理解 ，以及当范围扩展到更大的数据集时，面试者将如何设计解决方案。

常见面试真题参考答案及解析

挑选部分Uber经典面试真题进行解析，答案仅供参考。

大家要记得 举一反三 ，掌握了正确且高效的数据分析思路和方法论，在面试其他公司同类岗位时也能游刃有余。

▪️原题：Describe linear regression to a chil, to a first-year college stuent, an to a seasone mathematician.

这道题与普通的要求解释线性回归的题不一样，这里提到了三个不同的受众：儿童，大一新生，经验丰富的数学家。 针对这三种不同的情况，我们所需要使用的语言也非常不同。

对儿童来说， 最好的方法是举生活中的例子 ，并且尽量不要用数学语言；对于大一新生来说，因为他们已经掌握了部分数学知识，所以可以结合一些数学语言进行解释；对于经验丰富的数学家来说，问题就变成了：如何用尽可能专业的说法进行解释。

这道题考查的不仅是面试者对于线性回归的理解，还考查了面试者如何能够学以致用，而不是单纯地自己理解。

给儿童解释：

可以问儿童一个简单的问题，比如“你如何确定你朋友/亲戚的家与你家的距离？”

为了得到这个答案，我们可以通过知道“他的朋友/亲戚来拜访他多少次”来回答这个问题：

如果一个朋友一周来看他四次，他可能就住在附近；

如果一个朋友每周来看他两次，他可能住得离他家不远；

如果一个朋友每周/两周来看他一次，他可能住得很远……在得到这些信息之后，我们可以把这些数据进一步细分。比如，距离1,2个街区远；3.4个街区远一点，5.6个街区远一点。

一旦我们确定这一点之后，我们可以利用距离和拜访次数之间的关系预测其他朋友与他家的距离，这样一来，我们就成功地用简化的线性关系解释了最佳拟合线的概念。

给大学新生解释：

线性回归模型是用一条直线描述因变量与自变量之间的关系的模型，该直线由方程Y=a+b×X定义，其中a是直线的Y交点，b是直线的斜率。其中x叫做自变量或explanatory variable，Y是因变量，response variable。

给数学家解释： 在统计学中，线性回归（Linear Regression）是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。其表达形式为y = w'x+e，e为误差服从均值为0的正态分布。

回归分析中，只包括一个自变量和一个因变量，且二者的关系可用一条直线近似表示，这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量，且因变量和自变量之间是线性关系，则称为多元线性回归分析。

▪️原题：What is marketing attribution？

归因模型（Marketing Attribution）是营销中非常重要的模型，是移动数据分析的关键组成部分。归因建模是广告主用来判断不同渠道营销价值的方法。

归因建模会针对预先设置的广告交互行为评估一个或多个发行商的价值，以此来帮助广告商判断哪些渠道在营销推广中起到了最大的推动作用。

如果没有归因模型，广告商就无法获知流量的来源、数量和渠道，更无法知道应该为此支付多少费用以及长期来看这些投入是否会获得回报。有了归因模型，广告商就可以适当地为不同渠道的用户分配功劳（和责任）。

以下介绍几种常见的归因模型：

- 最初触点归因： 这种模型会将广告交互的功劳归因至用户与推广的首次接触。

- 最终触点归因： 这种模型会将广告交互的功劳归因至用户与推广的最后一次接触。

- 多触点归因： 这种模型会将广告交互的功劳按不同权重分配给多个流量来源，因此，当一位用户与推广活动交互时，多个渠道会从中受益。

- 展示归因： 这种模型会将安装归因至特定广告展示，将推广活动带来的价值归功给不直接带来安装，但在转化路径上起重要作用的广告。

开启美国留学之旅立即咨询

快速评估适合你的专业&院校

获取验证码

意向国家及地区

立即评估

我已阅读并同意

《隐私保护协议》

美国留学实用指南

大厂面经：Uber数据科学岗

快速评估适合你的专业&院校

更多留学话题

更多推荐内容

美国留学实用指南

热门内容

北美留学

英爱留学

大洋洲留学

亚洲留学

日韩留学

欧洲留学

关于金吉列

关注金吉列

大厂面经：Uber数据科学岗

（1）收到招聘人员的电子邮件

快速评估适合你的专业&院校

更多留学话题

更多推荐内容

美国留学实用指南

热门内容

推荐产品

北美留学

英爱留学

大洋洲留学

亚洲留学

日韩留学

欧洲留学

关于金吉列

关注金吉列