清华大神告诉你:时下最流行的数据分析师,到底都需要哪些技能?
发布时间:2018-05-10 15:53:56 | 浏览次数:

很多想进入数据分析领域的小白,一直不太了解到底掌握哪些技能,才能拿到一份正式工作?

先说结论:首先需要深入了解各类公司对数据分析岗位的实际需求,判断自己感兴趣的岗位所需要的“最小技能树”,然后选择适合自己的学习方式和路径,是从零开始快速入行的首选方法。

有些“数据过来人”都建议新人学习数据分析先去点亮很多技能树,什么 Excel/统计学/SQL/R/Python/Hadoop/机器学习/可视化 等等,对此我并不是非常认同,原因很简单:题主学习数据分析的目的在于“找工作”,核心在于“快速入行”,而不在于“系统学习”,因此一开始学习这么多领域的知识是不太合适的。

接下来,要分步解答这个问题,第一步先要“逆向思考”:我想进什么样的公司?在我心目中,数据分析师的日常工作状态应该是怎样的?

这个问题非常重要,甚至比学什么更重要,因为同样 title 为“数据分析师”的职位,工作内容可能大相径庭:有的类似于“商业咨询师”,有的类似于“数据仓库工程师”,有的类似于“机器学习工程师”,也有的类似于“数据口径核对师”(笑~)——这些同样名为“数据分析师”的岗位,不仅工作内容完全不同,需要的技能树也完全不一样。如果不弄清它们各自所需的技能树,就去“盲人摸象”般地学习各类知识,到头来找工作时看到岗位需求的时候,很可能会傻眼。

举个例子:在一些大型的互联网公司(如阿里、腾讯等)里,有一个岗位叫“商业数据分析师”,听起来挺高大上的,不过如果我告诉你,做这个岗位的很多人不需要懂统计学,不需要懂 Python,更不需要懂什么机器学习,只需要会 SQL 并且有“业务sense”就可以了,你是不是会感到惊讶和疑惑呢?但事实就是如此。

必须要说的是,不是所有的“数据分析师”都需要用到高大上的工具,因为大部分数据分析师的核心目标是“解决问题”(而解决问题所用的方法则未必重要),而解决问题的核心往往是“懂业务”,这是很多公司在招聘时强调“业务sense”的重要原因。如果觉得会很多技能就很厉害,那是典型的“学生思维”。

( P.S. 也许你又有一个疑问,对于刚入行的人来说,所谓的“业务sense”如何判断呢?或者说,面试的时候,面试官如何判断一个初级的应聘者是否有业务sense?通过我的观察,对国内互联网大公司而言,主要是四个方向:
学校和专业背景(偏数理的理工科或经济类为佳)是否有竞争力;
是否有相关的实习经历;
描述自己经历时和回答问题时的逻辑性和框架性;
对当前互联网时事新闻的见解是否有趣而独到。)

回到上一个问题,假如我现在已经有心仪的公司了,我该如何判断这个公司的工作内容,更进一步地,判断自己需要掌握哪些技能?别着急,且听我一一拆解。

一个简单的方法是直接去应聘网站看JD(岗位描述),但这个方法并不是特别通用。在我看来,不妨从 公司类型、公司规模、公司业务、公司阶段、公司风格 这五个维度来判断“数据分析”岗位所需要的技能。如下图所示:



1、公司类型

在不同类型的公司里,数据分析师的工作是完全不同的:对于传统公司而言,数据分析师更接近于“业务分析师”,他们不需要处理太多的原始数据,更多地需要将已有的数据整合和分析,从而支持业务发展,对于这类公司来说,统计学是重要的,而 Excel/R/Tableau 等处理数据的工具也是有必要学习的。但对于很多互联网公司而言,数据分析师可能需要处理更多原始数据,所以SQL/Python/Java 等数据清洗的工具显得更重要一些。

2、公司规模

小公司和大公司的“数据分析师”做的事情“广度”有明显差别。对于大公司而言,业务分工比较明确“数据分析师”是一系列不同的岗位:

离原始数据最近、离业务最远是 数据仓库工程师(它有很多别名,如:数据工程师/数据融合工程师/ETL工程师等等),他们的工作主要是把技术从用户和商户这里提取的行为数据进行清洗和预处理,使其结构化,是更接近于技术的岗位,相对来说,工作会比较单纯一些。

距离原始数据较远、离业务较近的是 商业数据分析师(又称:Business Intelligence,BI),他们的工作是提取正确的业务数据,并制作报表和具有洞见的分析。这类岗位可能需要处理很多繁杂的数据口径、需要会 SQL,根据公司的报表体系需要会 Tableau/Excel,但更重要的是能给业务方有效的输入。也正因为这个岗位链接了数据和业务,所以需要非常强的“协同能力”。

距离原始数据和业务都不近不远的数据岗位主要是 数据挖掘工程师 (也有一些分支,如:算法工程师、机器学习工程师等等),这些岗位往往不需要接触最原始的数据,也不会在业务的最前线,但通常需要给业务提供一些间接的能力,比如判断能力(如:两个用户的关系是否为同学)、预测能力(如:预测会产生业务风险用户)、识别能力(如:判断一张图片是否为猫)等等。这类工作本身比较独立,很有创造性,但要求也比较高。

但对于小而精的公司而言,“数据分析师”的岗位分工可能就不那么明确了。因为人手有限,公司不能为每一个工作职能制定对应的岗位,所以希望能招一个“全栈数据分析师”(更酷的说法是:“数据科学家”)。从数据提取到展现结果的每一个环节,“全栈数据分析师”都需要十分清楚,所以综合能力比较强的员工才能胜任。

3、公司业务

公司业务对“数据分析师”岗位的工作内容有不小的影响:在垂直的或者说业务比较集中的公司中,数据的来源以及类型相对比较少,我们在数据预处理上不需要太多的精力,更注重数据的使用和多维度展现,挖掘有价值的信息,这个岗位是比较有探索性的,更接近于“数据挖掘工程师”。

但在业务繁杂的公司里,“数据分析师”的地位比较微妙。业务繁杂意味着变动比较快,这使得一般意义上的“数据分析师”往往无法长时间地做相同的业务(一直对接同一业务的分析师我们一般叫做“行业运营”。不要觉得运营岗位不够高大上,事实上优秀的运营也很擅长数据分析,对公司的价值很大),所以快速产出数据的能力就变得尤为重要了。此外,在这种情况下,我们需要优质的数据体系,更进一步地,需要“数据产品”。像 Tableau 就是非常优秀的数据产品,很多大型的公司也会去设计自己的数据产品,以满足业务的需要。有了做数据产品的需求,我们就多了两类新的职位,一个叫“数据开发工程师”,一个叫“数据产品设计师”。

4、公司阶段

公司所处的阶段会影响“数据分析”工作的方向:对于初创公司来说,整个数据体系尚未建立,关于数据通常是要啥没啥,在这个时候,你就别指望能使用模型去做什么高大上的分析了。配合技术去找到正确的数据才是你的首要任务。这个工作看起来枯燥,但却异常重要,如果你能做好,很快就会有机会成为公司最不可或缺的员工之一——毕竟,对于公司所有的数据,你是唯一的出口。

而对于成熟公司来说,底层数据体系已经搭建得很完善了,对于初级员工来说,你根本不需要修改啥。想要的数据,基本只要有耐心,都能搞得到,但在口径的寻找上,可能会非常费时费力,清洗数据需要花费你很长的时间。不过,汇总完一大批数据,不就可以上高大上模型了吗?算法、机器学习什么的,都可以用上,你可以尽情地在数据的海洋中遨游。

5、公司风格

最后说说公司风格。和数据分析师相关的公司风格有两类,一类是“数据驱动”,一类是“业务驱动”。对于“数据驱动”的公司来说,我们会先看足够多的数据,再从数据中找到有意思的点,然后进行分析来决定未来要做什么业务;对于“业务驱动”的公司来说,我们先决定要做什么业务,然后再决定要什么数据。

这种风格上的差别会使得数据分析师的地位产生巨大差别。在“数据驱动”的公司里,数据分析师的地位很高,因为公司的 KPI 是由你来决定的。而在“业务驱动”的公司里,呵呵,如果没有优秀的领导者带领,数据分析师一不留神就会沦为“取数机器”。

一个不太好的消息是,如今在国内,数据驱动的公司少之又少,尤其在一些大公司里,虽然它们自称是“数据驱动”的,但事实上,数据分析师常常被业务牵着鼻子走,位于附属的地位。
所以,在真正工作之前,如果有机会的话,还是建议先实习,避免遇到坑。

最后谈到入门学习,学习的方式各式各样,看书、网上课程、线下课程,根据自己的懒惰程度去选择。先打好基础,再针对自己想要去的公司和岗位学一些进阶课程。那么,只要学历背景不算太差,那么凭自己精心打造的“技能树”成长路线,到大部分公司胜任绝大多数数据分析师初级岗位应该是没有问题的。

当然,无论是学习什么课程,完整地学一遍下来都不是一件轻松的事。但毕竟是职业选择,慎重一些、认真一些,多花一些精力甚至是金钱,也绝对是值得的。

作者:曾加 Plus,清华大学工程物理本硕,曾担任商业数据分析师,目前在蚂蚁金服做芝麻信用算法,知乎名:曾加 公众号:PlusZeng
 
 上一篇:想从事大数据吗?先了解一下大数据工程师的职业规划
 下一篇:财务人员的最高境界:看看顶尖CFO什么样


第一职场网 © 版权所有  Copy@career001.com,all rights reserved.  鲁ICP备2020037168号     技术支持:创世网络

冀公网安备 13018102000147号