笨鸟学数据分析:认识数据分析

近两年,随着大数据的热潮,数据分析火了,其实,数据分析是一种通用的能力,指的是我们在做决策的时候,不能光拍脑门,要拿出数据说话,运营、市场、业务负责人等,要依据数据来制定策略。
数据分析师火热的原因主要有以下三点。
1、随着业务数据的不断增加,需要一个单独的人去跟数据打交道,所以越来越多的公司将数据分析师作为一个独立的岗位来招聘。
2、大数据的火热带动了跟数据有关的岗位,比如数据分析师、大数据开发工程师、大数据运维等。
3、人工智能的崛起,也带动了数据分析的发展,传统的数据分析用Excel、SPSS等统计学工具来分析数据,这种分析具有局限性,对于更多的问题,用机器学习来处理会更加的有效。
按照所用的工具来划分,数据分析师可以分为两种。
第一种,偏业务型的数据分析师,主要工具是Excel、SPSS、Tableau等。这类数据分析师的主要工具是Excel,Excel可以搞定绝大多数业务分析问题,当然如果涉及Excel无法实现的统计学方法,可能要借助于SPSS来计算。
第二种,偏技术型的数据分析师,也叫数据挖掘工程师,这是一种比较有技术含量的工种,需要掌握常见的数据挖掘算法,其实就是机器学习算法,例如逻辑回归、支持向量机(SVM)、随机森林、梯度提升回归树等,一般金融公司、电力行业等,都需要数据挖掘工程师。
公司有大有小,每个公司的情况不同,所以在第一种数据分析师中,又有一些细小的分类。
比如,有些数据分析师自嘲“表哥”或者“表姐”,因为平时的主要工作仅限于处理数据及绘制图表,因为公司的数据分析需求就是日报、周报及月报等,这种职位基本都是处理数据,涉及的分析也只是看下业务指标的变化趋势等。
还有一些主要和数据库打交道,俗称“取数工程师”,因为数据存储于数据库中,数据分析前,需要从数据库中提取数据,当然,对于一些公司来说,开发人员会做一个后台,我们可以直接通过后台的功能去导出数据。
岗位描述有待补充。
我们了解数据分析职位后,那如何入门数据分析呢?
对于第一种,偏业务型的数据分析师来说,主要需要掌握Excel、SQL
、Tableau、PowerBI或者FineBI等,统计学及SPSS等。
对于第二种,偏技术的数据分析师来说,主要需要掌握一些常见的数据挖掘算法(机器学习算法),例如逻辑回归、支持向量机、随机森林、梯度提升回归树、关联分析等。

大数据

目前,大数据越来越多地应用在企业中,各种技术层出不穷,Hadoop技术较为典型,当然,Hadoop生态圈涉及很多技术,会有专门的大数据开发工程师来负责。作为数据分析师需要学会跟大数据平台打交道,大数据平台采用HDFS文件系统,为了使不懂大数据技术的人员能够跟大数据平台打交道,大数据生态圈中出现了一个组件,Hive。
Hive是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据:可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能;可以将SQL语句转换为MapReduce任务运行,通过自己的SQL查询分析需要的内容,这套SQL简称Hive SQL,使不熟悉mapreduce的用户可以很方便地利用SQL语言查询、汇总和分析数据。

罗马不是一天建成的

数据分析师跟其他任何一个行业一样,都需要积累,才能拿到一个不错的薪水。
对于一个数据分析师来说,除了技术之外,还需要有一定的业务积累,因为数据分析是为了服务于业务,只有更好地了解业务,才能用数据分析创造出更大的价值,从而拿到比较好的报酬。
不要做一个投机主义者,如果自己有数据敏感度,或者对于数据分析这个领域比较感兴趣,可以考虑做数据分析师,如果只是为了高薪,那我劝你尽早放弃,因为跟数据打交道其实是枯燥乏味的,不能从中找到乐趣,可能也无法坚持下去。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注